§inh §oµn Long mang mét b¶n sao duy nhÊt. Thuéc tÝnh nµy gióp cho c¸c tÕ bµo biÕn n¹p vµ dßng tÕ bµo do chóng sinh ra (do ph©n chia trùc ph©n) chØ mang mét vect¬ ADN t¸i tæ hîp duy nhÊt vµ gióp c¸c nhµ nghiªn cøu cã thÓ ph©n lËp vµ tinh s¹ch ®−îc dÔ dµng c¸c gen hoÆc s¶n phÈm cña c¸c gen mét c¸ch riªng rÏ tõ hçn hîp biÕn n¹p vèn chøa nhiÒu ®o¹n tr×nh tù ADN kh¸c nhau. 11.2.6.4. ThiÕt lËp ng©n hµng hÖ gen vµ th− viÖn cADN Víi c¸c hÖ gen nhá, chiÕn l−îc nh©n dßng th−êng t−¬ng ®èi ®¬n gi¶n. Ch¼ng h¹n nh− hÖ gen virut cã kÝch th−íc kho¶ng 10 kb, ng−êi ta cã thÓ trùc tiÕp tinh s¹ch ADN, c¾t chóng b»ng enzym giíi h¹n råi tiÕn hµnh ®iÖn di. C¸c ph©n ®o¹n ADN ph©n t¸ch trªn gel ®iÖn di ®−îc th«i khái gel, tinh s¹ch råi cµi vµo vect¬ nh©n dßng. Tuy nhiªn, víi c¸c hÖ gen lín, nh− hÖ gen ng−êi, viÖc c¾t ADN tæng sè b»ng enzym giíi h¹n råi ph©n t¸ch b»ng ®iÖn di chØ dÉn ®Õn sù h×nh thµnh mét d¶i b¨ng ®iÖn di dµi liªn tôc däc b¶n gel (c¸c b¨ng kh«ng ph©n t¸ch) v× sè ®o¹n c¾t qu¸ lín vµ chóng lµ mét chuçi c¸c ®o¹n ADN chØ kh¸c nhau vµi nucleotide. Trong chiÕn l−îc nh©n dßng nh÷ng hÖ gen lín nh− vËy, ng−êi ta cµi toµn bé c¸c ®o¹n ADN cña hÖ gen (sau khi ®· c¾t b»ng enzym giíi h¹n) vµo vect¬ nh©n dßng råi biÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ (ë ®ã vect¬ cã kh¶ n¨ng tù sao chÐp) mµ kh«ng qua ®iÖn di. TËp hîp c¸c dßng tÕ bµo mang vect¬ t¸i tæ hîp chøa c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen nh− vËy ®−îc gäi lµ ng©n hµng hÖ gen. §Ó thiÕt lËp ng©n hµng hÖ gen, ADN tæng sè cña tÕ bµo ®Ých (vÝ dô: tõ ng−êi) ®−îc c¾t b»ng enzym giíi h¹n ®Ó t¹o nªn c¸c ®o¹n cã kÝch th−íc trung b×nh dao ®éng tõ 100 bp ®Õn 1 Mb. C¸c ®o¹n ADN sau ®ã ®−îc cµi vµo vect¬ phï hîp nhê ADN ligase. KÕt qu¶ cña b−íc nµy lµ t¹o ra mét tËp hîp cña c¸c vect¬ mang c¸c ®o¹n ADN cµi kh¸c nhau. Ng©n hµng hÖ gen ®−îc t¹o ra nhê sö dông enzym giíi h¹n vµ c¸c vect¬ nh©n dßng cã øng dông râ rÖt nhÊt lµ nh»m gi¶i tr×nh tù c¸c hÖ gen lín. Dù ¸n gi¶i m· hÖ gen ng−êi (hoµn thµnh vµo n¨m 2006 võa qua) còng ®−îc thùc hiÖn theo chiÕn l−îc nµy. Tuy nhiªn, c¸c ®o¹n cµi ADN trong c¸c dßng tÕ bµo thuéc ng©n hµng hÖ gen cña eukaryote th−êng kh«ng ph¶i lµ c¸c ®o¹n tr×nh tù m· hãa, bëi v× chóng ®−îc c¾t ngÉu nhiªn bëi c¸c enzym giíi h¹n trong khi phÇn lín hÖ gen lµ c¸c tr×nh tù kh«ng m· hãa. ThÕ nªn, ®Ó t¹o ra c¸c dßng tÕ bµo mang c¸c ®o¹n ADN cµi t−¬ng øng víi c¸c tr×nh tù m· hãa protein, ng−êi ta thiÕt lËp mét d¹ng ng©n hµng hÖ gen kh¸c gäi lµ th− viÖn cADN. §Ó thiÕt lËp th− viÖn cADN, trong b−íc ®Çu tiªn thay v× b¾t ®Çu tõ ADN, ng−êi ta tiÕn hµnh phiªn m· ng−îc mARN thµnh cADN. §¸ng l−u ý lµ cADN t−¬ng øng ®óng víi tr×nh tù m· hãa cña protein (ngoµi mét sè tr×nh tù xu«i dßng vµ ng−îc dßng tham gia vµo qu¸ tr×nh dÞch m·). Ph¶n øng phiªn m· ng−îc ®−îc thùc hiÖn nhê reverse transcriptase. Enzym nµy cã kh¶ n¨ng tæng hîp ADN dùa trªn m¹ch khu«n lµ ARN. Khi cã mÆt reverse transcriptase, mARN ®−îc phiªn m· ng−îc thµnh c¸c ph©n tö ADN sîi kÐp; nh÷ng ph©n tö nµy sau ®ã ®−îc g¾n vµo c¸c vect¬ råi biÕn n¹p vµo c¸c tÕ bµo chñ lµm nhiÖm vô nh©n dßng. Víi tr×nh tù xuÊt ph¸t lµ mARN, cã thÓ nhËn thÊy, kh¸c víi ng©n hµng hÖ gen, mét c¬ thÓ sinh vËt cã thÓ cho ra nhiÒu th− viÖn cADN kh¸c nhau, bëi v× mçi m« trong c¬ thÓ ph¶n ¸nh mét tËp hîp c¸c gen ®−îc biÓu hiÖn kh¸c nhau nªn sÏ cã mét tËp hîp c¸c mARN kh¸c nhau (trong khi ng©n hµng hÖ gen dï ®−îc t¹o ra tõ lo¹i m« hoÆc tÕ bµo nµo cña cïng mét c¬ thÓ ®Òu gièng nhau). B¶ng 11.1 nªu mét sè ®Æc ®iÓm kh¸c biÖt c¬ b¶n gi÷a “ng©n hµng hÖ gen” vµ “th− viÖn cADN”. MÆc dï, trong gi¸o tr×nh nµy, cã sù ph©n biÖt khi dïng thuËt ng÷ “ng©n hµng” vµ “th− viÖn”; trong ®ã “ng©n hµng” chØ tËp hîp ®Çy ®ñ tr×nh tù ADN cña mét hÖ gen, cßn “th− viÖn” chØ ®¹i diÖn cho c¸c tr×nh tù ADN m· hãa cho c¸c protein ®−îc biÓu hiÖn t¹i mét m« nhÊt ®Þnh. Nh−ng, trong thùc tÕ hai thuËt ng÷ nµy ®«i khi ®−îc dïng ®ång 334
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen nghÜa, thÕ nªn “ng©n hµng hÖ gen” cã khi ®−îc gäi lµ “th− viÖn hÖ gen” vµ ng−îc l¹i. ThuËt ng÷ “ng©n hµng gen” ®−îc dïng chung ®Ó chØ c¶ hai lo¹i “ng©n hµng hÖ gen” vµ “th− viÖn cADN”. Còng gièng nh− c¸c tÕ bµo trong ng©n hµng hÖ gen, mçi tÕ bµo biÕn n¹p trong th− viÖn cADN th−êng chØ mang duy nhÊt mét vect¬ chøa ®o¹n ADN cµi. V× vËy, sau khi c¸c tÕ bµo nh©n lªn, chóng sÏ t¹o ra nhiÒu dßng tÕ bµo, mçi dßng chøa b¶n sao cña mét cADN m· hãa t−¬ng øng cho mét protein. ViÖc cÇn lµm sau khi ®· x©y dùng ®−îc ng©n hµng hÖ gen vµ th− viÖn cADN lµ x¸c ®Þnh dßng tÕ bµo nµo mang ®o¹n ADN ®−îc quan t©m nghiªn cøu. B¶ng 11.1. Mét sè ®Æc ®iÓm kh¸c biÖt gi÷a ng©n hµng hÖ gen vµ th− viÖn cADN Ng©n hµng hÖ gen 1. Cã mÆt ®Çy ®ñ tÊt c¶ c¸c tr×nh tù ADN trong tÕ bµo. 2. C¸c ®o¹n ADN cã tr×nh tù nucleotide gièng hÖ gen cña tÕ bµo trong tù nhiªn, gåm c¶ c¸c tr×nh tù ADN kh«ng m· hãa cña hÖ gen (vÝ dô: c¸c ®o¹n tr×nh tù liªn gen, ADN ®Öm, intron). 3. ë eukaryote, ngoµi c¸c tr×nh tù m· hãa, phÇn lín c¸c tr×nh tù ADN trong ng©n hµng lµ c¸c tr×nh tù kh«ng m· hãa, gåm nhiÒu ®o¹n tr×nh tù lÆp l¹i, c¸c tr×nh tù liªn gen, c¸c tr×nh tù ®iÒu hßa ho¹t ®«ng gen, ... 4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi nhiÒu. Th− viÖn cADN 1. ChØ lµ tËp hîp mét phÇn c¸c tr×nh tù ADN cña hÖ gen. 2. cADN ph¶n ¸nh tr×nh tù b¶n phiªn m· mARN hoµn thiÖn cña gen, kh«ng ph¶i lµ tr×nh tù ADN ®Çy ®ñ cña gen trªn NST. 3. C¸c protein ®−îc m· hãa bëi cADN cã thÓ ®−îc tæng hîp (dÞch m·) trong mét tÕ bµo chñ mµ ë ®ã kh«ng cÇn cã bé m¸y hoµn thiÖn ph©n tö mARN (bëi c¸c intron ®· ®−îc c¾t bá). 4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi Ýt. 11.2.6.5. Sö dông mÉu dß ®Ó x¸c ®Þnh c¸c dßng tÕ bµo trong ng©n hµng gen §Ó x¸c ®Þnh dßng tÕ bµo nµo trong ng©n hµng gen mang ®o¹n ADN ®−îc quan t©m nghiªn cøu (vÝ dô ë ®©y lµ ng©n hµng sö dông vect¬ plasmid), ng−êi ta tiÕn hµnh lai mÉu dß (nguyªn t¾c ®−îc nªu ë môc 11.2.5) víi c¸c khuÈn l¹c cña c¸c dßng vi khuÈn tõ ng©n hµng gen. Kü thuËt nµy ®−îc gäi lµ ph−¬ng ph¸p lai khuÈn l¹c. Mét th− viÖn cADN ®iÓn h×nh chøa Ýt nhÊt hµng ngµn dßng vi khuÈn kh¸c nhau, mçi dßng mang mét ®o¹n cµi cADN ®Æc tr−ng. Sau khi vect¬ ®−îc biÕn n¹p vµo vi khuÈn, c¸c tÕ bµo vi khuÈn ®−îc cÊy trªn bÒ mÆt m«i tr−êng chøa agar. Mçi tÕ bµo sau ®ã sÏ ph¸t triÓn thµnh mét khuÈn l¹c riªng rÏ. C¸c tÕ bµo trong cïng mét khuÈn l¹c ®Òu mang cïng lo¹i vect¬ vµ ®o¹n gen cµi gièng nhau. Trong kü thuËt lai khuÈn l¹c, ng−êi ta cã thÓ dïng mµng lai gièng nh− trong c¸c ph−¬ng ph¸p lai Southern ®Ó thu håi mét l−îng “vÕt” ADN trùc tiÕp tõ khuÈn l¹c, nh−ng ®ñ cho sù kÕt cÆp víi mÉu dß. Cô thÓ, ng−êi ta dïng mµng lai Ðp lªn bÒ mÆt m«i tr−êng nu«i cÊy chøa khuÈn l¹c vµ “in h×nh” chóng lªn mµng lai (cïng víi ADN cña chóng) theo kiÓu “®ãng dÊu”. Khi kÕt qu¶ lai mÉu dß/khuÈn l¹c cho kÕt qu¶ “d−¬ng tÝnh”, sÏ x¸c ®Þnh ®−îc vÞ trÝ khuÈn l¹c mang dßng tÕ bµo chøa ®o¹n ADN (gen) cµi mong muèn. Mµng lai ®−îc ®em lai víi mÉu dß nh− sau: ng−êi ta tiÕn hµnh xö lý mµng lai sao cho mµng tÕ bµo vì ra vµ c¸c ph©n tö ADN tho¸t ra ngoµi vµ g¾n lªn mµng lai t¹i chÝnh vÞ trÝ tÕ bµo cña chóng. C¸c mµng lai sau ®ã ®−îc ñ víi c¸c mÉu dß ®−îc ®¸nh dÊu tõ tr−íc trong c¸c ®iÒu kiÖn gièng nh− khi tiÕn hµnh c¸c kü thuËt lai Northern hay Southern. §Ó x©y dùng ng©n hµng gen, ngoµi c¸c vect¬ plasmid cã nguån gèc vi khuÈn, ng−êi ta cßn dïng nhiÒu lo¹i vect¬ kh¸c cã nguån gèc virut (phag¬), hoÆc tõ c¸c sinh vËt bËc cao h¬n nh− NST nh©n t¹o cña nÊm men (YAC), hoÆc c¸c d¹ng vect¬ lai nh− phagemid, 335
§inh §oµn Long cosmid, NST nh©n t¹o vi khuÈn (BAC), v.v ... Trong c¸c vect¬ virut, c¸c vect¬ cã nguån gèc phag¬ λ lµ phæ biÕn h¬n c¶. ADN hÖ gen cña virut nµy ®−îc lo¹i bá c¸c phÇn g©y ®éc vµ th−êng ®−îc dïng nh− vect¬ nh©n dßng. Nguyªn t¾c sö dông vect¬ nµy ®Ó nh©n dßng trong c¸c th− viÖn hÖ gen gièng nh− vect¬ plasmid. ChØ cã mét ®iÓm kh¸c lµ khi tiÕn hµnh lai víi mÉu dß ®Ó x¸c ®Þnh c¸c dßng gen biÕn n¹p th× vÞ trÝ c¸c mÉu dß ®−îc x¸c ®Þnh trªn mµng lai t−¬ng øng víi vÞ trÝ c¸c vÕt tan thay cho vÞ trÝ c¸c khuÈn l¹c nh− khi dïng vect¬ plasmid. 11.2.7. Tæng hîp hãa häc vµ sö dông c¸c ®o¹n oligonucleotide C¸c ®o¹n ADN ng¾n cã tr×nh tù x¸c ®Þnh Nhãm khãa ®−îc dïng nhiÒu trong c¸c nghiªn cøu kh¸c ®Çu C5’-OH nhau cña di truyÒn häc ph©n tö, ch¼ng h¹n nh− Nucleotide tiÕp Deoxyribose dïng lµm mÉu dß trong c¸c ph−¬ng ph¸p lai, theo nèi vµo ®©y dïng lµm måi trong c¸c ph¶n øng PCR vµ gi¶i tr×nh tù ADN. C¸c ®o¹n tr×nh tù nµy th−êng ®−îc tæng hîp hãa häc (phæ biÕn b»ng m¸y tæng Phosphoamidite hîp ADN tù ®éng) vµ ®−îc gäi lµ c¸c ®o¹n oligonucleotide. TiÒn chÊt ®Ó t¹o nªn c¸c Nhãm diisopropylamino nucleotide lÇn l−ît g¾n vµo chuçi oligonucleotide H×nh 11.7. Phosphoamidine lµ tiÒn chÊt lµ c¸c phosphoamidine (h×nh 11.7). Ph¶n øng tæng hîp hãa häc c¸c oligonucleotide. kÐo dµi chuçi oligonucleotide diÔn ra b»ng viÖc Nhãm DMT (dimethoxytrityl) cã vai trß khãa g¾n thªm nucleotide míi vµo ®Çu 5’ (tøc lµ chiÒu ®Çu C5'-OH vµ chØ ph¶n øng víi nhãm 3’ → 5’) cña ®o¹n oligonucleotide cã s½n, nh− phosphoamidite theo chiÒu 3' → 5'. vËy ng−îc chiÒu víi ph¶n øng kÐo dµi chuçi a) Tæng hîp ADN hoµn b) Tæng hîp tõng phÇn råi ADN ®−îc thùc hiÖn bëi enzym ADN chØnh trªn c¶ 2 m¹ch tæng hîp b»ng ADN pol polymerase. Tæng hîp c¸c Tæng hîp c¸c Ph−¬ng ph¸p tæng hîp hãa häc cã hiÖu oligonucleotide oligonucleotide qu¶ vµ ®é tin cËy cao khi tæng hîp c¸c ®o¹n ADN ng¾n, m¹ch ®¬n cã ®é dµi tíi 30 B¾t cÆp gi÷a c¸c B¾t cÆp gi÷a c¸c nucleotide. §Ó tæng hîp c¸c ®o¹n ADN b»ng ®o¹n oligonucleotide ®o¹n oligonucleotide m¸y tæng hîp tù ®éng, c¸c nhµ nghiªn cøu chØ cÇn “nhËp” vµo phÇn mÒm tr×nh tù nucleotide Nèi bëi ADN ligase C¸c ®o¹n rçng ®−îc cÇn tæng hîp vµ m¸y sÏ tù ®éng tæng hîp tõ c¸c tæng hîp bëi ADN pol tiÒn chÊt ®−îc chuÈn bÞ s½n. Tuy nhiªn, khi ph©n tö ADN ®−îc tæng hîp cã kÝch th−íc lín §o¹n tæng hîp bëi ADN pol th× ®é chÝnh x¸c cña tr×nh tù vµ ®é ®ång ®Òu Nèi bëi ADN ligase cña s¶n phÈm gi¶m ®i do c¸c h¹n chÕ mang tÝnh kü thuËt. Thùc tÕ, c¸c ph©n tö ADN cã tr×nh tù dµi trªn 100 nucleotide khã cã thÓ tæng H×nh 11.8. Hai ph−¬ng ph¸p tæng hîp hãa häc c¸c ®o¹n ADN dµi (hoÆc gen ®Çy ®ñ). hîp chÝnh x¸c b»ng m¸y tæng hîp tù ®éng. Tuy vËy, b»ng c¸ch kÕt hîp mét sè kü thuËt, c¸c ®o¹n ADN (thËm chÝ gen ®Çy ®ñ) cã chiÒu dµi h¬n 100 nucleotide còng cã thÓ tæng hîp b»ng ph−¬ng ph¸p hãa häc. Cô thÓ, tr−íc tiªn ng−êi ta ph¶i tæng hîp c¸c ®o¹n ADN ng¾n, m¹ch ®¬n cã tr×nh tù gèi lªn nhau; sau ®ã tinh s¹ch råi nèi c¸c ®o¹n ADN víi nhau (h×nh 11.8). ViÖc nèi c¸c ®o¹n ADN cã thÓ thùc hiÖn theo hai c¸ch. Trong c¸ch thø nhÊt, c¸c ®o¹n ADN riªng rÏ chøa tr×nh tù ®Çy ®ñ cña ph©n tö ADN cÇn tæng hîp, chØ thiÕu liªn kÕt phosphodiester g¾n kÕt c¸c ®o¹n víi nhau. Lóc nµy, enzym ADN ligase ®−îc dïng ®Ó nèi c¸c ®o¹n víi nhau (h×nh 336
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen 11.8a). Trong c¸ch thø hai, c¸c ®o¹n ADN ®−îc tæng hîp chØ chiÕm mét phÇn tr×nh tù cña mçi m¹ch ADN cÇn tæng hîp. Khi c¸c ®o¹n ADN ®−îc cho b¾t cÆp víi nhau, trªn mçi m¹ch cßn tån t¹i nhiÒu ®o¹n tr×nh tù “trèng”. Lóc nµy, ADN pol I ®−îc dïng ®Ó lÊp kÝn c¸c ®o¹n “trèng” tr−íc khi ADN ligase nèi c¸c ®o¹n ADN víi nhau ®Ó t¹o nªn ph©n tö ADN cã tr×nh tù ®Çy ®ñ (h×nh 11.8b). Trong qu¸ tr×nh tæng hîp ADN nh− vËy, còng cã thÓ kÕt hîp c¸c tr×nh tù ®iÒu hßa cña gen víi c¸c tr×nh tù m· hãa. Ngoµi ra, còng cã thÓ bæ sung vÞ trÝ c¾t cña c¸c enzym giíi h¹n ë vïng biªn cña tr×nh tù m· hãa, ®Ó sau ®ã cã thÓ cµi c¸c ®o¹n ADN nµy vµo c¸c vect¬ nh©n dßng hay vect¬ biÓu hiÖn. C¸c ®o¹n ADN ®−îc tæng hîp hãa häc ngoµi c¸c øng dông lµm mÉu dß hoÆc lµm måi cho ph¶n øng PCR vµ gi¶i tr×nh tù, cßn cã thÓ ®−îc dïng cho c¸c nghiªn cøu kh¸c. Ch¼ng h¹n, cã thÓ tæng hîp c¸c ®o¹n ADN mang mét (hoÆc mét sè) nucleotide biÕn ®æi so víi tr×nh tù ADN cña gen ®· biÕt, vµ dïng ®o¹n ADN nµy trong ph−¬ng ph¸p g©y ®ét biÕn ®Þnh vÞ trÝ. Trong ph−¬ng ph¸p nµy, ®o¹n ADN tæng hîp mang nucleotide biÕn ®æi ®−îc dïng lµm måi ®Ó nh©n ®o¹n gen ®Ých b»ng ph¶n øng PCR. V× trong ph©n tö ADN sîi kÐp h×nh thµnh cã mét (hoÆc mét sè) vÞ trÝ kÕt cÆp sai, nªn s¶n phÈm PCR h×nh thµnh lµ c¸c ®o¹n ADN cã tr×nh tù gen mang nucleotide biÕn ®æi ë vÞ trÝ x¸c ®Þnh. C¸c ®o¹n oligonucleotide còng cã thÓ ®−îc dïng theo c¸ch t−¬ng tù ®Ó t¹o nªn mét ®iÓm giíi h¹n míi trªn ph©n tö ADN, ®Ó råi sau ®ã ®iÓm giíi h¹n nµy ®−îc dïng ®Ó cµi gen ®Ých vµo ®óng vÞ trÝ cÇn thiÕt, vÝ dô: sau promoter hay sau vÞ trÝ g¾n cña ribosome, v.v… 11.2.8. Ph¶n øng PCR Ngoµi kü thuËt nh©n dßng gen sö dông c¸c tÕ ADN khu«n 3’ bµo (in vivo), mét ph−¬ng ph¸p nh©n dßng gen Måi ng−îc 5’ invitro ®¬n gi¶n, hiÖu qu¶ ®−îc sö dông phæ biÕn hiÖn nay ë hÇu hÕt c¸c phßng thÝ nghiÖm di truyÒn 5’ häc vµ sinh häc ph©n tö lµ ph¶n øng chuçi trïng 3’ §o¹n ADN hîp - PCR (polymerase chain reaction). Kü thuËt PCR dïng ADN polymerase ®Ó tæng hîp ph©n tö Måi xu«i ADN míi tõ tr×nh tù cña ph©n tö ADN lµm khu«n víi tiÒn chÊt lµ c¸c dNTP. Nh− ®· nªu ë ch−¬ng 3, Ph¶n øng PCR c¸c ADN polymerase tæng hîp ADN theo chiÒu 5’→ 3’ vµ cã thÓ xóc t¸c g¾n nucleotide vµo ®Çu 3’ cña mét §o¹n ADN ®Ých ®o¹n oligonucleotide cã s½n. ThÕ nªn, nÕu ta ®· cã ®o¹n oligonucleotide g¾n vµo mét m¹ch ADN lµm §o¹n ADN ®Ých khu«n, th× ADN polymerase cã thÓ dïng ®o¹n ®ã nh− måi ®Ó xóc t¸c ph¶n øng kÐo dµi chuçi ADN vÒ §o¹n ADN ®Ých phÝa ®Çu 3’ cho ®Õn hÕt tr×nh tù m¹ch khu«n. NhiÒu b¶n sao ®o¹n ADN ®Ých H×nh 11.9. Nh©n dßng ADN b»ng PCR. C©u hái ®Æt ra lµ: b»ng c¸ch nµo cã thÓ dïng ph¶n øng PCR ®Ó nh©n dßng mét ®o¹n tr×nh tù ADN ®Æc hiÖu? Lóc nµy, ng−êi ta sÏ tæng hîp vµ sö dông hai ®o¹n oligonuleotide cã vÞ trÝ liªn kÕt chÆn ë hai ®Çu cña ®o¹n ADN cÇn nh©n dßng. §o¹n oligonucleotide thø nhÊt cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch m· hãa, ®−îc gäi lµ måi xu«i; ®o¹n thø hai cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch ®èi m·, ®−îc gäi lµ måi ng−îc (h×nh 11.9). Ph©n tö ADN lµm khu«n ®−îc g©y biÕn tÝnh bëi nhiÖt, t¹o ®iÒu kiÖn cho c¸c måi xu«i vµ måi ng−îc ®Ýnh kÕt vµo c¸c vÞ trÝ ë hai ®Çu ®o¹n ADN cÇn nh©n dßng. Víi sù cã mÆt cña c¸c tiÒn chÊt lµ dNTP, ADN polymerase sÏ nh©n dßng ®o¹n tr×nh tù ADN ®−îc giíi h¹n bëi hai ®o¹n måi. 337
§inh §oµn Long Trong ph¶n øng PCR, ph©n tö ADN ®−îc g©y biÕn tÝnh vµ sù tæng hîp ADN diÔn ra lÆp l¹i qua nhiÒu chu kú nhê kh¶ n¨ng ®iÒu nhiÖt cña m¸y. KÕt qu¶ lµ: sau mçi chu kú ®iÒu nhiÖt, sè ph©n tö ADN l¹i t¨ng gÊp ®«i. §©y lµ mét ph¶n øng cã ®é nh¹y cao. ChØ cÇn mét vµi b¶n sao ADN cã trong mÉu nghiªn cøu, chóng ta cã thÓ thu ®−îc hµng tØ b¶n sao sau kho¶ng trªn d−íi 30 chu kú ph¶n øng (sè b¶n sao ADN = 2n víi n lµ sè chu kú ph¶n øng). 11.2.9. Gi¶i tr×nh tù ADN Baz¬ Baz¬ Trong phÇn nµy chóng ta sÏ xem b»ng c¸ch nµo cã thÓ x¸c ®Þnh ®−îc tr×nh tù nucleotide cña c¸c ®o¹n ADN ng¾n hoÆc toµn bé ph©n tö ADN dµi. H×nh 11.10. CÊu tróc cña dNTP (tr¸i) vµ ddNTP (ph¶i). Nguyªn t¾c cña hÇu hÕt c¸c ph−¬ng ph¸p gi¶i tr×nh tù ADN hiÖn nay ®Òu dùa trªn ph−¬ng ph¸p ®−îc Sanger vµ céng sù c«ng bè n¨m 1977, ®−îc gäi lµ ph−¬ng ph¸p dideoxyribonucleotide (gäi t¾t lµ ph−¬ng ph¸p dideoxy). Nguyªn t¾c cña ph−¬ng ph¸p dideoxy dùa trªn viÖc bæ sung c¸c dÉn xuÊt t−¬ng øng cña c¸c dNTP lµ 2’,3’- dideoxynucleotide (viÕt t¾t lµ ddNTP, h×nh 11.10) vµo thµnh phÇn ph¶n øng tæng hîp ADN trong èng nghiÖm. Do ddNTP thiÕu nhãm C3’-OH, nªn mét khi nã ®−îc g¾n vµo m¹ch ADN ®ang tæng hîp, th× qu¸ tr×nh tæng hîp ADN sÏ dõng l¹i. Trong ph−¬ng ph¸p Sanger, sù sao chÐp ADN ®−îc b¾t ®Çu b»ng viÖc g¾n mét ®o¹n oligonucleotide cã tr×nh tù bæ sung víi tr×nh tù ADN cÇn gi¶i m· råi ñ chóng cïng víi enzym ADN pol. Ph©n tö ADN tæng hîp míi sÏ cã tr×nh tù bæ sung víi m¹ch ADN lµm khu«n. C¸c ph¶n øng gi¶i m· tr×nh tù ®−îc chia lµm bèn èng nghiÖm t¸ch biÖt. Mçi èng ®−îc bæ sung mét hçn hîp gåm ChiÒu ®iÖn di 4 lo¹i dNTP th«ng th−êng (vèn cÇn cho sù tæng hîp m¹ch ADN míi); mét trong nh÷ng lo¹i dNTP nµy ®−îc ®¸nh dÊu phãng x¹ ®Ó ph¸t hiÖn m¹ch míi ®ang tæng hîp. Ngoµi ra, tõng lo¹i trong 4 lo¹i ddNTP (ddATP, ddGTP, ddCTP vµ ddTTP) sÏ ®−îc bæ sung lÇn l−ît t−¬ng øng vµo mçi èng nghiÖm nªu trªn víi nång ®é b»ng 1/10 so víi nång ®é lo¹i dNTP H×nh 11.11. Gi¶i tr×nh tù ADN nhê sö dông ddNTP. t−¬ng øng. Víi thµnh phÇn ph¶n øng nh− Sù sao chÐp ADN sÏ kÕt thóc khi ddNTP ®−îc kÕt vËy, trong phÇn lín tr−êng hîp, dNTP sÏ liªn hîp vµo chuçi. Tr×nh tù m¹ch ADN míi tæng hîp kÕt vµo m¹ch ADN ®ang tæng hîp, nh−ng ®−îc ®äc theo chiÒu 5’ → 3’ t−¬ng øng tõ ®¸y lªn ®Ønh cña b¶n ®iÖn di. 338
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen ddNTP (ë nång ®é thÊp) còng sÏ liªn kÕt vµo mét sè m¹ch ADN ®ang tæng hîp vµ lµm kÕt thóc qu¸ tr×nh sao chÐp. Do cã nhiÒu ph©n tö ADN ®−îc tæng hîp ®ång thêi nªn qu¸ tr×nh nµy dÉn ®Õn sù h×nh thµnh cña mét hçn hîp nhiÒu ph©n tö ADN ®−îc sao chÐp kh«ng hoµn chØnh gièng nhau ë ®Çu 5’ ®−îc ®¸nh dÊu vµ kh¸c nhau ë ®Çu 3’ vÒ chiÒu dµi vµ lo¹i nucleotide kÕt thóc chuçi (h×nh 11.11). C¸c s¶n phÈm nµy sau ®ã ®−îc ph©n t¸ch trªn gel polyacrylamide vµ ®äc tr×nh tù theo thø tù c¸c b¨ng xuÊt hiÖn trªn b¶n ®iÖn di theo chiÒu tõ cùc d−¬ng sang cùc ©m. §· cã nhiÒu c¶i tiÕn ®−îc ®−a ra nh»m n©ng cao hiÖu qu¶ cña ph−¬ng ph¸p dideoxy kÓ tõ khi Sanger c«ng bè. Trong ph−¬ng ph¸p cña Sanger, enzym ADN pol I cña E. coli ®−îc dïng lµm enzym sao chÐp. Sau ®ã, nã ®−îc thay b»ng ADN pol cã nguån gèc tõ phag¬ T7 cã hiÖu qu¶ sao chÐp c¸c ADN m¹ch dµi tèt h¬n. Ngµy nay, phÇn lín viÖc gi¶i tr×nh tù ADN ®Òu dùa trªn ph−¬ng ph¸p dideoxy kÕt hîp víi ph¶n øng PCR sö dông c¸c enzym chÞu nhiÖt, nh− Taq ADN pol, hoÆc −u viÖt h¬n lµ enzym cã tªn th−¬ng m¹i lµ “sequenase”. §©y lµ enzym t¸i tæ hîp cã nguån gèc tõ ADN pol cña phag¬ T7. Enzym nµy cã hiÖu qu¶ sao chÐp tèt c¸c m¹ch ADN dµi, cã tÝnh chÞu nhiÖt, cã ho¹t tÝnh ®äc söa vµ cã thÓ l¾p r¸p c¸c lo¹i nucleotide c¶i biÕn (ngoµi 4 lo¹i nucleotide c¬ b¶n) vµo m¹ch ADN ®ang tæng hîp. ViÖc kÕt hîp víi ph−¬ng ph¸p PCR cho phÐp gi¶i tr×nh tù ADN tõ mét l−îng rÊt nhá ADN sîi kÐp, ®ång thêi còng cho phÐp gi¶i tr×nh tù trùc tiÕp mét sè hÖ gen kÝch th−íc nhá, nh− virut vµ vi RE ChÊt nhËn dRhodamine khuÈn. Trong khi ®ã, viÖc gi¶i tr×nh tù a) hÖ gen c¸c sinh vËt bËc cao (cã kÝch th−íc hÖ gen lín) cÇn ph¶i qua b−íc nh©n dßng hoÆc sö dông c¸c ng©n hµng gen. ChÊt ph¸t quang 11.2.9.1. Gi¶i tr×nh tù ADN tù ®éng §o¹n nèi Kü thuËt gi¶i tr×nh tù ®−îc Sanger b)C−êng ®é ph¸t quang m« t¶ cã thÓ x¸c ®Þnh chÝnh x¸c tr×nh tù nucleotide cña mét ®o¹n ADN dµi tíi B−íc sãng (nm) 300 bp. Tuy nhiªn, ph−¬ng ph¸p nµy H×nh 11.12. Thuèc nhuém g¾n víi ddNTP ®−îc dïng cÇn nhiÒu thao t¸c kü thuËt. Cô thÓ, cho gi¶i tr×nh tù ADN. a) CÊu tróc hãa häc cña chÊt kÕt nhiÒu b−íc pipet chÝnh x¸c ph¶i ®−îc thóc chuçi BigDyeTM. Trong ®ã, c¸c ddNTP kÕt thóc chuçi thùc hiÖn ®ång thêi míi cho kÕt qu¶ tèt; kh¸c nhau cã thuéc tÝnh ph¸t quang kh¸c nhau phô thuéc mçi mÉu ph©n tÝch ph¶i ®ång thêi ch¹y vµo c¸c gèc R. b) Phæ ph¸t quang cña 4 gèc BigDyeTM trªn 4 lµn ®iÖn di kh¸c nhau. Ngoµi ra, g¾n vµo 4 lo¹i ddNTP lµ kh¸c nhau. viÖc ®äc kÕt qu¶ ®iÖn di b»ng m¾t ®«i khi vÉn cã sai sãt. HiÖn nay, ®Ó cã thÓ gi¶i tr×nh tù ADN c¸c hÖ gen lín (nh− ë ng−êi, ~3,2x109 bp) ®Òu dùa vµo ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng. Ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng kÕt hîp ®ång thêi 4 ph¶n øng ®éc lËp 339
§inh §oµn Long vµo mét ph¶n øng chung. Trong ®iÒu kiÖn nh− vËy, viÖc dïng c¸c nucleotide ®−îc ®¸nh dÊu phãng x¹ (g¾n vµo ®Çu 5’ cña m¹ch ADN tæng hîp míi) lµ kh«ng phï hîp v× c¸c ®o¹n ADN míi tæng hîp chØ kh¸c nhau mét nucleotide nªn khã ph©n t¸ch b»ng ®iÖn di th«ng th−êng. Tuy nhiªn, trë ng¹i nµy cã thÓ ®−îc kh¾c phôc nÕu nh− ®Çu 3’ cña c¸c ®o¹n ADN tæng hîp míi ®−îc “®¸nh dÊu” vµ “ph¸t tÝn hiÖu”. §Ó lµm ®iÒu ®ã, ng−êi ta dïng mét bé c¸c ddNTP ®−îc g¾n chÊt ph¸t quang (Glazer vµ Mathies, 1997). C¸c ddNTP lóc nµy vÉn cã thÓ liªn kÕt vµo m¹ch ADN ®ang kÐo dµi vµ lµm ngõng ph¶n øng sao chÐp. CÊu tróc phÇn ph¸t quang cña ddNTP gåm mét “gèc ph¸t quang” liªn kÕt víi mét trong bèn gèc dichlororhodamine (viÕt t¾t lµ dRhodamine, lµ chÊt nhËn n¨ng l−îng quang) kh¸c nhau qua mét ®o¹n nèi (h×nh 11.12). Bèn gèc dRhodamine khi bÞ “gèc ph¸t quang” kÝch thÝch (bëi nguån s¸ng laser th−êng tõ Argon) nhËn n¨ng l−îng råi ph¸t quang ë c¸c b−íc sãng kh¸c nhau. Nhê vËy, mçi mét lo¹i ddNTP khi ®−îc kÝch thÝch bëi nguån s¸ng Argon cña m¸y gi¶i tr×nh tù sÏ ph¸t ra “tÝn hiÖu” kh¸c nhau. Th«ng tin nµy ®−îc mét c¶m biÕn tÝn hiÖu kÕt hîp víi m¸y tÝnh xö lý vµ tù ®éng chuyÓn thµnh tr×nh tù ADN (h×nh 11.13). C¸c ddNTP ®−îc g¾n chÊt ph¸t quang theo nguyªn lý nªu trªn ®−îc gäi lµ c¸c yÕu tè kÕt thóc chuçi BigDyeTM. Gi¶i tr×nh tù tù ®éng cã nhiÒu −u ®iÓm h¬n so víi ph−¬ng ph¸p thñ c«ng cña Sanger. ¦u ®iÓm lín nhÊt lµ kh¶ n¨ng tù ®éng hãa phÇn lín c¸c b−íc cña qu¸ tr×nh a) ph©n tÝch. NhiÒu b−íc cña ph¶n øng gi¶i Måi ®Ó gi¶i tr×nh tù tr×nh tù cã thÓ thùc hiÖn b»ng r«bèt, kÓ tõ viÖc pipet mÉu ®Õn ph¶n øng PCR. C¸c s¶n phÈm sau ®ã ®−îc tinh s¹ch vµ Tr×nh tù thu ®−îc cho ch¹y qua c¸c cét ®iÖn di mao qu¶n mµ kh«ng cÇn bÊt cø mét thao t¸c trùc tiÕp nµo cña con ng−êi. Tèc ®é ®äc vµ møc ®é chÝnh x¸c cña ph−¬ng ph¸p tù ®éng rÊt cao, ®Æc biÖt ®èi víi c¸c ®o¹n ADN dµi tõ 30 ®Õn d−íi 1000 bp (®é chÝnh x¸c cao nhÊt lµ ®èi víi c¸c ®o¹n cã tr×nh tù trªn d−íi 600 bp). Mét hÖ thèng gi¶i tr×nh tù ADN hiÖn nay trung b×nh cã ChuyÓn thµnh tr×nh thÓ ®äc ®−îc 1 - 2 triÖu bp trong mét tù m¹ch m· hãa ngµy víi ®é chÝnh x¸c 99%. Ngoµi ra, ph−¬ng ph¸p nµy cã ®é nh¹y cao mµ ViÕt l¹i theo kh«ng cÇn ph¶i sö dông c¸c chÊt phãng chiÒu 5’ →3’ x¹. Tuy nhiªn, còng ph¶i nãi r»ng kü thuËt gi¶i tr×nh tù ADN tù ®éng kh«ng b) ph¶i lóc nµo còng cho kÕt qu¶ ph©n tÝch hoµn toµn chÝnh x¸c. Mét sè h¹n chÕ cña ph−¬ng ph¸p nµy gåm cã: nã kh«ng ®äc ®−îc c¸c tr×nh tù qu¸ ng¾n (d−íi 30 bp, bëi v× hiÖu suÊt PCR cña c¸c ph©n ®o¹n ADN nµy thÊp, b¶n th©n chóng kÐm bÒn vµ ph¸t tÝn hiÖu yÕu); sai sè ®äc t¨ng lªn H×nh 11.13. Gi¶i tr×nh tù ADN tù ®éng. a) Sö dông måi khi gi¶i tr×nh tù c¸c ®o¹n ADN trªn 1000 ®Ó tæng hîp ADN. Qu¸ tr×nh nµy kÕt thóc b»ng ddNTP ph¸t bp; ngoµi ra, c¸c ®o¹n ADN mang nhiÒu quang. Chuçi c¸c pic t¸ch biÖt cho biÕt tr×nh tù ADN. b) Phæ tr×nh tù ®−îc gi¶i m· b»ng m¸y ABI Prism377. 340
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen tr×nh tù lÆp kÕ tiÕp cã xu h−íng bÞ “nÐn” l¹i khi ch¹y qua cét chøa gel (l¾p trong m¸y), dÉn ®Õn hiÖn t−îng c¸c pic ë c¸c vïng tr×nh tù lÆp l¹i cã xu h−íng lång vµo nhau (kh«ng ph©n t¸ch) nªn khã x¸c ®Þnh tr×nh tù chÝnh x¸c. C¸c tr×nh tù nµy th−êng cÇn ®−îc kiÓm tra l¹i b»ng c¸c ph−¬ng ph¸p thñ c«ng. Trong thùc tÕ, nh÷ng ®o¹n ADN cuèi cïng ®−îc gi¶i tr×nh tù trong dù ¸n hÖ gen ng−êi (hoµn thµnh n¨m 2006) lµ c¸c ®o¹n ADN cã møc ®é lÆp l¹i lín thuéc NST sè 1. 11.2.9.2. Gi¶i tr×nh tù toµn hÖ gen Nh− nªu ë trªn, viÖc gi¶i tr×nh tù c¸c ®o¹n ADN ng¾n hiÖn nay cã thÓ thùc hiÖn ®−îc t−¬ng ®èi dÔ dµng nhê m¸y gi¶i tr×nh tù tù ®éng. Tuy vËy, nh÷ng hÖ gen lín ®−îc gi¶i tr×nh tù nh− thÕ nµo? D−íi ®©y lµ mét sè ph−¬ng ph¸p gi¶i tr×nh tù c¸c hÖ gen. Tõ phÇn trªn, chóng ta biÕt r»ng để xây dựng ng©n hµng hÖ gen, toàn bộ ADN hệ gen được cắt thành các đoạn ng¾n trước khi được nh©n dòng vµ duy tr× nhê c¸c vect¬. MÆc dù về nguyên tắc, việc giải trình tự có thể thực hiện trực tiếp trên ADN hệ gen, nhưng thùc tế kh«ng ph¶i vËy v× cần ph¶i biết tr−íc nhiều trình tự cña hÖ gen míi cã thÓ thiÕt kÕ mồi để nhân các ®o¹n kh¸c nhau nằm dọc hệ gen. Để khắc phục khã kh¨n này, người ta nh©n dòng các đoạn ADN b»ng các véctơ, rồi mỗi đoạn cµi sau đó được giải trình tự nhờ dïng mồi oligonucleotide kết cặp với trình tự ®· biÕt của véctơ. Vấn đề còn lại là bằng cách nào tái tổ chức lại các đoạn ADN riêng rẽ thành một trình tự đầy đủ và liên tục của hệ gen. Cã thÓ thùc hiÖn ®−îc viÖc ®ã b»ng một số cách sau ®©y: • Tách dòng các trình tự nằm gối lên nhau (contig). Cách đơn giản nhất để tạo ra các trình tự nằm gối lên nhau là phân lập và giải trình tự một dòng từ ng©n hµng hệ gen, rồi dïng trình tự của dòng thứ nhất ®Ó xác định dòng thứ hai có một phần đoạn cài nằm gối lên đoạn thứ nhất (nhê lai víi mÉu dß). Dòng thứ hai lại được giải trình tự và thông tin về trình tự của nó lại được dùng để xác định đoạn thứ ba nằm gối lên đoạn thứ hai, v.v... Nguyên tắc này là cơ sở của phương pháp bước nối tiếp trên nhiễm sắc thể được dïng để xây dựng các trình tự ADN nằm gối lên nhau (contig) xuất phát từ các đoạn ADN ngắn được tách dòng nhê các véctơ. Tuy vậy, phương pháp này tốn nhiều công sức. Một dòng phải được phân lập và giải trình tự trước khi tìm thấy dòng tiÕp theo. Ngoài ra, các trình tự lặp lại kÕ tiếp (phæ biÕn) trong hệ gen dễ g©y ra sự sắp xếp nhầm. • Giải trình tự ngẫu nhiên toàn hệ gen (kü thuËt \"shortgun\"). Toµn bé các đoạn ADN trong hệ gen được nh©n dòng nhê Gi¶i tr×nh tù ngÉu Gi¶i tr×nh tù ngÉu vect¬ và giải trình tự ngẫu nhiên. nhiªn toµn hÖ gen nhiªn ph©n cÊp Các trình tự sau đó mới được phân tích b»ng phÇn mÒm m¸y tÝnh về ADN hÖ gen khả năng nằm gối lên nhau của chúng (tức là các trình tự cùng xuất hiện ở nhiều phân đoạn khác nhau) Gi¶i tr×nh tù và trình tự toàn hệ gen được xây ngÉu nhiªn dựng dựa trên tổ hợp đồng thời của S¾p xÕp các trình tự nằm gối lên nhau c¸c tr×nh tù (hình 11.14). Phương pháp này lần Tr×nh tù hÖ đầu tiên được dïng để giải tr×nh tù hệ gen vi khuẩn Haemophilus gen ®−îc x¸c ®Þnh influenzae. Toàn bộ hệ gen của vi H×nh 11.14. Gi¶i tr×nh tù hÖ gen b»ng c¸c ph−¬ng ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen vµ gi¶i khuÈn này được phân cắt ngẫu tr×nh tù ngÉu nhiªn ph©n cÊp. nhiên thành những ®o¹n nhá b»ng 341
§inh §oµn Long phương pháp “siêu âm”, rồi từng đoạn nhỏ (1,5 – 2 Kb) được nh©n dòng b»ng véctơ plasmid pUC18. Tổng cộng thư viện hệ gen của loài này gồm khoảng 20.000 dòng vi khuẩn khác nhau. Mỗi dòng (tương ứng với một đoạn ADN) sau đó được giải trình tự để rồi tổ hợp lại và tạo nên tập hợp thông tin về trình tự ADN gồm 12 triệu bp. Độ dài của toàn bộ các trình tự ®−îc gi¶i m· gấp 6 lần độ dài hÖ gen của vi khuẩn. Trình tự hệ gen cuối cùng thu được là nhờ sự tổ hợp các đoạn ADN ngắn thành các đoạn contig. Các đoạn rçng gi÷a c¸c contig cuối cùng được “lấp đầy” bằng việc xác định các dòng bổ sung từ một sè ng©n hµng hÖ gen khác (thùc tÕ, ®Ó gi¶i tr×nh tù mét hÖ gen, ng−êi ta cÇn x©y dùng Ýt nhÊt 2 – 3 ng©n hµng gen mang c¸c ®o¹n cµi cã kÝch th−íc trung b×nh kh¸c nhau, vÝ dô: 1, 5 vµ 10 Kb). Ưu điểm râ nhất của phương pháp “shortgun” là không cần biết trước trình tự của hệ gen vµ tèc ®é gi¶i tr×nh tù nhanh, ®Æc biÖt víi c¸c hÖ gen nhá (nh− vi khuÈn). Phần lớn các hệ gen vi khuẩn có thể giải mã xong chỉ trong vài tuần bằng phương pháp giải trình tự ngÉu nhiªn. Tuy vậy, khi gi¶i tr×nh tù nh÷ng hÖ gen lín (nh− ng−êi), phương pháp này có nhược điểm là gÆp khã kh¨n khi xác định trËt tù c¸c ®o¹n contig ở các vïng hÖ gen mang nhiÒu trình tự lặp lại liªn tiếp; ngoµi ra, sè l−îng contig rÊt lín nªn cÇn c¸c phÇn mÒm vµ hÖ thèng m¸y tÝnh cã hiÖu n¨ng rÊt cao ®Ó xö lý d÷ liÖu. • Giải trình tự ngẫu nhiên phân cấp. Để gi¶i tr×nh tù c¸c hÖ gen lín, có một cải tiến là ADN toàn hệ gen ban đầu được cắt thành các đoạn lớn rồi tách dòng vào các NST nhân tạo vi khuẩn (BAC). Sau đó, mçi dßng BAC ®−îc dïng ®Ó x©y dùng c¸c ng©n hµng “con” mang c¸c ®o¹n ADN cµi kÝch th−íc ng¾n h¬n (vÝ dô: b»ng vect¬ pUC18). ViÖc giải trình tự ngẫu nhiên ®−îc tiÕn hµnh lÇn l−ît b¾t ®Çu tõ c¸c ng©n hµng “con”. Phương pháp giải trình tự ngẫu nhiên phân cấp giúp việc sắp xếp các contig dÔ dµng hơn. 11.2.9.3. T×m gen tõ c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù Sau khi hệ gen của một sinh vật đã được giải tr×nh tù xong, người ta có thể dùng một số phương pháp khác nhau để tìm và xác định vị trí các gen trên NST, bao gồm: • Duyệt trình tự. Các gen mã hóa cho protein phải chứa một khung đọc mở (ORF) mang một chuỗi (không dấu “phảy”) các bộ ba (codon) mã hóa tương ứng cho một trình tự axit amin của protein. Khung đọc mở sẽ bắt ®Çu bởi mã mở đầu 5’-ATG- 3’ của mạch mã hóa (tương ứng với 3’-TAC-5’ của mạch không mã hóa, tức mạch làm khuôn; và mã 5’-AUG-3’ của mARN), đồng thời kết thúc ở một trong các mã bộ ba (TAA, TAG hoặc TGA). Chiều dài trung bình của mỗi ORF khác nhau giữa các loài. Ở E. coli, chiều dài trung bình của một ORF là 317 codon; trong khi ở nấm men, chiều dài trung bình của một ORF là 483 codon. Nhưng nhìn chung, mỗi ORF thường chứa nhiều hơn 50 codon. Vì vậy, để tìm các gen trong hệ gen, có thể áp dụng phương pháp duyệt trình tự theo kiểu trượt dọc mỗi mạch ADN và tìm các codon mở đầu và codon kết thúc cách nhau trên 100 codon. Phương pháp này hiệu quả khi duyệt trình c¸c hÖ gen prokaryote v× hÖ gen cña chóng kh«ng cã tÝnh ph©n m¶nh. Nhưng, với hệ gen eukaryote, phương pháp này gặp khó khăn vì các ORF thường bị phân mảnh thành exon và intron. Việc duyệt trình tù hệ gen eukaryote, kể cả ng−êi th−êng ph¶i nhê c¸c phÇn mÒm m¸y tÝnh nh− Grail, Genemark, v.v… Nh÷ng phÇn mÒm nµy x¸c ®Þnh c¸c ORF kh«ng chØ dùa trªn c¸c m· më ®Çu vµ kÕt thóc dÞch m·, mµ cßn dùa trªn mét sè thuËt to¸n thèng kª x¸c ®Þnh nh÷ng ®o¹n cã tiÒm n¨ng m· hãa, còng nh− c¸c tr×nh tù vïng biªn cña c¸c exon vµ intron, c¸c tr×nh tù ®iÒu hßa phiªn m·, nh− hộp TATA, INR, DPE … lµ nh÷ng tr×nh tù cÇn thiÕt cho sù g¾n kÕt cña yÕu tè TFIID vµ phøc hÖ phiªn m· cña ARN pol II (xem ch−¬ng 3). Tuy vËy, ngoµi c¸c m· më ®Çu vµ kÕt thóc dÞch m·, c¸c tr×nh tù kh¸c cã møc ®é biÕn ®æi lín, nªn viÖc x¸c ®Þnh chÝnh 342
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen x¸c mét gen kh«ng ph¶i lóc nµo còng ®óng. §Ó h¹n chÕ nh−îc ®iÓm nµy, mét ph−¬ng ph¸p bæ sung lµ gen ®−îc x¸c ®Þnh trªn c¬ së c¸c gen ®· biÕt ë c¸c loµi sinh vËt kh¸c (v× chóng th−êng cã tr×nh tù t−¬ng ®ång hoÆc gièng nhau). Tuy vËy, ph−¬ng ph¸p ®èi chiÕu nµy còng cã nguy c¬ lµ c¸c gen gi¶ (pseudogene, th−êng kh«ng ®−îc phiªn m·) ®−îc tÝnh nhÇm lµ gen. • So s¸nh cADN. Mét c¸ch hiÖu qu¶ ®Ó x¸c ®Þnh mét gen trong hÖ gen lµ so s¸nh tr×nh tù cña nã víi mét b¶n sao cADN t−¬ng øng. Chóng ta biÕt r»ng, cADN ®−îc t¹o ra tõ mARN vµ chñ yÕu chøa c¸c tr×nh tù exon cña ORF. ViÖc so s¸nh tr×nh tù cã thÓ thùc hiÖn nhê phÇn mÒm m¸y tÝnh hoÆc sö dông ph−¬ng ph¸p lai gi÷a c¸c ®o¹n ADN hÖ gen víi mARN (ph−¬ng ph¸p lai Northern). C¸c ®o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn - EST (expressed sequence tag) th−êng ®−îc sö dông cho môc ®Ých nµy. EST thùc chÊt lµ c¸c ®o¹n tr×nh tù ng¾n (thường dài 200 – 500 bp) th−êng ®−îc t¹o ra trªn c¬ së gi¶i tr×nh tù tõ mét trong hai ®Çu cña mét cADN. Nhê c¸c EST cã tÝnh ®¹i diÖn cho phÇn hÖ gen ®−îc biÓu hiÖn nªn chóng rÊt hiÖu qu¶ ®Ó t×m kiÕm c¸c gen. Trong thùc nghiÖm, c¸c EST cßn nhiÒu −u ®iÓm kh¸c n÷a, ®ã lµ: (1) c¸c ®o¹n EST ®−îc t¹o ra t−¬ng ®èi dÔ dµng vµ chi phÝ thÊp; (2) chØ cÇn gi¶i tr×nh tù mét lÇn duy nhÊt lµ ®ñ ®Ó t¹o ra c¸c EST ®Æc thï víi mét cADN, tøc lµ mét gen; (3) c¸c lçi g©y ra do gi¶i tr×nh tù th−êng kh«ng cÇn kiÓm tra l¹i, bëi c¸c EST còng chØ ®−îc dïng ®Ó t×m c¸c tr×nh tù gÇn gièng. C¸c c¬ së d÷ liÖu EST hiÖn nay (vÝ dô: http://www.ncbi.nlm.nih.gov/dbEST/) cung cÊp trªn 5 triÖu tr×nh tù EST kh¸c nhau cña ng−êi. TÊt nhiªn, trong ®ã cã nhiÒu tr×nh tù trïng nhiÒu lÇn (®Æc biÖt lµ c¸c gen cã møc ®é biÓu hiÖn cao vµ phæ biÕn); vµ cã thÓ cßn thiÕu mét sè EST t−¬ng øng víi c¸c gen cã møc ®é biÓu hiÖn thÊp hoÆc hiÕm gÆp (vÝ dô: chØ ë mét tÕ bµo, hoÆc chØ biÓu hiÖn trong ®iÒu kiÖn ®Æc biÖt). a) 11.2.10. X¸c ®Þnh vai trß vµ chøc n¨ng gen C¸c dù ¸n gi¶i tr×nh tù c¸c hÖ gen ®· dÉn Galactokinase ®Õn nhiÒu kÕt qu¶ thó vÞ vµ kh«ng Ýt bÊt ngê. Ch¼ng h¹n nh−, c¸c nghiªn cøu ë E. coli vµ S. b) cereviseae d−êng nh− ®· tiÕn hµnh chi tiÕt trong hµng chôc n¨m, nh−ng khi gi¶i tr×nh tù xong hÖ H×nh 11.15. So s¸nh tr×nh tù cña gen cña chóng, ng−êi ta míi biÕt r»ng míi chØ cã galactokinase tõ c¸c loµi kh¸c nhau. 30 - 40% sè gen cña chóng ®· tõng ®−îc nghiªn a) Ph¶n øng xóc t¸c bëi enzym galactokinase. b) So s¸nh mét ®o¹n tr×nh tù axit amin cña cøu. ë nh÷ng loµi kh¸c, bao gåm c¶ con ng−êi, tØ lÖ galactokinase gi÷a c¸c loµi. c¸c gen ®· tõng ®−îc nghiªn cøu cßn thÊp h¬n nhiÒu. Tuy vËy, sau khi hÖ gen ®· ®−îc gi¶i tr×nh Hs: Homo sapiens, tù xong, cã mét sè ph−¬ng ph¸p kh¸c gióp nhanh Sc: Saccharomyces cerevisiae, chãng x¸c ®Þnh ®−îc vai trß vµ chøc n¨ng cña Ec: Escherichia coli, nhiÒu gen trong hÖ gen, bao gåm: Bs: Bacillus subtilis, Ca: Candida albicans, • T×m kiÕm nh÷ng tr×nh tù gièng nhau. Hi: Haemophilus influenza, Còng gièng nh− viÖc sö dông c¸c c«ng cô St: Salmonella typhimurium, tin häc trong viÖc t×m kiÕm c¸c tr×nh tù Kl: Kluyveromyces lactis, m· hãa cña hÖ gen, c¸c c¬ së d÷ liÖu vÒ c¸c At: Arabidopsis thaliana. gen ®· biÕt (ë c¸c loµi sinh vËt kh¸c nhau) cã thÓ dïng ®Ó x¸c ®Þnh vai trß vµ chøc n¨ng cña c¸c gen ch−a biÕt. ViÖc t×m kiÕm c¸c tr×nh tù gièng nhau nµy th−êng dùa trªn c¸c tr×nh tù axit amin t−¬ng øng víi c¸c tr×nh tù gen, v× tÝnh ®a d¹ng cña tr×nh 343
§inh §oµn Long tù ADN th−êng cao h¬n tr×nh tù polypeptide t−¬ng øng do tÝnh tho¸i hãa cña m· bé ba. Thùc nghiÖm còng x¸c nhËn r»ng, c¸c gen cã cïng chøc n¨ng ë c¸c sinh vËt kh¸c nhau lu«n cã ®Æc ®iÓm chung. Ch¼ng h¹n nh−, hÇu hÕt c¸c loµi ®Òu cã kh¶ n¨ng chuyÓn hãa galactose → glucose-6-P, trong ®ã enzym tham gia b−íc ®Çu tiªn cña con ®−êng chuyÓn hãa nµy (galactose → galactose-1-P) lµ mét galactose kinase cã tÝnh ®Æc thï ë mçi loµi, nh−ng chóng ®Òu cã mét sè ®o¹n tr×nh tù gièng nhau (hình 11.15). Nh− trªn ®· nãi, tr−íc khi gi¶i xong tr×nh tù hÖ gen nÊm men, chØ cã kho¶ng 30% trong tæng sè 6000 gen cña nÊm men ®· ®−îc biÕt. Nh−ng, sau khi gi¶i m· xong hÖ gen nÊm men, b»ng ph−¬ng ph¸p t×m kiÕm c¸c tr×nh tù gièng nhau, ng−êi ta x¸c ®Þnh ®−îc thªm chøc n¨ng cña kho¶ng 30% gen n÷a. Nh− vËy, cßn kho¶ng 40% gen ch−a râ chøc n¨ng. TÊt nhiªn, trong sè nµy cã thÓ cã mét sè gen gi¶. ViÖc x¸c ®Þnh chøc n¨ng gen v× vËy cßn cÇn c¸c ph−¬ng ph¸p phèi hîp kh¸c n÷a. • X¸c ®Þnh chøc n¨ng gen b»ng thùc nghiÖm. ë c¸c loµi sinh vËt m« h×nh, nh− E. coli hay S. cereviseae, mét trong nh÷ng ph−¬ng ph¸p c¬ b¶n ®Ó x¸c ®Þnh chøc n¨ng cña mét gen ch−a biÕt lµ lµm bÊt ho¹t gen b»ng kü thuËt “knock-out”. Trong kü thuËt nµy, ng−êi ta dïng nguyªn t¾c t¸i tæ hîp t−¬ng ®ång ®Ó lµm háng c¸c b¶n sao b×nh th−êng cña gen. KiÓu h×nh cña c¸c thÓ ®ét biÕn ®−îc kiÓm tra vµ ®èi chiÕu víi kiÓu d¹i ®Ó x¸c ®Þnh chøc n¨ng gen. Ph−¬ng ph¸p nµy cã hiÖu qu¶ trong nghiªn cøu x¸c ®Þnh vai trß cña nhiÒu gen. Ch¼ng h¹n nh− ë nÊm men, viÖc so s¸nh tr×nh tù kh«ng gióp x¸c ®Þnh ®−îc chøc n¨ng cña mét gen cã tªn lµ SNU17, do tr×nh tù cña nã rÊt kh¸c víi tr×nh tù c¸c gen ®· biÕt. Nh−ng khi gen nµy bÞ háng, tÕ bµo nÊm men chØ ph¸t triÓn chËm vµ th−êng cã nhiÒu sai háng trong qu¸ tr×nh hoµn thiÖn mARN. Qua ®ã, chøc n¨ng cña SNU17 ®−îc t×m thÊy lµ yÕu tè tham gia hoµn thiÖn mARN. §iÓm khã cña ph−¬ng ph¸p nµy lµ trong nhiÒu tr−êng hîp, c¸c c¸ thÓ mang gen bÞ háng hoÆc chÕt sím hoÆc kh«ng biÓu hiÖn kiÓu h×nh kh¸c biÖt. C¶ hai tr−êng hîp nµy ®Òu kh«ng dÉn ®Õn kÕt luËn ch¾c ch¾n nµo. Khi gen bÞ “knock-out” g©y chÕt cã thÓ suy luËn r»ng protein do gen m· hãa cã vai trß sèng cßn ®èi víi sinh vËt, nh−ng vai trß cô thÓ thÕ nµo th× kh«ng râ. Mét ph−¬ng ph¸p c¶i tiÕn kh¸c ®Ó x¸c ®Þnh vai trß cña gen lµ lµm t¨ng møc biÓu hiÖn cña nã, råi theo dâi kiÓu h×nh thÓ ®ét biÕn. MÆc dï ®· cã c¸c ph−¬ng ph¸p ph¸t hiÖn chøc n¨ng gen nh− trªn, nh−ng nh×n chung ë nhiÒu gen, chøc n¨ng gen ph¶i ®−îc ph©n tÝch trªn c¬ së tõng gen riªng rÏ. ThÕ nªn, khèi l−îng c«ng viÖc cho m¶ng nghiªn cøu nµy cßn rÊt lín. Riªng nÊm men, cßn kho¶ng Ýt nhÊt 2000 gen ch−a ®−îc x¸c ®Þnh chøc n¨ng, cßn ë ng−êi vµo kho¶ng 20.000 gen. 11.3. C¸c kü thuËt ph©n tÝch protein MÆc dï sù biÓu hiÖn cña gen th−êng ®−îc ®¸nh gi¸ ë møc ®é phiªn m· th«ng qua viÖc ph©n tÝch s¶n phÈm phiªn m· lµ mARN (ch¼ng h¹n b»ng ph−¬ng ph¸p lai Northern ®· nªu ë trªn), nh−ng thùc tÕ l−îng mARN cã trong tÕ bµo kh«ng ph¶i lóc nµo còng t−¬ng ®ång víi l−îng protein s¶n phÈm cuèi cïng cña gen vµ ho¹t tÝnh cña nã. Sù kh«ng t−¬ng ®ång gi÷a l−îng s¶n phÈm phiªn m· víi l−îng vµ ho¹t tÝnh cña s¶n phÈm dÞch m· cã thÓ do nhiÒu nguyªn nh©n, bao gåm: a) Mét sè ARN kh«ng ®−îc dïng ®Ó dÞch m· nªn kh«ng t¹o bÊt cø protein nµo. b) Mét sè tiÒn-ARN cã c¸ch xÐn intron biÕn ®æi nªn mét gen cã thÓ ®−îc dïng m· hãa nhiÒu protein kh¸c nhau. c) Tèc ®é dÞch m· vµ biÕn tÝnh c¸c mARN kh¸c nhau cã thÓ kh¸c nhau, nªn l−îng mARN cã trong tÕ bµo ch−a ch¾c ®· t−¬ng quan víi l−îng protein. 344
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen d) Ho¹t tÝnh cña nhiÒu protein thay ®æi do nh÷ng c¶i biÕn protein sau dÞch m·, ch¼ng h¹n nh− sù biÕn ®æi mét sè axit amin, sù bæ sung hay mÊt ®i mét sè nhãm chøc (nh− acetyl, phosphate, AMP, ADP-ribose, v.v...). e) NhiÒu protein ®−îc “c¾t tØa” sau dÞch m·, hoÆc ®−îc bæ sung thªm c¸c gèc ®−êng hay lipid ®Ó t¹o thµnh c¸c glycoprotein vµ lipoprotein. f) B¶n th©n c¸c protein cã ®é bÒn vµ tèc ®é ph©n hñy rÊt kh¸c nhau. g) §ã lµ ch−a kÓ ®Õn nh÷ng biÕn ®æi cña protein cßn phô thuéc vµo c¸c ®iÒu kiÖn sinh tr−ëng, ph¸t triÓn cña tÕ bµo; phô thuéc vµo c¸c ho¹t ®éng t−¬ng t¸c cña protein víi c¸c gen vµ c¸c protein kh¸c. V× vËy, ®Ó ®¸nh gi¸ møc ®é biÓu hiÖn cña mét gen, kh«ng thÓ chØ dõng ë møc phiªn m· vµ cßn cÇn ®¸nh gi¸ ë møc dÞch m·. Ngoµi ra, sau giai ®o¹n nhiÒu hÖ gen sinh vËt m« h×nh vµ ng−êi ®· ®−îc gi¶i tr×nh tù, vÊn ®Ò tån t¹i l¹i lµ phÇn lín c¸c gen cña chóng ch−a râ chøc n¨ng. VÝ lý do nµy, nhiÒu nhµ khoa häc cho r»ng thÕ kû 21 lµ thÕ kû cña hÖ protein häc. D−íi ®©y lµ mét sè ph−¬ng ph¸p ph©n tÝch protein c¬ b¶n. 11.3.1. ChuÈn bÞ dÞch nghiÒn tÕ bµo ®Ó tinh s¹ch protein ViÖc ph©n lËp vµ tinh s¹ch c¸c protein riªng rÏ cã ý nghÜa quyÕt ®Þnh ®Õn kh¶ n¨ng t×m hiÓu chøc n¨ng cña chóng. MÆc dï trong mét sè tr−êng hîp, chóng ta cã thÓ nghiªn cøu chøc n¨ng cña protein ë d¹ng hçn hîp phøc t¹p, nh−ng phÇn lín nh÷ng nghiªn cøu nµy th−êng dÉn ®Õn nh÷ng kÕt luËn kh«ng râ rµng. Ch¼ng h¹n nh− khi chóng ta nghiªn cøu vÒ ho¹t tÝnh cña mét enzym ADN pol trong mét hçn hîp protein th« (ch¼ng h¹n tõ dÞch ph©n gi¶i tÕ bµo), c¸c enzym ADN pol vµ protein thµnh phÇn kh¸c còng cã thÓ ¶nh h−ëng ®Õn hiÖu suÊt tæng hîp ADN quan s¸t ®−îc trong thùc nghiÖm. V× vËy, viÖc tinh s¹ch c¸c protein lµ mét b−íc quan träng trong qu¸ tr×nh t×m hiÓu chøc n¨ng cña chóng. Mçi mét protein th−êng cã mét sè ®Æc tÝnh riªng nªn qui tr×nh tinh s¹ch chóng th−êng cã tÝnh ®Æc thï. §iÒu nµy th× tr¸i ng−îc víi ADN, vèn nh×n chung gièng nhau vÒ cÊu tróc vµ thµnh phÇn, chØ kh¸c nhau vÒ tr×nh tù nucleotide. C¸c b−íc tinh s¹ch protein th−êng dùa trªn c¸c ®Æc tÝnh cña chóng vÒ kÝch th−íc, h×nh d¹ng, ®iÖn tÝch vµ nhiÒu khi lµ chøc n¨ng. VËt liÖu khëi ®Çu cho hÇu hÕt c¸c qu¸ tr×nh tinh s¹ch protein tõ sinh vËt lµ c¸c dÞch nghiÒn tÕ bµo. Kh«ng gièng ADN vèn cã kh¶ n¨ng håi tÝnh kÓ c¶ khi ë ngoµi tÕ bµo, protein rÊt dÔ bÞ biÕn tÝnh vµ bÞ ph©n hñy sau khi bÞ gi¶i phãng khái tÕ bµo. V× lý do nµy, hÇu hÕt qu¸ tr×nh chuÈn bÞ c¸c dÞch chiÕt vµ tinh s¹ch protein cÇn ®−îc tiÕn hµnh ë nhiÖt ®é l¹nh (d−íi 4oC). Cã mét sè c¸ch chuÈn bÞ dÞch nghiÒn tÕ bµo. C¸c tÕ bµo cã thÓ ®−îc ph©n gi¶i b»ng hãa chÊt, b»ng c¸c biÖn ph¸p c¬ häc lµm vì thµnh tÕ bµo, b»ng xö lý víi dung dÞch nh−îc tr−¬ng (lµm tÕ bµo tr−¬ng lªn do n−íc ®i vµo vµ vì ra), v.v... §iÓm chung cña c¸c ph−¬ng ph¸p lµ lµm thµnh tÕ bµo vì ra vµ gi¶i phãng c¸c protein. Trong nhiÒu tr−êng hîp, c¸c tÕ bµo cÇn ®−îc chuyÓn vÒ tr¹ng th¸i ®«ng l¹nh, vÝ dô: b»ng m¸y c« l¹nh ch©n kh«ng, sau ®ã ®−îc nghiÒn b»ng m¸y nghiÒn mÉu tr−íc khi tiÕn hµnh chiÕt xuÊt vµ tinh s¹ch protein. 11.3.2. Sö dông s¾c ký cét ®Ó tinh s¹ch protein C¸ch tinh s¹ch protein phæ biÕn nhÊt lµ sö dông c¸c ph−¬ng ph¸p s¾c ký cét. Trong c¸c ph−¬ng ph¸p nµy, c¸c protein ®−îc cho ch¹y qua cét chøa hÖ thèng m¹ng l−íi h×nh thµnh bëi c¸c h¹t agarose, polyacrylamide hoÆc dextran (Sephadex®). Tïy thuéc vµo ®Æc tÝnh cña protein, cã thÓ sö dông mét sè ph−¬ng ph¸p vµ qui tr×nh kü thuËt kh¸c nhau. Cã ba ph−¬ng ph¸p s¾c ký cét c¬ b¶n lµ s¾c ký trao ®æi ion, s¾c ký läc gel vµ s¾c ký ¸i lùc. 345
§inh §oµn Long 11.3.2.1. S¾c ký trao ®æi ion Trong ph−¬ng a) b) ph¸p nµy, c¸c protein ++- ®−îc ph©n t¸ch dùa trªn ®iÖn tÝch ion hãa - --++ bÒ mÆt cña chóng -++- b»ng viÖc sö dông c¸c vËt liÖu nhåi cét (cßn ®−îc gäi lµ pha tÜnh) Protein tÝch lµ c¸c h¹t mang c¸c ®iÖn d−¬ng nhãm tÝch ®iÖn ©m H¹t nhåi cét hoÆc d−¬ng (h×nh tÝch ®iÖn ©m 11.16a). C¸c protein Protein tÝch t−¬ng t¸c yÕu víi pha ®iÖn ©m tÜnh (ch¼ng h¹n, protein tÝch ®iÖn d−¬ng ®−îc cho ch¹y qua pha tÜnh mang ®iÖn ©m) ban ®Çu H×nh 11.16. S¾c ký cét ®Ó tinh s¹ch protein. a) S¾c ký trao ®æi ion, b) S¾c ký läc ®−îc gi÷ l¹i trong cét, gel (vÏ theo Watson et al., 2004) sau ®ã sÏ ®−îc röa chiÕt b»ng mét dung dÞch muçi lo·ng ch¶y qua cét (dung dÞch ®Öm ch¹y mÉu ®−îc gäi lµ pha ®éng). C¸c protein t−¬ng t¸c víi pha tÜnh cµng m¹nh, cµng cÇn nång ®é muèi cao ®Ó röa chiÕt. B»ng viÖc t¨ng gradient nång ®é muèi trong c¸c dung dÞch ®Öm röa chiÕt, c¸c protein kh¸c nhau vÒ kÝch th−íc, khèi l−îng vµ møc ®é ion hãa bÒ mÆt sÏ ph©n t¸ch khái nhau thµnh c¸c ph©n ®o¹n khi chóng ®i qua cét. 11.3.2.2. S¾c ký läc gel S¾c ký läc gel (h×nh 11.16b) cho phÐp ph©n t¸ch c¸c protein chñ yÕu kh¸c nhau vÒ h×nh d¹ng vµ kÝch th−íc. Kh¸c víi s¾c ký trao ®æi ion, vËt liÖu ®Ó nhåi cét kh«ng mang c¸c nhãm tÝch ®iÖn mµ thay vµo ®ã chóng t¹o nªn hÖ thèng m¹ng cã kÝch th−íc lç kh¸c nhau (gièng gel, v× vËy gäi lµ s¾c ký läc gel). C¸c ph©n tö protein cµng nhá cµng cã kh¶ n¨ng th©m nhËp vµo tÊt c¶ c¸c lç cã kÝch th−íc kh¸c nhau; v× vËy, thêi gian ch¹y qua cét sÏ dµi h¬n vµ ®−îc röa chiÕt muén h¬n. Ng−îc l¹i, c¸c ph©n tö protein cµng lín cµng ®−îc röa chiÕt sím. Trong s¾c ký cét, c¸c ph©n ®o¹n thu ®−îc ë nång ®é muèi kh¸c nhau hoÆc ë thêi gian kh¸c nhau, ®ång thêi cã ho¹t tÝnh protein mong ®îi cao nhÊt ®−îc tÝch lòy vµ tinh s¹ch bæ sung. Møc ®é tinh s¹ch cña protein cã xu h−íng t¨ng lªn khi c¸c ph©n ®o¹n protein ®−îc cho ch¹y qua nhiÒu lo¹i cét s¾c ký kh¸c nhau. Th−êng th× mét cét s¾c ký ®¬n lÎ kh«ng ®ñ ®Ó tinh s¹ch mét lo¹i protein mong muèn dï qui tr×nh s¾c ký ®ã ®−îc lÆp l¹i nhiÒu lÇn. Thay vµo ®ã, ng−êi ta th−êng ¸p dông mét lo¹t c¸c kü thuËt ®Ó cã thÓ thu håi mét ph©n ®o¹n chøa mét l−îng lín protein ®−îc quan t©m. Nãi c¸ch kh¸c, tuy cã nhiÒu ph©n tö protein ®−îc röa chiÕt trong dung dÞch muèi ®Ëm ®Æc tõ cét tÝch ®iÖn d−¬ng (vÝ dô tr−êng hîp protein tÝch ®−îc ©m) hoÆc ®−îc röa chiÕt trong s¾c ký läc gel (víi protein kÝch th−íc nhá), c¸c kü thuËt ®¬n lÎ nµy th−êng kh«ng ®ñ ®Ó cã thÓ thu ®−îc mét s¶n phÈm protein tinh s¹ch hoµn toµn. 11.3.2.3. S¾c ký ¸i lùc hç trî tinh s¹ch protein §Æc tÝnh cña mçi lo¹i protein cã thÓ ®−îc dïng nh»m lµm tinh s¹ch lo¹i protein t−¬ng øng. Ch¼ng h¹n, nÕu mét lo¹i protein cã tÝnh liªn kÕt ®Æc hiÖu víi ATP, th× cã thÓ 346
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen dïng cét s¾c ký mang vËt liÖu g¾n kÕt víi ATP ®Ó ph©n t¸ch protein ®ã. ChØ cã protein liªn kÕt víi ATP míi ®−îc cét gi÷ l¹i, cßn hÇu hÕt c¸c protein kh«ng liªn kÕt víi ATP bÞ röa tr«i khái cét. Kü thuËt tinh s¹ch nµy ®−îc gäi lµ s¾c ký ¸i lùc. Cã nhiÒu chÊt kh¸c nhau cã thÓ ®−îc dïng ®Ó g¾n kÕt víi vËt liÖu nhåi cét vµ gióp qu¸ tr×nh tinh s¹ch protein ®¹t hiÖu qu¶ cao h¬n. C¸c chÊt nµy bao gåm c¶ ADN (®Ó tinh s¹ch protein liªn kÕt ADN) hay thËm chÝ lµ protein (®Ó tinh s¹ch mét lo¹i protein kh¸c t−¬ng t¸c ®Æc thï víi nã). Nh− vËy, ®Ó tinh s¹ch mét protein nµo ®ã, cÇn ph¶i cã nh÷ng hiÓu biÕt c¬ b¶n vÒ ®Æc tÝnh lý hãa cña protein ®ã. Mét d¹ng cña s¾c ký ¸i lùc ®−îc dïng phæ biÕn lµ s¾c ký ¸i lùc miÔn dÞch. Trong ph−¬ng ph¸p nµy, ng−êi ta g¾n kh¸ng thÓ ®Æc hiÖu víi protein ®Ých lªn vËt liÖu lµm cét. Trong tr−êng hîp lý t−ëng, lo¹i kh¸ng thÓ nµy chØ liªn kÕt ®óng víi protein cÇn tinh s¹ch. Lo¹i protein liªn kÕt víi kh¸ng thÓ sau ®ã ®−îc röa chiÕt b»ng c¸ch cho ch¶y qua cét dung dÞch muèi hoÆc chÊt tÈy nhÑ. Khã kh¨n gÆp ph¶i víi ph−¬ng ph¸p nµy lµ ®«i khi liªn kÕt kh¸ng thÓ - protein bÒn v÷ng ®Õn møc ph¶i g©y biÕn tÝnh protein míi thu håi ®−îc s¶n phÈm. Nh−ng, kh«ng gièng ADN, protein sau khi biÕn tÝnh th−êng kh«ng håi tÝnh trong ®iÒu kiÖn in vitro, nªn protein thu ®−îc nhiÒu khi kh«ng ë d¹ng ho¹t ®éng chøc n¨ng. §Ó t¨ng hiÖu suÊt tinh s¹ch, còng cã thÓ c¶i biÕn protein. Mét vÝ dô vÒ sù c¶i biÕn nµy lµ bæ sung mét ®o¹n peptide ng¾n vµo ®Çu C hoÆc ®Çu N cña ph©n tö protein cÇn ph©n tÝch. ViÖc bæ sung “tr×nh tù ®¸nh dÊu” nµy cã thÓ thùc hiÖn ®−îc b»ng kü thuËt di truyÒn. C¸c tr×nh tù peptide ®¸nh dÊu lµm thay ®æi mét sè thuéc tÝnh cña protein vµ gióp viÖc tinh chÕ dÔ dµng h¬n. VÝ dô, mét sè protein sau khi ®−îc bæ sung mét chuçi peptide gåm 6 His trë nªn t−¬ng t¸c víi cét Ni2+ tèt h¬n vµ dÔ ph©n t¸ch h¬n (trong khi nh÷ng protein kh¸c kh«ng cã ®Æc tÝnh nµy). Còng cã thÓ sö dông epitop ®Æc hiÖu (th−êng lµ mét ®o¹n peptide cã 5 - 7 axit amin x¸c ®Þnh kh¸ng nguyªn) ®Ó tinh s¹ch lo¹i protein cã ¸i lùc cao víi nã. C¸c c¶i tiÕn nµy cho phÐp tinh s¹ch c¸c protein trªn c¬ së nguyªn t¾c miÔn dÞch. ¦u ®iÓm cña ph−¬ng ph¸p nµy lµ: c¸c epitop cã thÓ thay ®æi tÝnh liªn kÕt kh¸ng thÓ tïy thuéc vµo ®iÒu kiÖn m«i tr−êng (ch¼ng h¹n, ¸i lùc gi¶m khi cã Ca2+, vµ t¨ng khi kh«ng cã Ca2+). §iÒu nµy gióp h¹n chÕ viÖc sö dông c¸c yÕu tè g©y biÕn tÝnh kh¸c. Nguyªn t¾c s¾c ký ¸i lùc miÔn dÞch còng ®−îc dïng ®Ó g©y kÕt tña nhanh mét lo¹i protein ®Æc hiÖu nµo ®ã tõ dÞch chiÕt th«. Trong tr−êng hîp nµy, ph¶n øng kÕt tña miÔn dÞch x¶y ra do kh¸ng thÓ ®−îc g¾n vµo cïng lo¹i vËt liÖu lµm pha tÜnh trong s¾c ký cét. Do c¸c h¹t nµy cã kÝch th−íc lín nªn chóng l¾ng rÊt nhanh trong èng nghiÖm chøa dung dÞch ®Öm vµ mang theo c¸c protein liªn kÕt víi chóng (qua kh¸ng thÓ). Kü thuËt nµy ®−îc gäi lµ kÕt tña miÔn dÞch, còng ®−îc dïng ngµy cµng phæ biÕn trong c¸c thÝ nghiÖm cÇn tinh s¹ch protein. MÆc dï nÕu chØ dïng riªng rÏ ph−¬ng ph¸p nµy, hiÕm khi thu ®−îc s¶n phÈm protein tinh s¹ch hoµn toµn, song ph−¬ng ph¸p nµy rÊt hiÖu qu¶ ®Ó x¸c ®Þnh c¸c lo¹i protein hoÆc hîp chÊt kh¸c (vÝ dô mét tr×nh tù ADN) cã t−¬ng t¸c víi mét lo¹i protein ®Ých nµo ®ã. 11.3.3. Ph©n tÝch protein trªn gel polyacrylamide 11.3.3.1. Kü thuËt ®iÖn di trªn gel polyacrylamide (PAGE) Kh«ng gièng c¸c axit nucleic, protein th−êng kh«ng mang ®iÖn tÝch ®ång ®Òu hay cã cÊu tróc bËc hai ®ång nhÊt däc chiÒu dµi ph©n tö. Thay vµo ®ã, tõ 20 lo¹i axit amin c¬ b¶n (trong ®ã cã 15 axit amin trung tÝnh, 3 axit amin tÝch ®iÖn d−¬ng, 2 axit amin tÝch ®iÖn ©m; xem ch−¬ng 1) phÇn lín c¸c protein lµ trung tÝnh, mét sè kh¸c tÝch ®iÖn d−¬ng, sè cßn l¹i tÝch ®iÖn ©m. Ngoµi cÊu tróc bËc 2, protein ë d¹ng ho¹t ®éng th−êng cã cÊu tróc bËc 3 hoÆc 4 ®iÓn h×nh. Nh−ng khi ®−îc ®−îc xö lý víi c¸c chÊt tÈy (ion hãa) m¹nh nh− 347
§inh §oµn Long SDS (sodium dodecyl sulphate, c«ng thøc lµ CH3-(CH2)11SO4-) hay c¸c chÊt khö nhãm sulfhydryl, nh− β-mercapthoethanol (HS-CH2CH2OH) th× c¸c cÊu tróc bËc 2, 3 vµ 4 cña protein bÞ ph¸ vì. Lóc nµy, SDS t¹o thµnh líp vá ion ©m bao bäc protein lµm protein trë nªn tÝch ®iÖn ©m ®ång ®Òu däc ph©n tö. β-mecarptoethanol lµm “®øt g·y” c¸c liªn kÕt disulfide (S-S) gi÷a c¸c Cys. Trªn c¬ së nµy, nÕu c¸c ph©n tö protein ®−îc g©y biÕn tÝnh bëi SDS vµ β-mercaptoethanol, th× sù ph©n t¸ch protein trong ®iÖn di chñ yÕu lµ do sù kh¸c biÖt vÒ kÝch th−íc vµ khèi l−îng ph©n tö. Khi kh«ng cã SDS vµ β-mercaptoethanol, c¸c protein vÉn cã thÓ ph©n t¸ch b»ng ®iÖn di, nh−ng lóc nµy sù ph©n t¸ch cña chóng cßn phô thuéc vµo nhiÒu yÕu tè kh¸c nh− cÊu h×nh, ®iÓm ®¼ng ®iÖn, sù t−¬ng t¸c ph©n tö ... Mét ®iÓm kh¸c biÖt n÷a so víi c¸c axit nucleic lµ protein th−êng cã kÝch th−íc trung b×nh nhá h¬n nhiÒu so víi c¸c axit nucleic, nªn gel ®iÖn di protein th−êng ®−îc lµm tõ polyacrylamide. HÖ thèng “m¹ng” mµ hîp chÊt polyme nh©n t¹o nµy t¹o ra nhá h¬n so víi gel agarose. Kü thuËt ®iÖn di trªn gen polyacrylamide ®−îc viÕt t¾t lµ PAGE. Sau khi ®iÖn di, ®Ó quan s¸t c¸c protein ®−îc nhuém víi mét trong hai chÊt nhuém phæ biÕn lµ Coomassie blue hoÆc b¹c (Ag2+). Coomassie blue liªn kÕt chÆt víi protein t¹o nªn c¸c b¨ng ®iÖn di cã mµu xanh; c¸c nguyªn tö b¹c còng liªn kÕt m¹nh víi protein t¹o nªn phøc hÖ cã mµu n©u – ®en. Nhuém b¹c th−êng nh¹y h¬n coomassie blue, nh−ng ®¾t h¬n. 11.3.3.2. §iÖn di protein trªn gel polyacrylamide hai chiÒu (2D-PAGE) Do sè l−îng c¸c ph©n tö protein trong c¸c mÉu sinh häc th−êng rÊt lín nªn ph−¬ng ph¸p ®iÖn di th«ng th−êng kh«ng ®ñ ®Ó ph©n t¸ch c¸c protein gièng nhau ra khái nhau. V× vËy, c¸c ph©n tö protein th−êng ®−îc t¸ch tr−íc tiªn dùa trªn sù kh¸c biÖt vµ ®iÖn tÝch bÒ mÆt cña chóng (gäi lµ chiÒu thø nhÊt); sau ®ã, dùa trªn sù kh¸c biÖt vÒ kÝch th−íc (gäi lµ chiÒu thø hai). Ph−¬ng ph¸p ®iÖn di nµy ®−îc tiÕn hµnh trªn gel polyacrylamide vµ ®−îc gäi t¾t lµ 2D-PAGE. Trong chiÒu thø nhÊt, mét gradient pH (tõ ~3 ®Õn 10) ®−îc t¹o ra däc b¶n gel. C¸c protein tïy theo ®iÖn tÝch bÒ mÆt cña chóng sÏ dÞch chuyÓn trªn gel ®iÖn di vÒ vÞ trÝ cã ®é pH t−¬ng ®−¬ng víi ®iÓm ®¼ng ®iÖn (pI) cña chóng (lµ ®iÓm mµ ®iÖn tÝch cña chóng ®−îc trung hßa). C¸c protein cã cïng ®iÓm ®¼ng ®iÖn sau ®ã ®−îc ph©n t¸ch nhê sù kh¸c nhau vÒ kÝch th−íc theo ph−¬ng ph¸p ®iÖn di th«ng th−êng. C¸c kü thuËt 2D-PAGE c¶i tiÕn gÇn ®©y cho phÐp ph©n t¸ch ®ång thêi trªn 10.000 protein kh¸c nhau. Trªn b¶n ®iÖn di 2D-PAGE, mçi lo¹i protein th−êng \"héi tô\" thµnh nh÷ng \"vÕt ®èm\". Mçi vÕt ®èm nµy sau ®ã cã thÓ ®−îc c¾t ra khái gel, xö lý víi protease, råi ph©n tÝch b»ng ph−¬ng ph¸p khèi phæ (xem d−íi ®©y) ®Ó x¸c ®Þnh lo¹i protein. 11.3.4. §Þnh tÝnh protein dùa trªn thÈm t¸ch miÔn dÞch – lai Western Tuy cã b¶n chÊt kh¸c ADN vµ ARN, viÖc x¸c ®Þnh sù cã mÆt mét lo¹i protein trong mÉu sinh häc còng ®−îc thùc hiÖn theo nguyªn t¾c lai vµ ®−îc gäi lµ lai Western. Tuy nhiªn, kh«ng gièng c¸c ph−¬ng ph¸p lai axit nucleic dùa trªn nguyªn t¾c liªn kÕt Chargaff (b¶ng 11.2), lai Western lµ ph−¬ng ph¸p ®Þnh tÝnh protein dùa trªn nguyªn t¾c miÔn dÞch; v× vËy, nã cßn ®−îc gäi lµ thÈm B¶ng 11.2. C¸c ph−¬ng ph¸p lai ®Ó ph©n tÝch ADN, ARN vµ protein t¸ch miÔn dÞch Ph−¬ng ph¸p lai Lo¹i ph©n tö cÇn ph©n tÝch B¶n chÊt mÉu dß (immunoblotting). Trong lai Western, Southern ADN ADN (m¹ch ®¬n) c¸c ph©n tö protein sau khi ®−îc ph©n Northern ARN ADN (m¹ch ®¬n) t¸ch trªn ®iÖn di Western Protein Kh¸ng thÓ ®−îc chuyÓn lªn mµng. Mµng nµy sau South-Western Protein ADN (sîi kÐp) ®ã ®−îc ñ trong mét 348
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen dung dÞch chøa kh¸ng thÓ ®Æc hiÖu víi protein ®−îc quan t©m nghiªn cøu. Kh¸ng thÓ sÏ g¾n vµo lo¹i protein t−¬ng øng ë trªn mµng. Cuèi cïng, b»ng ph¶n øng enzym hiÖn mµu, ng−êi ta cã thÓ quan s¸t ®−îc vÞ trÝ kh¸ng thÓ ë trªn mµng, qua ®ã cho biÕt sù cã mÆt vµ khèi l−îng ph©n tö cña protein. Nh− vËy, ®iÓm chung cña tÊt c¶ c¸c ph−¬ng ph¸p lai Southern, Northern vµ Western lµ sö dông c¸c hîp chÊt chän läc ®Ó ph¸t hiÖn sù cã mÆt cña mét hoÆc mét sè lo¹i ph©n tö ®Æc thï trong c¸c hçn hîp phøc t¹p. Mét ph−¬ng ph¸p lai c¶i tiÕn kh¸c ®−îc dïng ®Ó ph¸t hiÖn c¸c protein liªn kÕt ADN lµ lai South-Western. Trong ph−¬ng ph¸p nµy, ng−êi ta dïng mÉu dß ADN (thay cho kh¸ng thÓ trong lai Western) ®Ó lai víi c¸c protein. NÕu nh− trong lai Southern, mÉu dß ADN th−êng ë d¹ng m¹ch ®¬n, th× mÉu dß trong lai South-Western th−êng ë d¹ng sîi kÐp, v× phÇn lín protein liªn kÕt víi ADN sîi kÐp. 11.3.5. §Þnh lo¹i vµ gi¶i tr×nh tù protein MÆc dï cã cÊu t¹o phøc t¹p h¬n so víi c¸c axit nucleic, c¸c ph©n tö protein còng cã thÓ gi¶i tr×nh tù trùc tiÕp. Cã hai ph−¬ng ph¸p ®−îc sö dông phæ biÕn h¬n c¶ lµ: (1) ph−¬ng ph¸p biÕn tÝnh Edman vµ (2) ph−¬ng ph¸p khèi phæ. 11.3.5.1. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p g©y biÕn tÝnh Edman Ph−¬ng ph¸p g©y biÕn tÝnh Edman lµ ph−¬ng ph¸p gi¶i tr×nh tù axit amin cña c¸c ®o¹n peptide ng¾n, dùa trªn viÖc ®¸nh dÊu vµ c¾t axit amin ®Çu N lÇn l−ît khái chuçi peptide mµ kh«ng ¶nh h−ëng ®Õn c¸c liªn kÕt peptide kh¸c trong ph©n tö protein. Ph¶n øng c¾t ®−îc thùc hiÖn bëi phenylisothyocyanate (PITC, h×nh 11.17). Trong dung dÞch kiÒm nhÑ, PITC ph¶n øng víi axit amin ®Çu N ®Ó h×nh thµnh nªn dÉn xuÊt phenylthiocarbamoyl. Khi chuyÓn sang m«i tr−êng axit, axit amin ®Çu N bÞ “®øt ra” ë d¹ng dÉn xuÊt axit amin thiazolinone. Axit amin thiazolinone sau ®ã ®−îc chiÕt xuÊt chän läc b»ng dung m«i h÷u c¬, råi xö lý víi mét lo¹i axit ®Ó h×nh thµnh nªn dÉn xuÊt bÒn v÷ng cña axit amin lµ phenylthiohydantoin (PTH). ChÊt nµy cã thÓ x¸c ®Þnh b»ng s¾c ký hoÆc ®iÖn di. Quy tr×nh nµy ®−îc lÇn l−ît lÆp l¹i cho ®Õn axit amin cuèi cïng trong chuçi polypeptide ®Ó gi¶i tr×nh tù. H¹n chÕ lín nhÊt cña kü thuËt nµy lµ hiÖu qu¶ gi¶i tr×nh tù thÊp ë c¸c ®o¹n peptide dµi trªn 30 axit amin. Së dÜ nh− vËy, v× ph¶n øng biÕn tÝnh c¸c axit amin ë c¸c ®o¹n peptide dµi th−êng kh«ng triÖt ®Ó. Mét h¹n chÕ kh¸c lµ kü thuËt nµy gÆp trë ng¹i khi axit amin ®Çu N bÞ c¶i biÕn hãa häc (vÝ dô ®−îc g¾n thªm nhãm acetyl hoÆc formyl) mµ hiÖn t−îng nµy vèn cã thÓ x¶y ra tù nhiªn trong ®iÒu kiÖn in vivo, hoÆc trong qu¸ tr×nh t¸ch chiÕt vµ tinh s¹ch protein. Tuy vËy, c¶ hai h¹n chÕ nµy Ph¶n øng biÕn tÝnh Edman Phenylisothiocyanate Alanine Chu kú biÕn tÝnh 2 Chu kú biÕn tÝnh 1 §¸nh dÊu axit §¸nh dÊu axit amin ®Çu N amin ®Çu N Gi¶i phãng axit Gi¶i phãng axit amin ®Çu N PITC-alanine amin ®Çu N §¸nh dÊu axit amin ®Çu N Gi¶i phãng axit amin ®Çu N §o¹n peptide ng¾n ®i 1 axit amin H×nh 11.17. Gi¶i tr×nh tù protein trùc tiÕp b»ng ph−¬ng ph¸p biÕn tÝnh Edman (vÏ theo Watson vµ cs, 2004) 349
§inh §oµn Long ®Òu cã thÓ ®−îc kh¾c phôc b»ng c¸ch dïng protease c¾t c¸c ®o¹n peptide lín thµnh c¸c ®o¹n peptide nhá h¬n tr−íc khi gi¶i tr×nh tù. Víi ®o¹n peptide dµi 30 axit amin, ®é chÝnh x¸c trong gi¶i tr×nh tù cña ph−¬ng ph¸p Edman lµ 98%. Dùa trªn nguyªn lý biÕn tÝnh Edman, m¸y gi¶i tr×nh tù protein tù ®éng còng ®· ®−îc ph¸t triÓn vµ dïng réng r·i. 11.3.5.2. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p khèi phæ ViÖc ph©n tÝch c¸c protein hoÆc c¸c ®o¹n peptide b»ng ph−¬ng ph¸p khèi phæ (MS) dùa trªn c¸c kü thuËt hãa ph©n tÝch cã ®é chÝnh x¸c cao; vµ gÇn ®©y ®−îc thiÕt kÕ thµnh c¸c hÖ thèng tù ®éng do m¸y tÝnh ®iÒu khiÓn. Trong ph−¬ng ph¸p nµy, cã hai kü thuËt c¬ b¶n quan träng nhÊt lµ ph©n hñy laser trong chÊt mang (th−êng gäi t¾t lµ MALDI) vµ ion hãa phun ®iÖn (gäi t¾t lµ ESI). Kü thuËt MS gióp ®o tØ sè [khèi l−îng / ®iÖn tÝch] (m/z) cña ion, tõ ®ã x¸c ®Þnh ®−îc khèi l−îng ph©n tö. Nh−ng nÕu kh«ng cã c¸c kü thuËt MALDI vµ ESI, MS kh«ng trùc tiÕp ph©n tÝch ®−îc c¸c ph©n tö lín nh− protein. Trong kü thuËt MALDI (h×nh 11.18a), c¸c xung laser ®−îc dïng ®Ó “b¾n ph¸” c¸c tinh thÓ chÊt r¾n vµ truyÒn n¨ng l−îng ®Ó c¸c ion cña tinh thÓ “b¾n ra” ë d¹ng khÝ. §èi víi protein, ®Çu tiªn c¸c mÉu ®−îc “tinh thÓ” hãa (chuyÓn sang d¹ng r¾n) b»ng viÖc sö dông chÊt nÒn. ChÊt nÒn ®−îc dïng trong kü thuËt MALDI th−êng lµ c¸c axit th¬m nh− 4-methoxy cinnamic acid. Sau khi bÞ tia laser “b¾n ph¸”, chÊt nÒn truyÒn n¨ng l−îng cho “tinh thÓ” protein, lµm gi¶i phãng c¸c ion mµ kÝch th−íc vµ ®iÖn tÝch cña chóng ®Æc thï víi mçi lo¹i protein. C¸c ion (lóc nµy ë d¹ng khÝ) ®−îc gia tèc trong mét tr−êng ®iÖn tõ cã hiÖu ®iÖn thÕ cao sÏ bay qua mét èng ch©n kh«ng tíi c¶m biÕn tÝn hiÖu. ThiÕt bÞ c¶m biÕn nµy ®o ®−îc kho¶ng thêi gian bay cña ion tõ nguån ph¸t sinh ion (tinh thÓ protein) tíi ®iÓm c¶m biÕn. Thêi gian ion bay tØ lÖ thuËn víi c¨n bËc hai cña tØ sè m/z. ThÕ nªn, tõ thêi gian bay cã thÓ x¸c ®Þnh ®−îc tØ sè m/z cña mçi ion; tËp hîp c¸c tÝn hiÖu cña c¸c ion cho phÐp x¸c ®Þnh tr×nh tù axit amin cña protein. Ph−¬ng ph¸p x¸c ®Þnh tØ sè m/z qua thêi gian bay cña c¸c ion ®−îc gäi lµ kü thuËt t¸ch thêi gian bay (gäi t¾t lµ TOF). Ph−¬ng ph¸p MS dùa trªn hai kü thuËt MALDI vµ TOF ®−îc gäi chung lµ MALDI-TOF. V× kü thuËt MALDI-TOF rÊt nh¹y nªn l−îng mÉu ®−a vµo ph©n tÝch hiÖn nay cÇn nhá h¬n 10-12mole. §Ó cã ®−îc mÉu protein tinh s¹ch ë l−îng nhá, ng−êi ta th−êng tiÕn hµnh ®iÖn di 2D-PAGE ®Ó ph©n t¸ch protein; råi mçi protein ®−îc th«i khái gel vµ c¾t b»ng protease (vÝ dô trypsin) thµnh mét tËp hîp c¸c ®o¹n peptide (th−êng ng¾n h¬n 20 axit amin) ®Æc thï cña mçi protein. Ngoµi viÖc x¸c ®Þnh ®−îc tr×nh tù axit amin, kü thuËt MALDI-TOF ®ång thêi cho phÐp ph¸t hiÖn ®−îc c¸c protein ®−îc biÕn ®æi sau dÞch m·, ch¼ng h¹n x¸c ®Þnh ®−îc c¸c axit amin ®−îc g¾n thªm c¸c gèc phosphate hoÆc gèc ®−êng. Kü thuËt MALDI-TOF hiÖn nay cho phÐp gi¶i tr×nh tù cña protein cã khèi l−îng tíi a) b) Ph©n tö mÉu ë d¹ng tinh thÓ Mao qu¶n dÉn mÉu ®−îc g¾n lªn Tia laser C¶m biÕn tø cùc (bÉy ion)Vïng chuyÓn Vïng chuyÓn C¶m biÕn TOF tr¹ng th¸i chÊt mang tr¹ng th¸i Dung dÞch Giät dÞch Giät dÞch H¹t ion L−íi chøa mÉu mang mÉu mang mÉu trÇn tÝch ®iÖn nhá h¬n ChÊt mang H×nh 11.18. C¸c ph−¬ng ph¸p khèi phæ. a) Ph−¬ng ph¸p khèi phæ Ph©n tö mÉu L−íi bÞ ion hãa tÝch ®iÖn ph©n hñy laser trong chÊt mang kÕt hîp víi thêi gian bay (MALDI/TOF), b) Ph−¬ng ph¸p ion hãa phun ®iÖn (ESI). 350
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen 100.000 Da trong mét lÇn “c«ng ph¸” mÉu. Tuy vËy, víi c¸c c¶i tiÕn kü thuËt kh«ng ngõng, cã lÏ thêi gian tíi, giíi h¹n ph©n tÝch protein cña MALDI-TOF sÏ cßn tiÕp tôc t¨ng lªn. NÕu MALDI lµ kü thuËt ®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ chÊt r¾n, th× ESI ®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ dÞch láng. Trong ESI, ng−êi ta dïng mét mao qu¶n ®Ó nhá giät chÊt láng vµo tr−êng ®iÖn tõ cã hiÖu ®iÖn thÕ cao (h×nh 11.18b). Dung m«i sÏ bay h¬i nhanh vµ giät nhá sÏ “vì ra”. Sù vì ra nh− vËy diÔn ra nhiÒu lÇn liªn tiÕp t¹o nªn c¸c ion ®éc lËp (ion trÇn). C¸c h¹t ion ®−îc gia tèc bay trong èng ch©n kh«ng ®Õn khi tiÕp cËn vµ ®−îc ®o khèi l−îng bëi bé c¶m biÕn tø cùc, cßn gäi lµ bÉy ion. Nh− vËy, bÉy ion th−êng ®−îc dïng víi khèi phæ ESI. Khèi phæ ESI cã −u ®iÓm lµ nã th−êng ®−îc nèi trùc tiÕp víi mét hÖ thèng ph©n t¸ch dÞch láng, bao gåm c¸c kü thuËt ®iÖn di mao qu¶n (CE) hoÆc s¾c ký láng cao ¸p (HPLC). MÆc dï th«ng th−êng kh«ng ®−îc nèi trùc tiÕp víi c¸c hÖ thèng MALDI-TOF, nh−ng c¸c kü thuËt CE vµ HPLC còng cã thÓ ®−îc dïng ®Ó tinh s¹ch protein tr−íc khi ph©n tÝch b»ng MALDI-TOF. Ngoµi ra, trong kü thuËt MS, do hiÖn t−îng c¸c ion “gèc” cã thÓ ph©n r· thµnh c¸c ion “con”, nªn kü thuËt khèi phæ cã thÓ ®−îc thùc hiÖn nhiÒu lÇn kÕ tiÕp ®Ó thu ®−îc c¸c sè liÖu ph©n tÝch chi tiÕt h¬n vÒ mçi ph©n tö protein. Kü thuËt nµy ®−îc gäi lµ khèi phæ kÕ tiÕp (viÕt t¾t lµ MS/MS). Kü thuËt nµy cho phÐp ph©n biÖt ®−îc hai ion cã cïng khèi l−îng (vÝ dô: ®Ó ph©n biÖt hai ®o¹n peptide ng¾n cã cïng thµnh phÇn axit amin nh−ng kh¸c nhau vÒ tr×nh tù). Trong thùc tÕ, ®Ó gi¶i a) MiÒn ho¹t tr×nh tù c¸c ®o¹n peptide hoÆc protein míi, ng−êi ta YÕu tè phiªn m· hãa enzym th−êng ph¶i dïng ph−¬ng ph¸p khèi phæ kÕ tiÕp. MiÒn liªn 11.3.6. Ph©n tÝch t−¬ng t¸c protein - protein kÕt ADN Däc theo gi¸o tr×nh nµy, chóng ta nhËn thÊy ADN ARN pol c¸c mèi t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö (ADN, ARN Gen chØ thÞ vµ protein) cã vai trß trung t©m ®iÒu hßa hÇu hÕt c¸c ho¹t ®éng sèng cña tÕ bµo vµ c¬ thÓ sinh vËt. Trong VÞ trÝ Gen biÓu hiÖn ®ã, t−¬ng t¸c gi÷a c¸c protein víi nhau cã vai trß nhËn biÕt quyÕt ®Þnh trùc tiÕp ®ång thêi cã tÝnh ®a d¹ng vµ “VËt s¨n måi” phøc t¹p nhÊt. Cã nhiÒu ph−¬ng ph¸p kh¸c nhau b) ®−îc dïng ®Ó ®¸nh gi¸ t−¬ng t¸c gi÷a c¸c protein nh»m MiÒn ho¹t gãp phÇn lµm s¸ng tá chøc n¨ng cña chóng. ë ®©y, hãa enzym chóng ta chØ ®Ò cËp ®Õn 3 ph−¬ng ph¸p lµ: (1) hÖ thèng lai hai dßng ë nÊm men, (2) ®ång kÕt tña miÔn “Måi” “VËt s¨n måi” dÞch vµ (3) kü thuËt vi d·y protein. kh«ng b¾t MiÒn liªn 11.3.6.1. HÖ thèng lai hai dßng ë nÊm men kÕt ADN ARN pol ®−îc “måi” Gen chØ thÞ HÖ thèng lai hai dßng dùa trªn ®Æc ®iÓm cÊu tróc ph©n tö cña phÇn lín protein ho¹t hãa phiªn m·. Gen kh«ng biÓu hiÖn Tõ ch−¬ng 5 chóng ta biÕt r»ng, nhiÒu protein ho¹t hãa phiªn m· cã hai miÒn ho¹t tÝnh: miÒn liªn kÕt c) “VËt s¨n måi” ADN, viÕt t¾t lµ DBD (th−êng nhËn ra c¸c ®o¹n tr×nh “Måi” tù ®Æc hiÖu ng−îc dßng promoter) vµ miÒn ho¹t hãa, MiÒn ho¹t viÕt t¾t lµ AD (cã vai trß thóc ®Èy phiªn m· sau khi MiÒn liªn hãa enzym ®Ýnh kÕt víi ARN polymerase). Khi hai miÒn nµy t−¬ng t¸c víi nhau, chóng ho¹t hãa sù phiªn m· cña kÕt ADN “VËt s¨n måi” gen. VÒ nguyªn t¾c, hai miÒn AD vµ DBD kh«ng nhÊt thiÕt ph¶i liªn kÕt céng hãa trÞ trªn cïng ph©n tö ARN pol b¾t ®−îc “måi” Gen chØ thÞ Gen biÓu hiÖn H×nh 11.19. Nguyªn t¾c cña hÖ thèng lai hai dßng. Xem néi dung trong phÇn diÔn gi¶i (vÏ theo Clark, 2006). 351
§inh §oµn Long protein. ThÕ nªn, trong hÖ thèng lai hai dßng, hai miÒn AD vµ DBD ®−îc \"dung hîp\" víi hai protein kh¸c nhau, gi¶ sö ®−îc kÝ hiÖu lµ A vµ B (h×nh 11.19). Hai protein lai nµy ®−îc coi lµ \"måi\" (AD-A) vµ \"vËt s¨n måi\" (DBD-B). NÕu \"vËt s¨n måi\" b¾t ®−îc \"måi\", tøc lµ A vµ B t−¬ng t¸c víi nhau, mét phøc hÖ sÏ h×nh thµnh vµ ho¹t hãa gen. Ng−êi ta sö dông mét gen chØ thÞ ®Ó x¸c nhËn cã hay kh«ng sù t−¬ng t¸c gi÷a hai protein lai. M« h×nh lai hai dßng ®−îc ph¸t triÓn ë nÊm men vµ ®−îc dïng ®Ó kiÓm tra mèi t−¬ng t¸c gi÷a kho¶ng 6000 lo¹i protein kh¸c nhau ë sinh vËt nµy. Theo lý thuyÕt, sÏ ph¶i kiÓm tra 6000x6000 tæ hîp protein kh¸c nhau. §Ó thùc hiÖn ®−îc ®iÒu ®ã, mçi ORF cña hÖ gen nÊm men ®Òu ®−îc nh©n dßng vµo hai lo¹i vect¬ kh¸c nhau: mét vect¬ mang miÒn AD, cßn mét vect¬ mang miÒn DBD. Nãi c¸ch kh¸c, mçi protein cña nÊm men ®Òu ®−îc kiÓm tra trong vai trß lµ \"måi\" vµ \"vËt b¾t måi\". C¸c vect¬ ®Òu ®−îc thiÕt kÕ sao cho c¸c ORF t−¬ng øng víi hai miÒn AD vµ DBD ®Òu ®−îc ho¹t hãa biÓu hiÖn bëi cïng mét yÕu tè ho¹t hãa phiªn m·, vÝ dô nh− GAL4 (h×nh 11.20). Vect¬ A cã vÞ trÝ \"®a nh©n dßng\" n»m ng−îc dßng ®o¹n gen GAL4-AD gióp t¹o nªn ph©n tö lai A-GAL4-AD, cßn vect¬ B cã vÞ trÝ n»m xu«i dßng ®o¹n gen GAL4-DBD gióp t¹o nªn ph©n tö lai GAL4-DBD-B. Hai vect¬ plasmid lai ®−îc biÕn n¹p vµo c¸c tÕ bµo nÊm men kh¸c giíi tÝnh. KÕt qu¶ lµ h×nh thµnh hai nhãm giíi tÝnh, mçi nhãm gåm 6000 dßng tÕ bµo nÊm men mang c¸c vect¬ biÕn n¹p kh¸c nhau. Sau ®ã, mçi dßng tÕ bµo thuéc nhãm nµy (giíi tÝnh nµy) ®−îc ®em lai víi mçi dßng thuéc §iÓm khëi ®Çu sao nhãm kia (giíi tÝnh kia). §iÓm chÐp ë vi khuÈn NghÜa lµ mäi kh¶ n¨ng tæ khëi ®Çu sao chÐp hîp gi÷a c¸c AD vµ DBD thuéc c¸c protein kh¸c nhau ë nÊm Vect¬ Vect¬ ®Òu x¶y ra. Khi c¸c dßng men “vËt b¾t måi” “måi” nÊm men \"lai\" víi nhau, (B) (A) chóng h×nh thµnh nªn d¹ng Promoter Tr×nh tù “vËt b¾t måi” Tr×nh tù “måi” bµo tö l−ìng béi (2n) mang c¶ hai plasmid \"måi\" vµ \"vËt s¨n måi\". NÕu hai protein “vËt b¾t måi” “måi” lai lµ A vµ B t−¬ng t¸c víi nhau, gen chØ thÞ sÏ biÓu T−¬ng t¸c ¸i hiÖn. Trong m« h×nh ë nÊm lùc cao gi÷a men, hai gen chØ thÞ ®−îc sö c¸c protein dông lµ HIS3 vµ URA3. NÕu gen HIS3 vµ URA3 kh«ng ®−îc ho¹t hãa, tÕ bµo nÊm men sÏ chÕt nÕu m«i tr−êng kh«ng cã t−¬ng øng histidine (His) vµ uracine (U). Nh− vËy, nÕu tÕ bµo nÊm men lai (2n) cã thÓ sinh tr−ëng ®−îc trªn m«i tr−êng kh«ng cã ADN ARN ARN His hoÆc U th× chøng tá c¸c pol ADN pol gen chØ thÞ HIS3 vµ URA3 ®· ®−îc ho¹t hãa; tøc lµ hai protein A vµ B ®· t−¬ng t¸c víi nhau. Trªn m« h×nh ë Chän läc trªn m«i Chän khuÈn l¹c mµu xanh lam h×nh 11.20, hai gen chØ thÞ tr−êng thiÕu His (His-) trªn m«i tr−êng cã X-gal ®−îc dïng lµ HIS3 vµ LacZ. Trong ®ã, gen LacZ m· hãa H×nh 11.20. C¸c vect¬ ®−îc thiÕt kÕ cho hÖ thèng lai hai dßng. cho β-galactosidase. Enzym Xem néi dung trong phÇn diÔn gi¶i (vÏ theo Clark, 2006). 352
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen nµy chuyÓn hãa hîp chÊt kh«ng mµu lµ X-gal (5- Ph©n tö ARN brom-4-chlor-3-idolyl-β-D-galactoside) thµnh hîp chÊt cã mµu xanh lam lµ 5-brom-4-chlor- MiÒn liªn MiÒn ho¹t indigo. V× vËy, khi gen chØ thÞ lµ LacZ, nÕu cã kÕt ADN hãa enzym t−¬ng t¸c gi÷a c¸c protein, tÕ bµo sÏ cã mµu xanh lam khi nu«i trong m«i tr−êng cã X-gal. ADN ARN pol Gen chØ thÞ ¦u ®iÓm næi bËt nhÊt cña hÖ thèng lai kÐp ë nÊm men lµ cho phÐp ®¸nh gi¸ sù t−¬ng VÞ trÝ t¸c protein – protein trong tÕ bµo. Tuy vËy, nã nhËn biÕt còng cã mét sè h¹n chÕ. KiÓu t−¬ng t¸c protein - protein nµy chØ giíi h¹n trong nh©n tÕ bµo. H×nh 11.21. M« h×nh lai ba dßng. HÇu hÕt c¸c protein mµng tÕ bµo \"gÊp nÕp\" sai khi ë trong nh©n; ng−îc l¹i, c¸c protein trong Gen ®ang Tr×nh tù FLAG nh©n cã xu h−íng bÞ “biÕn ®æi” sai khi ë tÕ bµo nghiªn cøu chÊt. §éc tÝnh t¹o ra do sù t−¬ng t¸c gi÷a c¸c protein lín (c¸c protein lai th−êng cã kÝch ADN BiÕn n¹p vµo tÕ th−íc lín h¬n d¹ng tù nhiªn) cã thÓ dÉn ®Õn plasmid bµo ®éng vËt viÖc ®¸nh gi¸ sai mét sè t−¬ng t¸c quan träng. nu«i cÊy in vitro Ngoµi ra, mét sè t−¬ng t¸c protein-protein cßn Promoter phô thuéc vµo sù cã mÆt cña ARN hoÆc mét sè ®éng vËt cã vó Thu tÕ bµo vµ ph©n tö nhá kh¸c kh«ng chøng minh ®−îc t¸ch tÕ bµo chÊt b»ng m« h×nh nµy. Protein kh¸c Kh¸ng thÓ Mét hÖ thèng lai ®−îc c¶i tiÕn nh»m kh¾c Phøc hÖ cña FLAG phôc h¹n chÕ trªn ®−îc gäi lµ hÖ thèng lai ba protein dßng (h×nh 11.21). Trong hÖ thèng nµy, hai H¹t ®−îc protein (AD-A vµ DBD-B) ®−îc ®¸nh gi¸ t−¬ng “bäc” b»ng t¸c ®ång thêi víi ph©n tö ARN mµ c¶ hai protein A protein cïng liªn kÕt. M« h×nh nµy cã thÓ ®−îc dïng ®Ó sµng läc c¸c protein t−¬ng t¸c ARN. Ly t©m thu h¹t vµ ch¹y ®iÖn di trªn gel SDS-PAGE HÖ thèng lai hai dßng ë nÊm men còng cã thÓ ¸p dông víi c¸c gen tõ c¸c loµi kh¸c. Ngoµi 3 lo¹i protein liªn kÕt trong phøc hÖ ra, mét sè h·ng (nh− Stratagene, Mü) ®· thiÕt Protein ®−îc ®¸nh dÊu bëi FLAG lËp hÖ thèng lai hai dßng dïng vi khuÈn E. coli. Trong m« h×nh ë E. coli, hai gen chØ thÞ ®−îc dïng lµ bla (kh¸ng ampicillin) vµ lacZ. 11.3.6.2. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch H×nh 11.22. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch. ë ®éng vËt cã vó, sù t−¬ng t¸c gi÷a c¸c protein cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch (h×nh 11.22). Gen m· hãa cho protein ®−îc biÕn n¹p vµ biÓu hiÖn trong tÕ bµo ®éng vËt; sau ®ã, ph©n lËp lo¹i protein ®−îc quan t©m nghiªn cøu võa tæng hîp tõ tÕ bµo chÊt nhê kh¸ng thÓ. Trong tr−êng hîp ch−a cã kh¸ng thÓ t−¬ng øng, th× protein ®−îc “g¾n” víi mét peptide ®¸nh dÊu, gäi lµ FLAG. Sau ®ã, kh¸ng thÓ t−¬ng øng víi FLAG ®−îc dïng ®Ó ph©n lËp protein cÇn nghiªn cøu. Th−êng th× viÖc ph©n lËp protein dùa trªn nguyªn t¾c “kh¸ng nguyªn - kh¸ng thÓ” ®−îc thùc hiÖn trong ®iÒu kiÖn in-vitro gièng víi ®iÒu kiÖn in-vivo. V× vËy, sau khi ph©n lËp, protein nghiªn cøu ngoµi liªn kÕt víi kh¸ng thÓ cßn ®ång thêi ë d¹ng phøc hÖ víi c¸c protein kh¸c. Phøc hÖ protein nµy sau ®ã ®−îc ph©n t¸ch bëi ®iÖn di SDS-PAGE nh»m x¸c ®Þnh xem cã bao nhiªu protein thµnh phÇn tham gia vµo phøc hÖ. ViÖc x¸c ®Þnh protein thµnh phÇn cã thÓ thùc hiÖn b»ng ph−¬ng ph¸p khèi phæ hoÆc gi¶i tr×nh tù protein. 353
§inh §oµn Long Ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®ång kÕt tña HHHHHH Th− viÖn protein miÔn dÞch ®Ó kiÓm tra mèi t−¬ng t¸c protein – protein HHHHHH ®¸nh dÊu bëi His6 trong hÖ thèng lai hai dßng. Tr−íc tiªn, mçi lo¹i protein ®−îc quan t©m nghiªn cøu sÏ ®−îc “g¾n” t−¬ng HHHHHH HHHHHH øng víi c¸c peptide ®¸nh dÊu lµ FLAG vµ His6. Hai HHHHHH cÊu tróc ADN m· hãa t−¬ng øng cho c¸c protein “dung His6 HHHHHH hîp” nµy ®−îc “®ång biÕn n¹p” vµo tÕ bµo ®éng vËt. + Sau ®ã, lÇn l−ît mçi lo¹i kh¸ng thÓ t−¬ng øng víi tõng peptide ®¸nh dÊu ®−îc dïng ®Ó ph©n lËp phøc hÖ Lam kÝnh protein; phøc hÖ nµy sau ®ã ®−îc tiÕn hµnh ®iÖn di g¾n ion Niken SDS-PAGE. Gel ®iÖn di sau ®ã ®−îc chuyÓn lªn mµng nitrocellulose vµ ®−îc lai víi “mÉu dß” kh¸ng thÓ t−¬ng øng víi His6 (anti-His6) vµ FLAG (anti-FLAG). NÕu hai lo¹i protein t−¬ng t¸c víi nhau, chóng xuÊt hiÖn trªn c¶ hai b¶n gel trong lai Western. 11.3.6.3. Vi d·y protein (protein microarray) Protein liªn kÕt víi Ni qua His6 C¸c ph−¬ng ph¸p nghiªn cøu protein tr−íc ®©y th−êng ph©n tÝch tõng lo¹i protein riªng lÎ. Cïng víi nh÷ng tiÕn bé gÇn ®©y trong gi¶i tr×nh tù hÖ gen, còng cã nhiÒu ph−¬ng ph¸p ®−îc c¶i tiÕn cho phÐp ph©n tÝch ®ång thêi nhiÒu protein. Trong ®ã, cã c¸c ph−¬ng ph¸p vi d·y protein. C¸c ph−¬ng ph¸p vi d·y protein ®−îc dïng phæ biÕn trong c¸c nghiªn cøu hãa sinh vµ x¸c ®Þnh ho¹t ®é enzym; ®ång thêi ®Ó x¸c ®Þnh sù t−¬ng t¸c gi÷a c¸c protein víi nhau. §Õn nay, phÇn lín qui tr×nh vi d·y protein dùa trªn m« h×nh ë nÊm men S. cerevisiae. §Ó nghiªn cøu t−¬ng t¸c cña hÖ protein nÊm H×nh 11.23. Kü thuËt g¾n protein lªn men (gåm kho¶ng 6000 protein), 90% sè gen m· hãa lam kÝnh trong vi d y protein. protein tõ ng©n hµng hÖ gen ®· ®−îc t¸i tæ hîp víi ®o¹n ADN m· hãa peptide ®¸nh dÊu His6. §o¹n peptide ®¸nh dÊu nµy cho phÐp protein \"g¾n lªn\" chÊt nÒn qua liªn kÕt gi÷a His vµ Ni (h×nh 11.23). T−¬ng t¸c protein cã thÓ ph©n tÝch gi÷a tõng cÆp protein riªng biÖt, hoÆc ®−îc \"sµng läc\" víi hçn hîp toµn bé hÖ protein; sau ®ã ph©n thµnh c¸c nhãm nhá ®Ó tiÕp tôc ph©n tÝch nÕu kÕt qu¶ t−¬ng t¸c lµ d−¬ng tÝnh. C¸c thÝ nghiÖm ph©n tÝch chøc n¨ng ®−îc thiÕt kÕ sao cho viÖc ph©n tÝch c¸c d·y ph¶n øng thuËn tiÖn nhÊt (th−êng dïng c¸c chÊt ph¸t quang, ®«i khi dïng ®ång vÞ phãng x¹).VÝ dô: ®Ó t×m c¸c protein nÊm men ®Ýnh kÕt víi calmodulin (mét protein liªn kÕt Ca2+) hay phospholipid (thµnh phÇn mµng tÕ bµo), ng−êi ta sö dông vi d·y protein ®¸nh ®Êu b»ng His6 ®Ýnh kÕt lªn lam kÝnh g¾n Ni. C¶ calmodulin vµ phospholipide ®Òu ®−îc ®¸nh dÊu b»ng biotin. C¸c protein t−¬ng t¸c calmodulin vµ phospholipide ®−îc nhËn diÖn nhê streptavidin mang chÊt ph¸t quang Cy3 (h×nh 11.24). B»ng ph−¬ng ph¸p nµy, mét phßng thÝ nghiÖm t¹i §¹i häc Yale (Mü) trong mét thÝ nghiÖm vi d·y protein ®· t×m ®−îc 139 protein liªn kÕt calmodulin vµ 150 protein liªn kÕt phospholipid tõ nÊm men. 11.3.7. VÒ hÖ protein häc (proteomics) vµ hÖ chuyÓn hãa häc (metabolomics) ViÖc ph¸t triÓn cña c¸c kü thuËt gi¶i tr×nh tù ADN, kÕt hîp víi t¸ch chiÕt, tinh s¹ch vµ gi¶i tr×nh tù protein ®· më ®−êng cho sù ra ®êi mét chuyªn ngµnh míi gäi lµ hÖ protein häc (proteomics). HÖ protein häc nghiªn cøu vÒ toµn bé c¸c protein ®−îc mét 354
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen m«, tÕ bµo hoÆc c¬ thÓ t¹o ra trong ®iÒu kiÖn nhÊt ®Þnh, ®ång thêi x¸c ®Þnh møc ®é phæ biÕn cña mçi lo¹i protein vµ sù t−¬ng t¸c cña chóng víi nhau vµ víi c¸c ph©n tö kh¸c (nh− ADN hay ARN). NÕu nh− c¸c kü thuËt vi d·y ADN cã thÓ gióp x¸c ®Þnh ®−îc sù biÓu hiÖn cña c¸c gen trªn cë së ph©n tÝch hÖ gen, th× c¸c kü thuËt proteomics cho phÐp x¸c ®Þnh ®−îc bøc tranh tæng thÓ vÒ toµn bé protein cña mçi tÕ bµo, m« hoÆc c¬ thÓ. Proteomics dùa trªn ba ph−¬ng ph¸p chÝnh, bao gåm: (1) 2D-PAGE ®Ó ph©n t¸ch c¸c protein, (2) MS ®Ó x¸c ®Þnh khèi l−îng ph©n tö vµ tr×nh tù axit amin, (3) tin sinh häc ®Ó so s¸nh gi÷a c¸c ph©n tö protein vµ c¸c ®o¹n peptide víi c¸c tr×nh tù m· hãa chóng trong hÖ gen. Trong thùc tÕ, c¸c nghiªn cøu hÖ gen häc (genomics) vµ hÖ protein häc (proteomics) th−êng ®−îc phèi hîp víi nhau trong c¸c nghiªn cøu di truyÒn häc ph©n tö hiÖn ®¹i. Bªn c¹nh hÖ gen häc vµ hÖ protein häc, gÇn ®©y mét lÜnh vùc nghiªn cøu míi còng th−êng ®−îc phèi hîp víi hai chuyªn ngµnh nªu trªn ®−îc gäi lµ hÖ chuyÓn hãa häc hay hÖ trao ®æi chÊt häc (metabolomics). HÖ chuyÓn hãa häc nghiªn cøu toµn bé c¸c chÊt chuyÓn hãa ®−îc tÝch lòy trong mét m«, tÕ bµo hoÆc c¬ thÓ ë nh÷ng ®iÒu kiÖn nhÊt ®Þnh. HÇu hÕt c¸c chÊt chuyÓn hãa hiÖn nay ®Òu cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng ph¸p khèi phæ (MS), hoÆc ®«i khi b»ng ph−¬ng ph¸p céng C¸c protein ®−îc sµng läc h−ëng tõ h¹t nh©n (NMR). Ph−¬ng ph¸p MS cã ®é nh¹y cao vµ cã thÓ dïng ph©n tÝch nhiÒu nhãm ph©n tö kh¸c nhau. 12C cã khèi l−îng ®óng 12 Da. Trong khi ®ã, khèi His6 l−îng cña c¸c nguyªn tö kh¸c, nh− 14N hay 16O, kh«ng Ni Ni Ni Ni Ni Ni ph¶i lµ mét sè nguyªn. C¸c ph−¬ng ph¸p MS sö dông ®é ph©n gi¶i khèi l−îng cùc cao, gäi lµ EHMR, cã thÓ gióp ñ víi phospholipid ®−îc Lam x¸c ®Þnh chÝnh x¸c c«ng thøc ph©n tö cña hÇu hÕt mäi ®¸nh dÊu b»ng Biotin kÝnh chÊt chuyÓn hãa trong tÕ bµo sinh vËt, kÓ c¶ c¸c ®ång ph©n (cã c«ng thøc ph©n tö gièng nhau). Biotin Phospholipid C¸c ph©n tÝch hÖ chuyÓn hãa ®Æc biÖt h÷u Ých trong nghiªn cøu c¸c chÊt sinh häc thø cÊp (nh− c¸c chÊt t¹o mµu, t¹o mïi, c¸c alkaloid, saponin, v.v…) vèn ®Æc thï ë thùc vËt. VÝ dô, khi sö dông c¶ hai dÞch chiÕt n−íc Ni Ni Ni Ni Ni Ni vµ h÷u c¬ tõ qu¶ d©u t©y, ng−êi ta ®· x¸c ®Þnh ®−îc Bæ sung avidin g¾n víi kho¶ng 7000 chÊt chuyÓn hãa kh¸c nhau. NÕu in ra th× chÊt ph¸t quang Cy3 phæ EHMR cã thÓ dµi vµi ba km. ViÖc so s¸nh hÖ chuyÓn hãa gi÷a mét d¹ng ®ét biÕn qu¶ tr¾ng víi d¹ng kiÓu d¹i ChÊt ph¸t quang qu¶ ®á ®· trùc tiÕp cho thÊy sù kh¸c nhau vÒ hµm l−îng mét sè chÊt chuyÓn hãa trung gian trong con ®−êng tæng Avidin Avidin hîp c¸c chÊt t¹o mµu (s¾c tè) nãi chung vµ s¾c tè ®á nãi riªng (h×nh 11.25). Ni Ni Ni Ni Ni Ni Qu¶ tr¾ng X Qu¶ ®á X Y H×nh 11.24. Sµng läc protein b»ng ph−¬ng ph¸p vi d y sö dông H×nh 11.25. Phæ MS cho biÕt thµnh phÇn c¸c chÊt chuyÓn hãa kh¸c Biotin / Streptavidin. nhau gi÷a d¹ng kiÓu d¹i (qu¶ ®á) vµ ®ét biÕn (qu¶ tr¾ng) ë d©u t©y. 355
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270
- 271
- 272
- 273
- 274
- 275
- 276
- 277
- 278
- 279
- 280
- 281
- 282
- 283
- 284
- 285
- 286
- 287
- 288
- 289
- 290
- 291
- 292
- 293
- 294
- 295
- 296
- 297
- 298
- 299
- 300
- 301
- 302
- 303
- 304
- 305
- 306
- 307
- 308
- 309
- 310
- 311
- 312
- 313
- 314
- 315
- 316
- 317
- 318
- 319
- 320
- 321
- 322
- 323
- 324
- 325
- 326
- 327
- 328
- 329
- 330
- 331
- 332
- 333
- 334
- 335
- 336
- 337
- 338
- 339
- 340
- 341
- 342
- 343
- 344
- 345
- 346
- 347
- 348
- 349
- 350
- 351
- 352
- 353
- 354
- 355
- 356
- 357
- 358
- 359
- 360
- 361
- 362
- 363
- 364
- 365
- 366
- 367
- 368
- 369
- 370
- 371
- 372