UCSC-操作步骤_第1页
UCSC-操作步骤_第2页
UCSC-操作步骤_第3页
UCSC-操作步骤_第4页
UCSC-操作步骤_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、启动子区含有丰富的转录因子结合位点(transcription factor binding sites,TFBS),启动子序列基本上是由这些短序列组合而成,主要在 TSS 上游1kb的范围内。在TSS附近-60bp到+40bp是核心启动子 区,它对 于精确转录是必须的最小单元。对于一个已知基因的启动子可以在 NCBI上查到其转录起始位点,并通过网上软件初步分析该基因启动子 的大致序列及一些顺式调控元件(分析时应把包括整个基因包括在内). 常见的在线预测工具有: 软件神经网络启动子预测器(NNPP,),Promoter scan (),Dragon Promoter Finder (), Pr

2、omoter2.0 Prediction Server () Soft Berry (),网上还提供了一些常见基因的数据库:真核启动子 数据库第 85 版(The Eukaryotic Promoter Database Current Release 85 , EPD,)转录起始位点数据库:该数据库主要包括人,小鼠等常见生物的基因转录起始位点及该基因启动子的可能情况。通过初步分析后,还应通过实验的方法加以确认.包括PCR步查法(对于 一些短的启动子来说).如果预测目的启动子为长启动子,PCR步查较难时,也可采用 筛选基因组文库的方法,筛选阳性克隆子并送长的克隆 去测序。对一些关键的顺式调空元

3、件可以通过凝胶阻滞试验(蛋白基因作用)来加以确认。查询启动子的更多方法:1. UCSC(1)网址:在Genome里选择物种,比如 human, search里输入你的基因名PTEN,点击 Go(2)出现新的页面,看至U "Known Gene NameST面的PTEN 了吧,点它(3)又回到了和(1)类似的页面,此时,点击 sequence(4)出现一个新的页面,选中promoter,同时可以输入数值修改具体的序列区域, 比如 Promoter including 2000 bases upstream and 100 downstream,即表示启动子-2000+100区域(5)点

4、击“get sequence '出现页面中最上面的序列“>uc001kfb.1(promoter 2000 100) PTEN - phosphatase and tensin homolog 就是" 你要的人PTEN启动子-2000+100区域的序列了2、Ensembl(1)网址:在“Search Ensemble题下search后的下拉框中选中物种名 homosapiens (人),for框中输入基因名 PTEN,点击Go(2)出现的新页面中比较乱,但不要管它,直接寻找“Ensemblprotein coding gene字样的,对,也就是第二个,点击它(3)新出现

5、的页面也很乱,不过依然不用管它,看到左侧有点肉色(实在不知道怎么描述了)的那些选项了吗,对,就是“YourEnsembl下面那一堆,在里面找 “Genomic sequence点它(4)现在的界面就一目了然了,在 "5' Flanking sequenceH前入数值确定启动子长度(默认为 600),比如1000,点击update;(5)出现的序列中,标为红色的就是基因的外显子,红色之间黑色的序列就是内含子,而第一个红色自然就是第一外显子了,那么从开始的碱基一直到第一个红色的碱基间自然就是启动子-1000+1的序列啦这样,你不仅查到了启动子,连它的外显子、内含子序列也全部搞定了

6、3、SIB-EPD(1)网址:(2)具体使用方法大同小异,就是输入物种名、基因名,限定启动子序列区域不过有了前两个,我想已经足够用了,个人感觉SIB-EPD的库容量太小,很多基因查不到总结一下:白 ftinmM rwtowrii ff*I Mm-. E t ! 3*1jrm t 4linrera m “e "d7 xfcs? f 坳=7* c* * f r c - 白 1Mt备等球:E Eks lnfOinTii>t>onERE g*驷m nt e irsj-n Jia c/*-/ Err rijrwif-Mr'Mii 14r mcmn/ i|Cf W I pH;

7、 a»Tfclt I CAUIIAI QI WWgfE 1 " ”1 =,*- * »W¥ B-9r» = T *, 3.-M I tfC 嗯. 4MStV4-t-KiCKC4I g t1 ?* |-f-T*T T- Sq. I <Juki,|tatal£A&£ta2Jh金: .iubl I ft-8-C.4a> "'-4- ->a1 -AdRKM*Wlil4ft I111 *C4X*|Ccv:/胄,( 1fM.卜一.<-.if 值或FWmTnMTT心工E*mHGGCTXfE

8、 W*rr,f d 二jGikjclu上月二rt,iTH, fc>F7> WTQfMTT'frp+ibTK+ITm-4 MCEjLTHTQCrbKXJJiM&TUCTgXCT皿aZrM;iax«JK UAH-.TATT,.JUaA4ibiATJlVJItH14«4«Olf«t CT?工riWOTTG:T,TVWhLdKJjTTYSTVTFi* TaWLlC*tXltiWLi&PmlmiWY 1 Durr I,«M Iwi-EltBrllC«n. l ypaKf 一间|%Qng匹卜,叮1 fllWri

9、tQN©nemk rofiMi. ferMiKerirtt 2 才u«Eensembl 一般也和NCBI的一致,你的情况可能例外。这就不清楚了。ensembl有七个外显子可能有它自己的理由。另外,NCBI的基因中gene库中同时有ensembl和genbank的链接,不 如从这个链接看看。此外,还可以看一看这个基因在物种间的同源性,以及其它物种有几个 外显子,做为参考。综合考虑一下。<P&OYtaBIMilFJ«VO*ftT Mi”RM. iMJWdir.M1mrw«4i; £tmMinpjgrk* 押f1fliBwUMMriry

10、 LJtUr fei IM 口用旧=丁1 c< *f*i;-Hi>>.i' .c keEg 口|工,1*31/修。 m.独kH <W n fvipcnni* to rwroffiic fhotk; vnif nUa m lonQ Uvrr pOilunlitfl m (eLfrw6«*w 给你提供几个启动子区域查找的网站,慢慢摸索会学到更多的。果蝇的PROMOTER 2.0通常确定启动子的算法可以分成两种,一种根据启动子区各种转录信号, 如TATA盒、CCAAT盒,结合对这些保守信号及信号间保守的空间排 列顺序的识别进行预测。如 PROMOTER 2.

11、0,用神经网络方法确定 TATA 盒、CCAAT盒、加帽位点(cap site)和GC盒(GCbox)的位置和 距离,识别含TATA盒的启动子。PROMOTER SCAN根据转录因子结合部位在基因组中分布的不平衡性 ,将转录因子结合部 位分布密度与TATA盒的权重矩阵(weight matrix)结合起来从基因组 DNA中识别出启动子区3 。但上述程序预测的假阳性率较高,PROMOTER 210 每 23kb 出现一个假阳性;PRO2MOTER SCAN 平均每19kb出现一个假阳性。PromoterInspector另一种方法根据启动子区序列的特征进行预测。Promo2terInspecto

12、r从一组训练序列中提取出启动子区的环境特征,并将外显子、内含子和3'端非翻译区的特征与启动子区加以区分,从而在基因组中确定启动子位 置初来乍到,发个技术贴了! !1、获取目的基因的mRNA序列,并且在NCBI的数据库中查获转录起 始点2、截取转录起始点为中心,上下约各1000bp,若在此范围内出现CDS,可到翻译起始点终止3、利用在线软件进行分析PromoterinspectorPromoterScanPromoter 2.0NNPPEMBOSS CpgplotCpG Islands Prediction本人是采取多种软件结合的方法,由于 proscan和promoter 2.0的假阳

13、性率较高,仅作为参考,而 promoterinspector的特异性较高,结果比较可信。同时,利用CpG岛预测,作为辅助参考4、最后,可以找到小鼠的同源区,进行同源性比较,启动子区域一定 是高保守区5、至耻匕,可以初步预测启动子区域的范围了。请高手多多指教! !启动子预测:转录因子预测:此处亦有好多,自己挑吧!以下内容转自启动子及转录因子结合位点数据库及预测工具PROMOTER FINDING AND ANALYSIS PROGRAMS ON THE INTERNET TRANSPLORER (TRANScription exPLORER) Dnanalyze (TF mapping)Drag

14、on Promoter Finder 1.2 (TSS finder and promoter region analysis) FunSiteP 2.1HCtata (TATA signal prediction)McPromoter Ver.3Matinspector (Search for TF binding sites)ModelGenerator and ModelinspectorNNPP2.1 (TSS finder)Promoterinspector (Strand non-specific promoter region finder)Promoter2.0 (TSS fi

15、nder)Promoter Scan II (Promoter region prediction)RGSiteScanSignal Scan (Search for Eukaryotic Transcriptional Elements)TESS (Search for Transcription Elements)TFSEARCH (Predicts TF binding sites based on TRANSFAC data)TRANSFAC (TF database and a number of associated programs) TSSG and TSSW PROMOTER

16、 2.0通常确定启动子的算法可以分成两种,一种根据启动子区各种转录信号,如TATA盒、CCAAT盒,结合对这些保守信号及信号间保守的空间排列顺序的识别进行预测。如 PROMOTER 2.0,用神经网络方法确定TATA 盒、CCAAT盒、加帽位点(cap site)和GC盒(GCbox)的位置和距离,识别含TATA盒的启动子。PROMOTER SCAN根据转录因子结合部位在基因组中分布的不平衡性,将转录因子结合部位分布密度与TATA盒的权重矩阵(weight matrix)结合起来从基因组DNA中识别出启动子区3 。但上述程序预测的假阳性率较高,PROMOTER 210 每 23kb 出现一个假

17、阳性;PRO2MOTER SCAN 平均每19kb出现一个假阳性。PromoterInspector另一种方法根据启动子区序列的特征进行预测。Promo2terinspector从一组训练序列中提取出启动子区的环境特征,并将外显子、内含子和3'端非翻译区的特征与启动子区加以区分,从而在基因组中确定启动子位FirstEF近来还有一些程序将上述方法与 CpG岛(CpG islands)信息相结合。CpG岛是一段200 bp或更长的DNA序列,核昔酸G + C的含量较高,并且CpG双核昔酸的出现频率占 G+ C含量的50 %以上。许多脊椎动 物的启动子区都与 CpG岛的位置重合。FirstE

18、F ( http :/ / rulai1cshl1org/ tools/ FirstEF/ )搜索通过5' UTR定位技术构建的第一外显子数据库,识 别第一剪切点(first splicing donor site),结合CpG岛信息,确定启动子区。 这种方法使预测的敏感性和特异性都明显提高。该程序预测含CpG岛的启动子的敏感性和特异性都高于90 %,预测不含CpG岛的启动子的精确性相对略低。TRRD数据库 收录了真核基因调控区结构和基因表达方式的信息,每个条目对应一个基因。应用权重矩阵数据库搜索转录因子结合部位的程序包括SIGNAL SCANMatinspector转录因子搜索程序(

19、transcriptional factor search ,TF2 SEARCH )等等。尽管基于PWM的搜索比较敏感,但它最大的缺点就是假阳性率过高,在预测的结果中有很多结合部位并不真正具有生物学功能。COMPEL数据库经实验确定的复合元件不多,COMPEL数据库中收录了近200条经实 验确定的复合元件的信息。如果转录因子结合部位的预测结果中包含复 合元件,显然比单个元件更有可能具有生物学功能。Co - Bind程序通过建立两个转录因子结合部位的PWM及其复合作用的模型,可以预测序列中的复合元件。还有一些程序利用COMPEL数据库中已知的复合元件去搜索基因组序列。ConsensusAlig

20、nACE等是用来搜索高含量基序(overrepresented motif finding)的一些算法,可以对一组基因簇中的基因调控区进行比较,以发现其中存在的高含量的基序,调控元件可能就存在于这些基序之中。在UCSC查找可能的启动子1、进入网站。2、点击Tables菜单,在position后面的搜索框内写入待查的基因名称,点击 getoutputoHeme GertomcB name &rowter 日口t Tables Gen« Sorter PCR Session FAQTabk BrawfitrUte this pc。第am to fetriHe the Kjvji

21、nseiaied with 翡 track 制 teill-Minar, ta calcuia! itilertecttcns betweetL ttae. by a track. For in usrig:由由 appBcatkn »e 匕曲我曲 T 曲 W Btd/sct for a dn 的曲x> of the ccxnroK in this 丽同 sainpte querid£ and (be OpfliHebx Tab> Browser moii.i fbr i 例rated pf«ent3t»fi of the sethvjire

22、 feames may warn to use GaLny ot qb piibfc Mt$QL server Refer to the Cr也曲工 page fbf the?久t of contriboKw3 and us«chde: VedfrbfZlgroup: Gunand Gene Predictian Tracks刁a»embh; M制1二二I frack: jRefSeiq Gene± - jadd custom E(ctable-: freKiened5&cnt» tabk §re£iDk:萨fiome r E

23、NCODE ;pd+ahGers (hame&/acc«s£ions距1m.底 filter:Ilookup»rr&htiest.口 eat g |createoatput format: | seuanctQBtgiDt Glc:二I 厂 Send cnlpvl to Galaxy(kttve bhok tc keep oiput in browicr)get outputa u mmary/sl dti stiesElk fyp也,制耐',te%t 笠中 已财呻r”'dTo reStnTTusrf cart scrungs (i

24、nchxliag cuftom tr&cksX ebek hrre3、出现一系列候选序列。当搜索用词不特异的时候会出来太多的结果,只显示500条UCSC Genome BioinformaticsUCSC Genes以016工 lUGgOIcw.lI津"7 ; 5533305-553675 当卜 act in, qanna 1 propeptideYtaf二二二口印1 空的,1.卜 &二 £二工5 二三4863工631-1.4- Acln fllamenr assccrjited pra:*CTGi in仁口工OfEy* 11 a匚亡hf ? :¥

25、己皆736。工口口二®2 - &cri-Q# qamma 2 propeptide辿3生呷9竺毛联”._3二亡”:二二二自二文一懿-二:门打亏” 器Hl里g足心手口:114*392国通一丁工后3253号JLBLJMl 【JuGO/xYn *埒 _,生 £打工12:U二旦岳二"手?国抄_3 S3”M1 tuaggxynJj ,匚 ch"Ch11比ft06”7工£434404 ABLIM1 ii<saO9iyl-iy At ehflt): 11C1BGB &9-ll«4344O4-aKj.n-mficug-4Gin-

26、bi.n.dXng - aein-blndi-4cin-bin-di n7-ictiR-bindiDtIM 口乂 LIM LIM LIMpraiiti n 1 i* protein 1 i: prat-ti n I it pcotfin 1 is preltein 14、点击自己目的基因的结果链接,会出现该基因在染色体上的位置(有时候会直接跳到选择genome, protein, mRNA那一页面,可能是在搜 索词比较特异的情况写),继续getoutput。Homs G«no<n» Gvnonia 8row»r SIjt Tib际b Gene Scrwr P

27、CR Svt«ion FAQTable BejmfeUse tbos. progidin to reprieve tbt 4旭 asKCiaird 喘讪 t track 衽 tesi Hmm.附。向白血忸 irittr itctbta between trACks. by Hack F <x hdp in uaug thu appbcatKNi sc士 匚而& Ute hb正 日10*、口 for u dcioiplku <rf tiH cooucb m g f«u . uid 3ipk ifuctK$t and th* Ope i d TabLe Br

28、OWso hJmia! far A nbi ated jjrfSmLiXKM of Lbe sedtUa e 企dtf eh m tnay want to uw GsImv w out pub山 IW&QL 3V空 Refer to 型 Cf*Ak j»gE foe tbe *T ot' cmribut&fi w»d uwtgctfhd*: |Vert«6fsifl gpBOBiez f Hl加刖F 畤:1mh 2006Ihm|k Gsfws ar>d Gwia Predpcliofi Flicks习 tnck: |RefSeq Ge

29、nes;»M tuslflm Irk-gjnif-r ection: -£»rrc-htHK: 1ra|4U1«I forwiC |sequent*2 r SffEAdlpdl fiJ»: :Oeaxr blank 1& kftp awpirt ia brmv找rJnktyptrHSM比"pig 低斯 r 叫 Hm和ct«d5、选择genome这一项。6、promoter/upstream前面的框中打勾,一般的启动子长度大约为 2kb左右,这个数字可以修改。为便于观察,可继续修改下面的几个选项。这里选择CDS大写。7

30、、点击get sequence即可得到结果。UTR和upstream是分开的,CDS是大写的,可以看到起始码。copyATG以前的序列进行启动子分析。PCR以genome为模板。Putiativtf* ptoniolrrjx-apd,-'smtd*-事士F-®dr,Kq"ag彳干;7.:aadaeaa Iflzztcaet-J yuqgeacijeccjCa7 t &叱中亡 ggcqcffQqccciBtCiag 二口口 口二 iju 弋 口工 tecs m aagttacce c tc» iggct ega 白口6 q g UQeqQGmqu&#

31、169; c=cCat4«a«c c=gqcQ cq accg ecjaecre peaTHa a kl / gt none工匕 7"nwz e-pe& Ka.a Eiuq "n&aer m 1产.+ M . . H i q -F Ar晕r e pea Lfta s king-noneAgaaeeca.ijffeeeTggcacccgiTqcagdeeecqigjcEcaeecca.eeEgq co 七 CQ-q cac<citaii>4«g ttu弋t。ggc-94qsq gut c©*g电,。c&quo

32、t;西尔询弋"q u 彳timc EBeEgiuueqBt gQg+OuggqcuajEggrcqBBG ouuoa 圈守守守£gg修中 EggEG ra74 5事£曰讦管外41四m,£T SW £GKecE ecEecE: ual eTegee etegie tecEEEtct-t ttegeM a&o ?aqiggTCG10GWK:GWZ(aGGC*CC*£5g S0一千,Kbq_-ch.9+ ER/q/TE.KK 电,工 irTwH 电;r-#飞 +,,T一GOT 就丁内丁行无。亍K?KC禹沁 5热rr CCTATGTK

33、K5Ag际CCfiGAGaULGAGlGGCl了 UCTCfcCCCTGMGT 二 CIZWaLTUGAGQJZGGCtHUbTdCCJyiUHGGiKZ GATGGJUkJLUT CT SGCAC CJLCA CCTTCTAi:AAT 3AseTGOGT5TGGCTCCDGAI3GASCAOCCC5TGCT GCTGAa QASGCccu 8732(>:(:匚&加=仁2::匚白:|但j>&g 1 H_reEtene_PM_:i011 £L_5 zaige"chrtSSJUS-SSSlBTfr SsfacI"0 S'jaa*3

34、jzand*-ArcATGTTTGAEeeTf cwi»eEceAjsecJkTGieGTTceT工甘 e exfieeTOT SCTATGCCTCTM(K:CTCTSKCOTM:GmWG*TCSTOAI 叩ECCGCTSAOMGGTCiCUeACACTGGCCeJkT CT*CGRMCSTAT(MK:eTCCCC CAT KCTCCTKGTCTGC-rjG«T5CGGGACCTGACT GACTaCCT CAT辿iRg 匚丸二仁 GFSgGTQGmXB:。二 K5CCGAGC<3GSAAftTCGTiCGTGaCITMGGAJGAAJ3CTGTGCTACGTC&am

35、p;CCCirG* ,tlg品/mah mi-值廿"广力 i"MrrqrF-j"r制 rsrrrrim"rtw5#iifiai扁在Ensembl查找可能的启动子1、进入网站,选择物种,填入搜索的基因名称。2、出来2个结果。本例中貌似是同一个。点击相应链接进入新页面Ensembl text search|GLUT7 corpor3t«flr« Top/5peci«5/Ho4no sapiens- SeairhJYourQusiy mai crie 迷专 $earcf> d 凯3g 与 gn史MjdpTnwrL: I中川i

36、nterPro 由enefi JPR002440 Giucaie transporter.type 2 dGLUT3|Hhas 1 as&oaaled e侬mai debase idenMiers: Pn3m HamamxiOPW:EMSGStounzo e50 Species- Hama sapiens; DoiTidin Feature tv臼 Ensembi Gene Report for ENSGOOOODl 63581(ieneHOlC HutonjriclJSjffWlfVnik GLUT2Tw ma allllrtM g*17*114第M 省 9 mBflbbM &quo

37、t; tTbe Hue祕专E5 s«tLriHmtil Gene E«5GW(W>1«W1IDGenwikTTirfi Qtfie tip found onCftrc>mofiC:<n,Jatloukun 门O_;31.LdLa由tomWoiWtthis gent is MhNdSin ' ”<J*PaCTt& 316M-EteKriplinnSalute canerta.Tit:r'2FutGSEtrancbDiler rpnittf 2 Clui:一日 Tanmmrtef trffl 2, fr .GLUT-2f

38、 ?-Ly方真蛇口工1,0pKfcl Idler MtitiodTraniKripb&wtr® annouDKi t,ih+ ehhex MicmaKMi心博 mam»uMq 割htr >e f > m曲i tomJjta4w* pro mmix 才 MW a3rMs 刷 蚱 anEF prtdiin ©的电 t« 星Q«er 加 m«Hj«Fs » MtvWilh 小对:W* i-iW tD冲中 / ar>n 中曰片 yrr? t 仟印iEre 4中 n * Kwm / 4 . G

39、87;n WJW u脆匆)SLC2AsM&45TWWK31ttsiENSPMK)03attMfl -i Sin烟f ,71> 心上窈eMSUA2JM&BTOW0W«»EH8PWWM3MIMMMllCfcl生="»立髓岫*g3分4tTftii -ifr Ji i*4、新页面中即可看至U 5' upstream sequence 可以在 Flanking sequence ateither end of transcript后面的框中修改期望显示的序列长度。一般启动子最好选2kb。然后copy所显示的上游序列进行分析。“即nip

40、t红齿土TIM Bw£cngC»i nrwimw M Una 303 J M ££Q 皿£LfiMmblTiflRMtlKK DbnlnrtvclanIKCiMT WIM 中 hMgln: 3W Mi TfflMlMM iMOthE y"ThM.A.g啤41rl>4W; MMMaiS.aJi«d«Thri firwisrnc4 can &« fctnwi m CSwcrnmom* 3 . locinbon ! T1 3吐,,:?' -L*ITW 加利 ”1 tvwnt,g«

41、H m 庄?2i3 i HomM IWnih 1 tKKvM QlixiMe to«tMK4«r*rwHM« t-rQwewkanpeflwtrM京 iwhlUMHinairtr iwg WVK4 H MTv i WMrwi Smut pun,M htiw M9Ul M HTUK UQUMLCI 广F Ex on rntormdliOfi随着基因工程的发展,常常需要构建一种能高水平表达异源蛋白质的表达载体。启动子对外源基因的表达水平影响很大,是基因工程表达载体的重要元件。因此研究启动子的克隆方法,对研究基因表达调控和构建表达载体至关重要。迄今为止,国外尚未见到有关

42、启动子克隆方法的综述性报道,国内仅孙晓红等曾就启动子的结构、分类、克隆方法和食用菌中已经分离到的启动子作过综述。而近年来又有许多改进的克隆启动子的方法获得了多方面的成功,本文就近年来改进的启动子克隆方法作一综述,以期促进对启动子分离技术的应用。1启动子克隆的几种方法1.1 利用启动子探针载体筛选启动子 启动子探针型载体是一种有效、经济、快速分离基因启动子的工具型载 体,包含2个基本部分:转化单元和检测单元。其中,转化单元含复制 起点和抗生素抗性基因,用于选择被转化的细胞;检测单元则包括1个 已失去转录功能且易于检测的遗传标记基因以及克隆位点。利用启动子探针载体筛选启动子的过程为,先选用1种适当

43、的限制性核酸内切酶消化切割染色体 DNA ,然后将切割产生的DNA限制片段群体 与无启动子的探针质粒载体重组,并按照设计的要求使克隆的片段恰好 插在紧邻报告基因的上游位置;随后再把重组混合物转化给寄主细胞, 构建质粒载体基因文库,并检测报告基因的表达活性。当插入段同时满足(1)具有基因启动子序列;(2)具有翻译启始区;(3)具 有启始MM子;(4)插入方向正确;(5)插入片段3'端编码区序列抗性基 因编码区读码框一致,则有可能形成有功能的抗性融合基因,从而启动抗性基因的表达。最早由Rachael等在大肠杆菌中以四环素抗性基因作为报告基因构建了 启动子探针质粒pBRH3B ,并克隆了一些

44、原核和真核启动子片段。其后Donna等以氯霉素抗性基因作为报告基因,Fodor等以大肠杆菌LacZ为 报告基因,构建了酵母启动子探针质粒并克隆了一些启动子片段。构建启动子探针型载体,较为常见的检测标记基因有&半乳糖甘酶基因(lacZ)、氯霉素乙酰转移酶基因(cat)、四环素抗性基因(Tet')和卡那霉素 抗性基因(Kan')。近年来,人们渐渐较多地使用潮霉素 B磷酸转移酶(hph) 基因作为检测标记基因。李维等曾构建了含有hph抗性基因的启动子探针型载体pSUPV8,直接在大肠杆菌中分离黄狗原毛平革菌基因的启动子。先用Sau3AI酶切黄狗原毛平革菌基因总 DNA ,再与

45、用BamHI酶 切后的pSUPV8相连,转化大肠杆菌,用间接筛选法从氨苇青霉素和潮 霉素抗性平板上筛选重组子,得到6个双抗重组子(pCH1pCH6),电泳检测插入片段分别命名为 CHlCH6;再用原生质体转化法将重组子 分别转化黄狗原毛平革菌,对获得的转化子进行复筛,仅 pCH6的转化 平板上有稳定生长的菌落,说明了CH6片段在黄狗原毛平革菌中具有启动基因表达的功能。该方法不需要知道具体基因的序列,可随机筛选启动子,避免了引物设计,能获得大量的启动子片段。1.2 利用PCR技术克隆启动子即根据发表的基因序列,设计引物,克隆基因的启动子,由于PCR法简便快捷,近年来人们较多采用此方法克隆基因启动

46、子。苏宁等根据已报道的水稻叶绿体 16SrRNA启动子基因序列设计5启动 子序列的引物,以水稻叶绿体 DNA为模板,PCR扩增出16SrRNA基 因5启动子区的片段,酶切克隆到 pSK的SacI和SphI位点,构建测序 载体质粒pZ16S,进行序列测定,结果表明所克隆的片段长为144bp,含有SD序列。同源比较结果表明,所克隆的片段与水稻叶绿体16SrRNA 启动子序列具有100%的同源性。上述的PCR方法简便、快捷、操作简单,是人们较为广泛使用的技术。1.3 环状PCR环状 PCR 包括 I-PCR(Inverse-PCR)和 P-PCR(Panhandle-PCR)这 2 种PCR都是根据

47、一端已知序列设计的嵌套式引物进行PCR1.3.1 I-PCR I-PCR是1988年由Triglia最早提出的一种基于 PCR的改 进的染色体步行方法。I-PCR的实验程序包括,基因组 DNA经酶切后 用T4DNA连接酶进行自连接,产生环状 DNA片段;以环化产物为底 物,用根据已知片段设计的反向引物进行PCR扩增,从而得到含有未知片段的扩增产物(流程如图1所示)。韩志勇等以I-PCR技术为基础克隆了转基因水稻的外源基因旁侧序列。先用小量法提取转基因水稻的总 DNA,总DNA用10倍过量的限制内 切酶进行过夜酶切,酶切片段进行自连接,然后根据工程质粒的T-DNA 区设计2对反向引物,进行套式

48、PCR扩增旁侧序列。建立了适合于处 理大量材料的克隆转基因水稻中外源基因旁侧序列的技术体系。在1周内克隆了 35个转基因水稻株系中外源基因的旁侧序列,长度在300750bp之间。I-PCR法快速、高效、稳定,操作相对简单,花费少,PCR 引物设计比较方便。1.3.2 P-PCR P-PCR是由Jones等提出的利用末端反向重复序列与已知 序列互补配对形成环状单链模板,有效增强了引物与模板结合的特异性。反应需要3个根据已知序列设计的引物,3个引物在已知序列内呈线性 排列,其中第3个引物可作为接头使用,可与已知序列互补配对形成锅 柄状单链模板。其过程为,首先酶切基因组DNA,产生5'或3&

49、#39;粘末端, 然后连接上合适的接头(primer 3),连接好后最好用核酸外切酶I除去多 余的接头,由于连接上的接头与已知序列是反向重复序列,变性后的 DNA单链可退火形成锅柄状单链模板,之后分别用 3个单引物进行3 次PCR扩增,能有效地扩增29kbp的大片段未知序列(流程如图2所 示)。黄君健等成功地应用P-PCR技术从正常的人外周血单核细胞基因组 DNA中扩增端粒催化亚基hTERT基因5'端上游旁侧序列,获得了 hTERT基因翻译启始位点上游 2090bp的基因组DNA序列。首先用酶 切消化基因组DNA ,得到带有GATC的5'突出端的DNA片段。然后利 用已知的hT

50、ERTcDNA序列设计PCR引物,用常规的PCR方法扩增出 1条大约900bp的基因组特异片段,序列分析为 hTERT的基因组DNA 片段。根据得到的基因组DNA序列的信息,确定P-PCR的引物退火区, 并合成了 5'磷酸化的连接寡核甘酸和4条基因特异性引物,其中连接寡 核甘酸5'端的4个碱基CTAG与上述核酸内切酶消化产生的 5突出端 GATC互补,然后将连接寡核甘酸与基因组酶切产物连接,以连接产物 为反应模板,进行PCR,使模板自身进行退 火-延伸反应,以形成 Panhandle结构。最后以单链Panhandle为模板,4条基因特异序列为引 物进行嵌套式PCR,最终获得了

51、1条约2kb的含hTERT基因启动子的 DNA片段。Jones等利用改进的P-PCR,在形成panhandle结构之前3 末端连上ddCTP,使引物错配的机率减少,特异性增加。他们从人类基 因组DNA已知位点侧翼扩增了 49kb的大片段未知序列。P-PCR是目 前能够扩增距已知序列最远的未知 DNA序列的方法,有很高的特异性。1.4 利用载体或接头的染色体步行技术克隆基因启动子这类方法的第一步都是酶切基因组 DNA,连接载体或接头,既可以用 pUCl8等质粒载体,也可以使用入DNA等噬菌体载体,只要选用的载体 带有合适的酶切位点;同样根据实验需要,接头既可以是双链也可以是单链,然后根据基因组

52、DNA序列设计的特异引物和载体的通用引物或 接头序列进行扩增。1.4.1 利用载体的PCR Shyamala等利用的单特异性引物 PCR(SSP-PCR) 对以小鼠伤寒杆菌组氨酸转运操纵子为起点进行连续步行。以M13mpl8RF DNA 为载体。用PstI和Aral酶切基因组 DNA , PstI和XmaI 酶切载体DNA,然后连接基因组片段和载体片段,用根据基因组 DNA 序列设计的特异引物和载体的通用引物进行扩增,由于非特异片段没有单特异引物结合的位点,即使有载体连到非特异片段, 也无法得到大量 扩增,而使特异片段得到有效扩增。1.4.2 利用接头的PCR王新国等利用衔接头的方法,设计了位

53、于单链 DNA两端互补的颠倒末端重复序列,增加了反应的特异性,在胡萝卜 II型转化酶基因启动子的克隆方面取得了新的进展。首先将胡萝卜基因组DNA分别用PvuI、SmaI、DraI、EcoRV酶切,并设计了 1个衔接头 长链序列和1个衔接头短链序列,并在衔接头短链的3末端带有1个氨 基的衔接头,能够阻止聚合酶催化的衔接头短链的延伸,同时衔接头的 长链和短链之间是反向重复序列。将酶切片段与此衔接头连接,取连接产物做模板,以衔接头引物和基因特异引物做PCR,在首轮PCR中只有限定的远端基因特异引物有结合位点,当基因特异引物延伸产生的 DNA链通过衔接头时,才能产生衔接头引物的结合位点,PCR才能以衔

54、接头引物和基因特异引物进行指数扩增。而另一方面,如果非特异合成产生了 DNA两端都有双链衔接头序列的 PCR产物时,这种PCR产 物在每次变性后,单链DNA末端的衔接头反向重复序列将形成锅柄结构,此结构比引物-模板杂交更稳定,能抑制非特异序列的指数增长。最后得到主要的 PCR产物为3.4kb、1.3kb、0.6kb和0.4kb。将EcoR V- 衔接头体系的PCR产物克隆、测序、同源性比较,得到 1个新的胡萝卜II型转化酶基因启动子序列,它含有类似于 TATA box和CAAT box 的元件,在启动子的远上游区域含多个AT富含区,该启动子的发现对于研究植物中的糖代谢具有重要的意义。 接头引物

55、的相对位置如图3所 示。这种方法具有便于操作、实验线路简单的优点,但是特异性较差,产物 需进一步杂交验证。1.5 YADE 法Prashar等在扩增cDNA3'端时采用"Y形接头,以减少接头引物的单引物扩增。其原理是接头引物处于“Y接头的2个分叉单链上,序列与接头一样,只有与特异引物引导合成了接头的互补序列后,接头引物才能 退火参与扩增,流程如图4。方卫国等尝试将YADE法引入到昆虫病原真菌的分子生物学研究,并 取得了成功,建立了适合于球狗白俯菌和金龟子绿俯菌YADE体系。在已克隆的类球狗白俗菌类枯草杆菌蛋白酶基因CDEP-1的基础上,利用YADE法,克隆到该基因的启动子 C

56、DEPPo先酶切球狗白俗菌基因组DNA ,然后与“Y形接头相连,取连接产物做 模板,先以基因特异引物1做线性扩增,再以线性扩增产物为模板,以 接头引物和基因特异引物2做指数扩增,只有当线性扩增时合成了含有 接头引物的互补单链,接头引物才能与其发生退火,参与指数扩增,从而有效防止了接头引物的单引物扩增。最后得PCR产物,进行序列分析确定为CDEP-1的上游启动子序列。在应用YADE法时,内切酶的选择至关重要。好的内切酶产生适合 PCR 扩增的片段,太大太小都不行。为了得到合适的内切酶,需要从众多的 内切酶中筛选。研究表明,不同的物种有自己合适的内切酶。YADE法延伸的起始片段可以是基因组 DNA

57、片段,也可以是cDNA片段,在延 伸cDNA片段时,设计的引物需要避开内含子和外显子的边界,在内含子的位置未知的情况下,可考虑多合成12条特异引物,以提高扩增未知片段的机率。该方法假阳性低、效率高,理论上能扩出所有目的片 段。1.6 TA1L-PCR很早就有用随机引物的PCR,但由于无法有效地控制由随机引物引发的 非特异产物的产生,所以一直未能广泛应用。近年来由IJiu等设计的TAIL-PCR(Terma1 Asymmetric Interlaced PCR)又叫热不对称交错 PCR, 则解决了这个问题,后来有研究表明,经改良过的TAIL-PCR成功地从 突变体中克隆到外源插入基因的旁侧序列,

58、从而为启动子的克隆提供了 有效的新方法。在利用特异引物和随机引物进行 PCR中一般有3种产物生成:(1)由特 异性引物和简并引物扩增出的产物;(2)由同一特异性弓l物扩增出的产 物;(3)由同一简并引物扩增出的产物。在 TAIL-PCR反应中,其中后2 种目标产物可以通过以嵌套的特异性引物进行的后续反应来消除。TAIL-PCR的基本原理是利用目标序列旁的已知序列设计3个嵌套的特异性引物(specialprimer,简称sp1, sp2, sp3, 2勺20bp),用它们分别和1个具有低Tm值的短的随机简并引物(Arbitrarydegenerate prime, AD, 约14bp)相组合,以基因组DNA为模板.根据引物的长短和特异性的差 异设计不对称的温度循环,通过分级反应来扩增特异引物(流程如图5所示)。TAIL-PCR共分3次反应。第一次反应包括5次高特异性、1次低特异、 10次较低特异性反应和12个热不对称的超级循环。5次高特异性反应, 使sp1与已知的序列退火并延伸,增加了目标序列的浓度;1次低特异性的反应使简并引物结合到较多的目标序列上;10次较低特异性反应使 2种引物均与模板退火,随后进行12次超级循环。经上述反应得到了不 同浓度的3种类型产物:特异性产物 等型和非特异性产物(I型和m型)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论