基因启动子分析_第1页
基因启动子分析_第2页
基因启动子分析_第3页
基因启动子分析_第4页
基因启动子分析_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基因启动子分析一:克隆目的基因基本启动子序列我们都知道,基因的基本启动子一般是在基因转录起始位点上游,当一个基因在没 有确定其转录起始位点的时候,我们假定NCB止提交的序列就是他的完整转录本, 那么他的第一个碱基就是他的转录起始位点。而基因的基本启动子一般就是在转录起始位点的上游2000b左右和下游200b|左右,当然,这个是一般情况,具体问题还 要具体分析.尤其现在发现一般的基因都是有几个转录起始位点的 我们通过该基因mRN序列和基因组序列BLAST就能够在染色体上找到这段基因组 序列。我这里用huma的AGGFS因做个例子给大家具体演示一下.1首先需要在NCB里面查找到AGGFS因的mRN

2、序列,这个我想大家都应该很清楚, 如下图.Lri/qsr. eyi: c d itq" rrVG 3QTr/g皀二皀_£苧1:口:'3“它左益二匚-" / ff e * &G=rrc H 7 “-e = z - ty.= " z Z 2 2 i : n /cene my二:二二J三 qW L rr / ge 口c 口 yra= TrU5 = 137Lrpg且g'ctcttcx ggcctctggt611211B124130136121481541 gaaacfcaaca601 ggqag且h臣匸廿661 tggtcaatcl;72

3、1 号匸 gHUtg 比 he: 7B1 gaccattuac811 tatagacaq901 gagataact961 gccqtatcac 1021 accggtccec 1091 tactatrtg 1141 tatccgactt 1201 ccagattctt 1261 agtgxtgaac 1321 aaataggca 13S1 aetatzag&gtagctaaggcg gaaggtggag gggagarcga gaagctgrtgtagtuatgar tgaaaatca且tggTcgTtatacraaagtaaatgaggaaaag caatgaggaaaaatagtc

4、cc tga&aacatccttatccgac rccgrtcgc cgagcccg agccgggtgl: CQtCCIjtttC acggcctcgg gagctggacc cggcaggcgc gctcctccct aggccgcgca ttcggcracH gaggctgcct ggccrtgaacg aggcgccgtcaccaggagct aagata且匸且h u曰gpt匸且ttt tgtzcag 且 tua aagtagaaaa tggaccattv ccttagaagg iigactgqart attatg且匸tu atgtgg且a旦口 ctagcacaaa ctgca

5、acaaa atacaagctg ttcatcAcaa crcctcttca ctgtctctgt caccgggeag agtgagt匸tu ttogctgacc cagcccctcc accgccgcg?ccgcacgeag aaagtctgat ZaZcagacg aca agate: aa tgargett ac tgcGLcaaat ctcAcatta agetggagaa ggq-ccatccr agg-getcar gcgcgatcca gegtjegaega tcg'ccgccgc aag-ttggaac cat cac acaq gtQaaq&ac gtaga

6、agtac tauthu吕日匸口 get at:cgaad cct ggt accg tcacaggagc getgaaagtt gaa.aat actq ctetattatg cag'tttcatt gat aaa aaar gatttaacx gaaaatttcq cccaaagtcA teta&rtcaa ggtagtttcc cggteeccrt ggee 且 ggggc: gtggtctctg gcacj 七 ctcgc ctjcccacctc gtgaactgcg aaeggetgra tcagtaaaat aaacagagaa aegttagtet cttctat

7、ttt atagaacaga GagGatctQG tgagagctgc gactgtatrt atcctcccac ctcgagtaga tzgaagaagaa cagaggatca caaatatgaa ctgttccaac catcatttaaaggaaagttr gcccgttgcc caacgcggcc ggtccgccgg (jeegga get; c ccccgagcct ga?ctgcaag cc&gaacgca actccaacgc ecatgctcct ccaaaraaa gaattetaaa aaatgttaaa. atuacaaca. ageagaageg tg

8、accacagc eggaat teat tttgcaacct aagaaa a.gat aaaageette aaagaaggee tatggaaau agatg&ga&a2然后就是用这段mRN序列和人类的基因组序列BLASTBLAST Assembled GenomesChoose a species genome to search, “list all qenomic: BLAST UdtehESESi° hhimHn° Rat口 Zl jaBFMogZs tha阳 ns口 0爭阳囱掉啊 Egg 恰甘口 Dneio 用Ho DrosoZ伽播它翠st赴

9、f3 BLAST!到了很多结果,我们往往选择最上面那个最匹配的结果v DescriptionsSeqtierLees produjcing signiflcane aligmients!il.N.Tii_pu£2 .匸_.!£ LH.s5_£07.a 甘心论 sapiens eKrretues&me 5 genemit t.- it已十 i 川叫丄|3任衣95丄-1 Hm£iAJGaj44 M 6Acimcj m皑pij色n吕巴hrdatomM皀月?色.- 疋色唱 I1 IHmCr aAADElZl_224 H&Wia sapiens c

10、hrahiGSontie 5.工已 f MT_口丁25,丄3 I He 1. U_1了951 Hctno sapiens chr omosaiine ID genomi. i:mf I NV厂92宓4.1 |HmCaADEu7_44 Homo sapiens chramosome 12 ge._ 工已f I NM”_00IE 41J.ME - 1 IHsUn_W盟MM 13£ Homo sapiens genomic conti.BapiEiis chronio30lne 4 geiiaatiic . Homo sapiens chrom口口口!亡 3 ge.sapiens chro

11、niogcme 3 genoati:Lc Homo 辭I 丽DU 14127?.丄专6耳匸f I NV厂口0边肛竹7: 1心白盯阳人阳山二皀f LTT,D2292,1了1 H$4 2 2©4合 Homo工亡f I 盼匚口01*3£!878 -16工亡fI MT。?理59 14 I盲HomoI 时应 口 511丨日日吕1J 6piena chromosonis 3 gun* * EtQing sapXens genomic; *耳口ipo sapXens 融un口口outXi * Hamoref丽 933173.1HsC匚aAHpB匸 3 64 Homo sapi.en3 c

12、hramosame 6 cren,-refNT 02477.11 Hsl 6 2929 Homo sapiens chraniosome 16 qewnd. -工巴f I NW jjg:L8 38 28电阳丸 1(358chrcnnoscnie 16 ,-Hom sapiens chrcmQsonie 1 genomic u* Homo apxetis chrmcsanne 1 牙已门* Hoibo sapiens g hr emo some 1 ge no h “f I 丽工22口33 +1 I 曰sS aAADBCiE二 16L3 Homo sapiens genoini.c ccnt&#

13、177;g? ” .工讥丨MT_CJ329了九日I吊1_盟133工建fl価口CJ18_3857g* 2 I豆导1_诟人3工_3E 工言£| 丽号2 13jl +1 |日吕CraADBClE4点击之后就可以看到下图,这个基因的14个外显子和13个内含子在5号染色体上 的位置一目了然,第一个外显子在上面,说明这个基因在染色体上是正向的,基本 启动子就应该在第一外显子上面,我用红色的方框标明了。FTPDsbAs lacie view 時M 氏 Opt MillsCorr prees Map M ftecp on Shhnwn.三一gF一5E- F K 1 1 qf II召 r«&

14、gt;i+T L L±4a 2 Avofl-O tn- flqq 9 r- 1 fl 1 M ?;££ w盟 Lv?1IBLithtI<tiiuty-W I 573Elast Etkleiiht尸蛍3囑 56S. tEUBlast hitTndt7=10r,% fi?1 FT?BhEthitI妇血y 】Q0% E75. 1012Blast Litkleiiht尸:0两 IU42 1231Blast hitM=n 陀L购轴 1229 1565Blast hitLJenhty= 10 0R4i15601673Bkst hitI<knai7=10C%1217

15、25El如hi【l<leiiaty00%17221827Blast hitl-_lenht7= ) 0 Cfi4i1E261的HEhst hi:陆ndg?涌19fl7亦BLschiI<lcnaty=9920712204Blast hitl-_lenhty= ) 023D4Blast hitI灰nd旷北口心2304侮5大家有没有注意到左上方有个数据框,我把数值改为76,360K到76,362.200 , 刚好2200BP包括了第一个外显子的前200B左右.然后点击红色框标明的Dow nload/view seque nee.K 的 ion siown:fa g 或 k tJen毡尸

16、100% L.573Siimmairy of Maps ;Map I; Abehq 'febTabR VkwDisplayed- 76|360K'76,362p200 bjj DownloadN/iew Sumicnc e/E駅, eTxa mo拒七 CM Chromxotne; 351? 7 aOI-mtwiris Labeled: 2 Total models in Region 2、血p 2: KefSeq Tramcwtc 'On SeqjenDe血企页级T.flki IDisf.7K餐(1広:&鮎7?7fin hp Tx讪TVif 如卄-1 - d T

17、oiad RrfS eq enpts On Chromo£om«: 1455 f3 notl0:ak:edTrarwctipfe Labeled: 1 Tot 就 B.ef5eq Trsn senpts 曲 Reon: 16然后就到了这个界面,Sequenee Format选择GenBank,然后点击Display.就 得到我们所需要的序列了.ihunian.i (Build 36.3)Chrcmio sotnt.:idhist b-/:from 763S0000OKStrand, plusto: G362200adjust bvj40KChange R&gion&

18、#39;'Str-andRecoil to retriex'e "in chromo some coordinates'):Fomiat G&nBank_ *This chromosome region corresponds to the contig region(s):Conristart stop strandXT_ijij6-1 3.1- 2691 >602 26i?2'j£Ci2- Eigplay1 Sav亡 to Disk I'iew Evidence IadeIXIaker7这里我们可以看到1989到22

19、01是AGGF的mRN序列,说明我们的确找到了该基因 5'非翻译区的上游启动子序列.建议将这2200bpS克隆下来,上乞二亡=”蛊匚兰三二”丿匚段百unit: factor wlh G pacch and FH demais/excepticnnUD31as3LfieddisGrEpaEGy"/n3e= rrDerved by auu=r:aed =u:rjp'匸&二二nn也二 analysu gene predretror met?:ad: BestRefseq. 5'jppcrzisc evidence 虫二ir二丄总上二uy ro i 1 riJ

20、mTL11.nranscript_id=Z _EC6. £rhf业_乂二士h書三:4总亍虽莎厂55L:'9r,/ dtK ref="?Z 3NC:空”/dbx石百r,CRZGIUascatrca-£61121181tectaaraacacGGc©匸匸二匚二吉匸注注 gaccctract Ci二艮匚己二匸己二utyccagagca301361421481=:-ccadcca&netc匸匸DUN己己acaaaacacazgzczctctt;(jnr;nr;ftT,mcacxtgagg aas.aa.acstag ctcxtgttca eecr

21、cacacagaa_ccccdcd aaai/Laa&tcc匸匸比乙匸t匸UCD匸二匸匕注螢二匚EG cauBacacca 阴匸 QgggG ggttatccccuxggt匚匚昌ea-atsrsLa 匸匚Eg二t二己己a. acaaaccac aacagggatg总匸ccrGcaatat,. atgciLgciCtG atggxcaggggcatttacgg c&"cracac&a*t =ta.i3i*era二己匕匸iggc己己己ctcctt-ttgcccatccacr t eq匚匸grerge agaccccaga ggccaccqat aactcctct

22、ccactc&oetert-geaaacgactcagacrsr.fli a以上的步骤就是基因基本启动子的查找,其实还有很多调控序列是在基因内含子区 域或者是基因的3'非翻译区等,序列查找的步骤和上面是一样的.8还有一个方法更加简单,那就是用AGGF的前60bp序列和nucleotide数据库 BLAST,以得到该序列在染色体上的位置,需要注意的是,如果是反向的序列的话, 我们就要选择反向互补的序列Basic BLASTChoose a BLAST program to runnucleotide blast Search a nucleotideusing a nucleod

23、de query| Algonthms: blastn. nnegab-last. disccntiguous megabla&trotejn h|ast Search protein database using a protein quoryAlgonthms: blsstp psi-blasl, phi-blastiPubMedMudHlidcProteiniGerwmeSearchNucleotideVforGo丄与页Display| GenBankvShov5v Send to7 Hide- sequence 口allbui aene. CD's and iniR2&

24、lt;/Range: fivm 16 370 649to|26 570 543ShoiY -.vhole sequence| Rt'Fers# contplfDienifd s二:软件预测顺式作用元件,做点突变分析得到这些序列后,克隆进没有启动子载体pGL或者pTAL-luc中去,转染细胞,测定 荧光活性,如果有很强的活性,那么说明你已经成功克隆到了该基因的基本启动子. 然后可以通过5 '非翻译区一系列的缺失突变,不断把范围缩小,找到哪一段序列对 于该基因的启动子活性是必须的或者是最重要的。当找到这个比较核心的启动子序列后,可以通过一些在线的软件去预测其顺式作用 元件的位点,每

25、个在线软件都有自己独特的算法分析,得到的结果并不都是可靠的, 每个软件都有自己的优势,需要多综合一些软件预测的结果,并通过分析预测出来 的转录因子是不是和该基因有功能上的联系等做进一步的选择,继续做下面的验证实验。下面这两个有商业化的软件:http:/www.ge no matix.de/http:/www.ge ne-regulatio nsfac下面这两个是免费:http:/www.cbrc.jp/research/db/TFSEARCH.htmlhttp:/www.cbil.upe nn. edu/cgi-b in /tess/tess用TES举个列,直接在首页下面的方框里输入你要分析的

26、序列就可以了Try a qukk torch with the d»f«ult oaramtttrfJntj T1U*:.-2z jvbich <-Search DNA for BindingITSS also lees you search rirough your own sequence for TFBS You caniMlud总 ycur owfl at CDfisefKiE anrtgs diKi'oi weight m&ti ccs in Uw 轮uuh lLu Im Combined S««rch iiridw &#

27、39;Site S恫diw' iz ihf nbow w u-f? iif nHf r I叭 cm;如沏cnESS assigns a FESS job - umbeT t al seqw&nce search job石 The fib results are stored oft cur 昭 wr for s per od M jiix? spccficd in ihe scajcli subml him. Durr>g ill匕 time tfOu tnsh 搐附us ng mg 101m on this pH>TESS can also email r&siAs iq you as a t-nelmiied file 5Lii;ab m fc' loa山 ng ntc a spreadsheet projrim同样在首页,通过下面的方框,你可以查找一些转录因子的相关信息.Query for Transcription Factor InfoTESS also has data browsing and querying CBpabih

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论