启动子生物信息学分析软件_第1页
启动子生物信息学分析软件_第2页
启动子生物信息学分析软件_第3页
启动子生物信息学分析软件_第4页
启动子生物信息学分析软件_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.PromoterPrediction/seq_tools/promoter.htmlPlantCARE(plantcis-actingregulatoryelements),adatabaseofplantcis-actingregulatoryelements HYPERLINK http:/bioinformatics.psb.ugent.be/webtools/p http:/bioinformatics.psb.ugent.be/webtools/plantcare/html/3.promoter2.0predictionserver HYPERLINK http:/www.cbs

2、.dtu.dk/services/Promoter/ http:/www.cbs.dtu.dk/services/Promoter/4.启动子分析网址: HYPERLINK /seq_tools/promoter.html /seq_tools/promoter.html HYPERLINK http:/alggen.lsi.upc.es/recerca/menu_recerca.html http:/alggen.lsi.upc.es/recerca/menu_recerca.html HYPERLINK http:/www.cbs.dtu.dk/services/Promoter/ htt

3、p:/www.cbs.dtu.dk/services/Promoter/ HYPERLINK /molb470/ /molb470/.s/solorz/index.html HYPERLINK /molbio/proscan/http:/bip.weizmann.ac.il/toolbo /molbio/proscan/http:/bip.weizmann.ac.il/toolbo.ters.html#databases HYPERLINK /seq_tools/promoter.html.sg/promoter/CGrich1_0/CGRICH.htm /seq_tools/promoter

4、.html.sg/promoter/CGrich1_0/CGRICH.htm HYPERLINK /pub/programs.html%23pmatch.hk/b400559/arraysoft_pathway.html%23Promoter /pub/programs.html#pmatch.hk/b400559/arraysoft_pathway.html#Promoter HYPERLINK http:/www.dna.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/ http:/www.dna

5、.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/ HYPERLINK http:/www.cbs.dtu.dk/services/Promoter/ http:/www.cbs.dtu.dk/services/Promoter/ HYPERLINK /molbio/proscan/ /molbio/proscan/ HYPERLINK /molbio/signal/ /molbio/signal/ HYPERLINK /thread-41571-1-1.htm /thread-41571-1-1.h

6、tm常用启动子分析网址: HYPERLINK http:/bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html%23databas http:/bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databases HYPERLINK /seq_tools/promoter.html /seq_tools/promoter.html HYPERLINK .sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-regulation.eom/pu

7、b/programs.html%23pmatch .sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-regulation.eom/pub/programs.html#pmatch HYPERLINK .hk/b400559/arraysoft_pathway.html%23Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.html .hk/b400559/arraysoft_pathway.html#Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.ht

8、ml HYPERLINK http:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/services/Promoter/ http:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/services/Promoter/ HYPERLINK /molbio/proscan/ /molbio/proscan/ HYPERLINK /molbio/signal/ /molbio/signal/首先就是想直接查找有没有人做过这条基因的启动子,在pubmed中输入genename

9、+promoter接着就想看看有没有数据库可以直接给出启动子序列的,很幸运竟然发现一个极好的启动子搜索讲义网站,如下, HYPERLINK .il/workshops/bgu/promoterworkshop.html .il/workshops/bgu/promoterworkshop.html第一步就是要找到基因确定基因所在基因组区域,其中列出很多网站,不过偶还是习惯genbank,在gene栏中search某个基因,不要搞错基因种属!进入后即可看到该基因的详细条目,别眼花,就点击右侧link栏的Mapviewer链接,进入即可看到该基因在染色体上的形象定位,鼠标悬停在基因的起始位点时,即

10、可在浏览器下方的状态栏中显示该位点在染色体上的明确定位,比如110997788,结合给出的基因跨度,比如110778899-117708899,即可大概确定该启动子在基因组中的大概定位,即110778899-110997788;第二步搞清楚基因组状态,我没搞太清楚,不过其中给的一个链接来查出启动子所在克隆(查出克隆号可以购买) HYPERLINK /genome/guide/mouse/ /genome/guide/mouse/该链接中的clonefinder工具可以做到,只要提交你要查找的基因officialname就可以返回一个clonelist;第三步搜索启动子,其中可以用启动子数据库和

11、启动子预测软件,当然如果启动子数据库中有最好,但很失望给出的数据库均不能查到!只好用启动子预测软件,使用了几个在线预测工具后觉得下面这个速度贼快,推荐 HYPERLINK http:/www.cbs.dtu.dk/services/Promoter/ http:/www.cbs.dtu.dk/services/Promoter/我把该基因的dna序列submit之后返回了很多个PolII识别位点,到底哪个是呢?我个人理解启动子应该是翻译起始位点附近,所以在这个dna序列中定位翻译起始位点即可找到最近的Highlylikelyprediction,那么怎么定位呢?利用blast2这个利器,只要把

12、dna和mrna序列粘贴进去提交就ok,正好在翻译起始位点上游几百bp有个识别位点,ok!启动子序列就是翻译起始位点上游大概1kb长度的序列了!直接用ensemble数据库的话,可以直接知道基因外显子和起始位点的位置,然后直接可以查到之前的序列,再选3k-4k的长度预测就比较方便了。启动子及转录因子结合位点数据库及预测工具转载CL弐忖户心血衣赴沪bLilPROMOTERFINDINGANDANALYSISPROGRAMSONTHEINTERNET忽然感觉很GUILTY的,BLOG里竟然不放一点点和研究有关的重要工具。换了电脑之后才发现,很多有用的链接都没有COPY下来,于是,从头开始做吧。这是

13、Andrew给我的他的PAPER里的有关转录因子结合位点的数据库,还有其他网友整理的,都很有用,这个星期有空再核下几个重要基因的SNP。也IB-Ts匚ncmwoi皿|尺电喘昭nloivTuriitkw1中3丨。片詳crii?沖厂FSNP-ftf.:3bl尸Funcdon尸nrtarhili:1$申已自合!jcaJF-SHPli11p_iTsnap.rmirpien.u.iiiUinfl-srrcirmnhisrainanaf-nnbnimededlufHtSin5.rRM!Dai-i.awSrcnSMFy&nprijnE-_a五admjFTiaifltJlegsiteMunipieanahso

14、snrmuiauwr吟uhHumaiLiSfUt-ng冋幵毀Murliplg-rnaryspsnrmuiuonr哄山sn如1匚购tXrSJMPHi俯验创代匸创创跑seof的1*2101*1ssearfcEedSNFsPeMAPreitaaL3co)njatiE归妣e加asift-朗涉備现ls-snp.SmFs3l.splicira.TFBS.?11甌氐16.tJCK-Mt5.-15-Pfliwfcslsrv*苗理:Ghjpw*叭龙也smiartayisuaiajtiFhuintMos/xjw?SHF土mut:-9iri&.riSHP(PwlpPhtTFAE-諒1记詁空riSbf冏F1旳如rti

15、ieHaiLflCnnclalnpofpSNfsCFPJyPIIFas.sp11cknfw仙心站减ErsieDiizstcin.TFC1G:_卑Jc凹?轉PnOmvtKrr.Fplicarim皿址番砖占卜J户吊rjisi?Cd.365,0?33NFT9:an站近E曲fsjalz=3BonofSPIFsowenapFrzg吕nn百IMl补巾合fpraleHn为.slicingQ.K:lrKPSUlkiD.modiHcaflionis:anHF之舲寸虽卫门肓宜ihi訓rmnn鼻nn=amiadcpnori.irilerai-liDfi;5ite&post血日|1旦丸onsnodrfiiiliDrr

16、s.Him-orar.cMBilBfngWCil_3-SHP)TFB3.consertiiMn.srfjc&s-rtpCuGstand.KhyBUQ氐17-lfraN-JnsenennlcMouy.er$lur&HTajrn6retKlmasMrrtahflrtWanE.ngc.Einica_6dU-hMffa&l-iHpiy&SdiipSitSdu.NwfhUp-iVrTiuEhQryi-LirVmuIdbuldovnlaadCaulhiO-rhhfiloioifiro.c1tiiT.enouuunNPemrrziRMATLrrRmLRHqarets.ininwr-Jin礙尽umEM&=in

17、sL尸mmnirrrs岂w尸simbijtrarpredideelpqB.ltsrg&is敕目n凰JaroErtHGaniT.nuriRiiMGlBsPrnmcign口1:1口匚nfpnimnlR,TFBSfeSI-JFs(671輕rg日CUiSSENF3JSNPEsprnm-1DnljizoN口IQcn3EgE&cittDGidENFLii:B3con5tsernptes.EQFBWG:3MF直甜nonftceESNPsiniJrecineelFBS(TrariSfaeF-tftrpgcrsioiicBi-wjocai1宓儿mumrsij:-iSfJIKtiltlla41CIKMTrmb-i

18、KSNs:杆3冲hsj屯醐.lut址范咽轨ik说nm诃滋占I叶酣(Inti?l3wE能即kto.po-c1ora1trEpLH25IInrprDmnt)grL*ri3iinhimlirrlliKiIdillutTMA-550KSNF-hnpUnaciplipgirnarnl-cLiki口iuJ:lg+宙墓媒阳gj痒期Wni汨吐伽do-Anrlc-alirrqp_Uwaneme.hMit.iewENPaLPranwIenTRANSPLORER(TRANScriptionexPLORER)Dnanalyze(TFmapping)DragonPromoterFinder1.2(TSSfinderan

19、dpromoterregionanalysis)FunSiteP2.1HCtata(TATAsignalprediction)McPromoterVer.3MatInspector(SearchforTFbindingsites)ModelGeneratorandModelInspectorNNPP2.1(TSSfinder)PromoterInspector(Strandnon-specificpromoterregionfinder)Promoter2.0(TSSfinder)PromoterScanII(Promoterregionprediction)RGSiteScanSignalS

20、can(SearchforEukaryoticTranscriptionalElements)TESS(SearchforTranscriptionElements)TFSEARCH(PredictsTFbindingsitesbasedonTRANSFACdata)TRANSFAC(TFdatabaseandanumberofassociatedprograms)TSSGandTSSWPROMOTER2.0 HYPERLINK http:/www.cbs.dtu.dk/services/Promoter/ http:/www.cbs.dtu.dk/services/Promoter/通常确定

21、启动子的算法可以分成两种,一种根据启动子区各种转录信号,如TATA盒、CCAAT盒,结合对这些保守信号及信号间保守的空间排列顺序的识别进行预测。如PROMOTER2.0,用神经网络方法确定TATA盒、CCAAT盒、加帽位点(capsite)和GC盒(GCbox)的位置和距离,识别含TATA盒的启动子。PROMOTERSCAN HYPERLINK /molbio/proscan/ /molbio/proscan/根据转录因子结合部位在基因组中分布的不平衡性,将转录因子结合部位分布密度与TATA盒的权重矩阵(weightmatrix)结合起来,从基因组DNA中识别出启动子区3。但上述程序预测的假阳

22、性率较高PROMOTER210每23kb出现一个假阳性;PRO2MOTERSCAN平均每19kb出现一个假阳性。PromoterInspector HYPERLINK http:/www.genomatix.de/products/PromoterInspector/PromoterInspector2.ht http:/www.genomatix.de/products/PromoterInspector/PromoterInspector2.html另一种方法根据启动子区序列的特征进行预测。Promo2terInspector从一组训练序列中提取出启动子区的环境特征,并将外显子、内含子和3

23、端非翻译区的特征与启动子区加以区分,从而在基因组中确定启动子位置FirstEF HYPERLINK /tools/FirstEF/ /tools/FirstEF/近来还有一些程序将上述方法与CpG岛(CpGislands)信息相结合。CpG岛是一段200bp或更长的DNA序列,核苷酸G+C的含量较高,并且CpG双核苷酸的出现频率占G+C含量的50%以上。许多脊椎动物的启动子区都与CpG岛的位置重合。FirstEF(http:/rulailcshllorg/tools/FirstEF/)搜索通过5UTR定位技术构建的第一外显子数据库,识别第一剪切点(firstsplicingdonorsite)

24、,结合CpG岛信息,确定启动子区。这种方法使预测的敏感性和特异性都明显提高。该程序预测含CpG岛的启动子的敏感性和特异性都高于90%,预测不含CpG岛的启动子的精确性相对略低。TRRD数据库 HYPERLINK http:/wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/ http:/wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/收录了真核基因调控区结构和基因表达方式的信息,每个条目对应一个基因。应用权重矩阵数据库搜索转录因子结合部位的程序包括SIGNALSCAN HYPERLINK /molbio/signal/ /molbio/si

25、gnal/MatInspector HYPERLINK http:/www.genomatix.de/products/index.html http:/www.genomatix.de/products/index.html转录因子搜索程序(transcriptionalfactorsearch,TF2SEARCH) HYPERLINK http:/www.cbrc.jp/research/db/TFSEARCH.html http:/www.cbrc.jp/research/db/TFSEARCH.html等等。尽管基于PWM的搜索比较敏感,但它最大的缺点就是假阳性率过高,在预测的结果中有

26、很多结合部位并不真正具有生物学功能。COMPEL数据库 HYPERLINK http:/compel.bionet.nsc.ru/new/index.html http:/compel.bionet.nsc.ru/new/index.html经实验确定的复合元件不多COMPEL数据库中收录了近200条经实验确定的复合元件的信息。如果转录因子结合部位的预测结果中包含复合元件,显然比单个元件更有可能具有生物学功能。Co-Bind程序通过建立两个转录因子结合部位的PWM及其复合作用的模型,可以预测序列中的复合元件。还有一些程序利用COMPEL数据库中已知的复合元件去搜索基因组序列。Consensus

27、/pub/consensus/AlignACE HYPERLINK /cgi-bin/alignace.pl /cgi-bin/alignace.pl等是用来搜索高含量基序(overrepresentedmotiffinding)的一些算法,可以对一组基因簇中的基因调控区进行比较,以发现其中存在的高含量的基序,调控元件可能就存在于这些基序之中摘自tjogzts的BLOG,有些挺好的收录 HYPERLINK /archive.html /archive.html1.NCBI上的FindingPromoter(NCBI推荐的)( HYPERLINK /Class/NAWBIS/Modules/DN

28、A/dna21b.htm /Class/NAWBIS/Modules/DNA/dna21b.htm)PromoterScanfromtheBioinformaticsandMolecularAnalysissectionofNIH.TFSearchfromtheComputationalBiologyResearchCenterofJapan.DRAGONGeneStartFinderfromtheDRAGONGenomeExplorersite.2.Promoter2.0PredictionServer( HYPERLINK http:/www.cbs.dtu.dk/services/Promoter/ http:/www.cbs.dtu.dk/services/Promoter/)Promoter2.0predictstranscriptionstartsitesofvertebratePolIIpromotersinDNAsequences.Ithasbeend

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论