查找启动子区ppt课件.ppt_第1页
查找启动子区ppt课件.ppt_第2页
查找启动子区ppt课件.ppt_第3页
查找启动子区ppt课件.ppt_第4页
查找启动子区ppt课件.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、如何判断序列的正反向,NCBI里的序列,mRNA,CDS序列等等,都标注的很清楚,只是有的基因序列给的是反向互补的序列,需要大家在primer5等软件里转换一下。 具体看是不是反向互补的序列,办法就是看在第一个CDS区的前三个碱基是不是ATG,如果是ATG,那么这个序列就是你要的了,如果不是,那八成就是你要得序列的反向互补序列了,1,目的: 寻找promoter区域 预测核心启动子区,2,寻找promoter区域,用NCBI:/ 用UCSC:/ 用Ensembl:http:/www.ensem

2、/index.html 用公司信息(只包含公司拥有promoter clones的信息): http:/ (*种类比较少) 用SIB-EPD: http:/www.epd.isb-sib.ch/ (可直接提供TSS,但是库容较小,很多基因查不到) 预测核心启动子区,3,NCBI数据库,4,寻找promoter区域,NCBI /pubmed/ 选择Gene, 输入ankh,点击search 选择第一项,以人类Homo sapiens的ANKH为例; Chromosome 5 location 14704909-14871887, c

3、omplement(反义链)即-14871887 到 -14704909为基因范围 此例中选取-14873887 到-14871887 约2000bp核苷酸序列作为启动子区域,5,选择Ensembl或者HGNC_,进入ensembl分析,寻找promoter区域,6,寻找promoter区域,图形显示,FASTA格式显示的核苷酸序列,输入序列可以查询染色体位置,ANKH gene在反义链上,所以用负数表示,可以查询具体核苷酸序列,Genomic context 点击Graphics-Tools-Sequece Text View,7,寻找promoter区域,点击Go To Position,

4、 输入-14873887,点击Prev Page找到具体位置 复制白底黑色区域即为promoter区域,白底黑字为启动子区域,紫底黑字为基因区域,粉底黑字为编码区,ATG为启示密码子,8,寻找promoter区域,在前两张幻灯片中选择FASTA 在右边Change region shown输入14871887到14873887 Display options选择Show reverse complement 可以直接得到FASTA格式的promoter核苷酸序列(似乎有一个bp的差距,可以输入14871887到14873886,可以选择展示反向互补序列,9,1. 选择基因示意图: 1).向下查

5、看“Genomic regions, transcripts and products” 2). 将鼠标放在Genes的”NR_”示意图上, 3). 在弹出的窗口中点击 2. 点击”FASTA View,序列范围表示NR_的位置。 出现该基因的实际序列,第一个序列的位置表示“起始位置” 3. 调整显示位置:将起始位点先前排1000bp,向后排1000bp。 更改后的位置认为是启动子区,10,UCSC数据库,11,寻找promoter区域,UCSC / 选择左侧边栏的“Table Browser” 在clade选择Mammal,genome选择H

6、uman,assmebly选择最新的数据库, 在position后面的搜索框内写入待查的基因名称,如actin。 点击get output,方法一,12,寻找promoter区域,出现一系列候选序列。当搜索用词不特异的时候会出来太多的结果,只显示500条,13,寻找promoter区域,点击自己目的基因的结果链接,会出现该基因在染色体上的位置 (有时候会直接跳到选择genome,protein,mRNA那一页面,可能是在搜索词比较特异的情况写), 继续 getout put 选择 genome,14,寻找promoter区域,选择Promoter/Upstream by 2000 bases

7、Exons in upper case, everything else in lower case:外显子大写,其他小写,15,寻找promoter区域,小写字母为promoter区域,大写字母为基因区域,与NCBI结果相同,ATG为CDS区起始密码子,16,寻找promoter区域,promoter/upstream前面的框中打勾,一般的启动子长度大约为2kb左右,这个数字可以修改。 为便于观察,可继续修改下面的几个选项。这里选择CDS大写。 点击get sequence即可得到结果,17,寻找promoter区域,UTR和upstream是分开的,CDS是大写的,可以看到起始码。Copy

8、 ATG以前的序列进行启动子分析。PCR以genome为模板,18,寻找promoter区域,UCSC /,点击左侧边栏的“Genome Browser,方法二,19,寻找promoter区域,以大鼠(rattus orvegicus)的结缔组织生长因子(CTGF)为例, 在Organism的下拉菜单中选择Rat,在assembly的下拉菜单中选择最新日期Nov.2004,在position框中键入CTGF,image width选择默认即可,如下图所示: 点击 Submit,20,寻找promoter区域,结果显示该基因的已知序列和相关mRN

9、A序列, 点击“Known Gene”中的第一个序列,21,寻找promoter区域,出现包含这序列的图解概要 为了获得这个区域更清晰的图像,可以点击紧靠zoom out的1.5X按钮,如下图: 对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5端和3端非翻译区。起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示,22,寻找promoter区域,本例的搜寻目的来说,默认设置不是理想的设置。 按照视图利用页面底部的Track Controls按钮,将一些路径设置为hide模式(即不显示),其

10、他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300,23,寻找promoter区域,Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较。若查询启动子区域,我们需要将Ensembl Genes选择为dense 或full模式,点击Refresh,即刷新,出现下图: 图中多出了Ensembl Genes的预测路径,我们在红框中圈出。点击用于表达该序列的任何方块出现以下页面,24,寻找promoter区域,点击红框中的条形深色方块(不是Ensembl Genes文字,25,寻找promoter区域,选择

11、并点击Link to sequence中的Genomic Sequence,即显示基因组序列,26,寻找promoter区域,将promoter改为2000bp,具体多少bp合适,可根据文献资料和实验目的获取,有的基因可能在其上游戏几百bp就可以了,其他的几个选项分别为5端非编码区,编码区外显子,3端非编码区,内含子(内含子用绿框圈了起来)等。 Sequence Formatting Options序列显示方式,选择上图红框里的内容,即外显子大写,其余的小写,也就是说mRNA的外显子大写,其余上下游非编码区以及内含子均为小写,27,寻找promoter区域,第一个大写字母以后就是mRNA序列,

12、之前的小写字母序列即为启动子区域了,28,第一个大写字母以后就是mRNA序列,但该序列包含外显子和内含子,是未经剪切修饰的mRNA, 图中两段大写字母中间的小写字母便为内含了序列,寻找promoter区域,29,Ensemble数据库,30,寻找promoter区域,Ensembl:/index.html 选择human 输入 ankh 选择Gene,点击 GeneID ENSG00000154122 点击左边的Export data,方法一,31,寻找promoter区域,5 Flanking sequence 输入2000 Options for

13、FASTA sequence中Genomic选5 Flanking sequence, deselect all 点击Next(不管正反此法都适用,32,寻找promoter区域,得到2000 bases 的核苷酸序列,33,寻找promoter区域,Ensembl:/index.html 在“Search Ensembl“标题下search后的下拉框中选中物种名homo sapiens(人),for框中输入基因名ankh,点击Go,方法二,34,寻找promoter区域,找到所需要的gene,点击 出来2个结果。本例中貌似是同一个。点击相应链接进入新

14、页面,35,寻找promoter区域,貌似有2个不同的转录本。点击Exon Info,36,寻找promoter区域,新页面中即可看到5 upstream sequence。可以在Flanking sequence at either end of transcript后面的框中修改期望显示的序列长度。一般启动子最好选2kb。然后copy所显示的上游序列进行分析,37,Genecopoeia公司,38,寻找promoter区域,http:/ 点击search product, 选择promoter clones,因为没有ANKH的信息,此处输入FIBRONECTIN 选择目的基因,39,寻找p

15、romoter区域,点击click here to view the promoter sequence 得到promoter信息,40,EPD数据库,41,寻找promoter区域,SIB-EPD 网址:http:/www.epd.isb-sib.ch/ 具体使用方法大同小异,就是输入物种名、基因名,限定启动子序列区域,42,预测 核心启动子区,43,Transcript start site (TSS) 附近-60bp到+40bp是核心启动子区,是精确转录必须的最小单元。 CpG岛是一段200 bp 或更长的DNA 序列,核苷酸G+C 的含量较高,并且CpG双核苷酸的出现频率占G+ C 含

16、量的50%以上。许多脊椎动物的启动子区都与CpG岛的位置重合,44,常见的在线预测工具有: 真核启动子数据库第85版(The Eukaryotic Promoter Database Current Release 85 ,EPD,http:/www.epd.isb-sib.ch/ )http:/epd.vital-it.ch/ 转录起始位点数据库:http:/dbtss.hgc.jp/ 该数据库主要包括人,小鼠等常见生物的基因转录起始位点及该基因启动子的可能情况。 Promoter scan (/molbio/proscan/ ), Promo

17、ter2.0 Prediction Server (http:/www.cbs.dtu.dk/services/promoter/ ) 神经网络启动子预测器 NNPP(/seq_tools/promoter.html ) Soft Berry (http:/ ) Dragon Promoter Finder (.sg/promoter )(好像不能用了,45,FirstEF (/tools/FirstEF/ ) UROGENE (http:/www.ur

18、/methprimer/ ),可用于位点甲基化的预测 CpGPlot/CpGReport/Isochore (http:/www.ebi.ac.uk/emboss/cpgplot/)CpGProD (http:/pbil.univ-lyon1.fr/software/cpgprod_query.html)CpG Island Searcher (http:/ Prediction (http:/www.ualberta.ca/stothard/jaascript/cpg_islands.html,CpG岛预测软件,46,1、获取目的基因的mRNA序列,并且在NCBI的数据库中查获转录起始点;2、截取转录起始

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论