生物信息学题查找新基因_第1页
生物信息学题查找新基因_第2页
生物信息学题查找新基因_第3页
生物信息学题查找新基因_第4页
生物信息学题查找新基因_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、利用BLAST工具寻找新基因单梦冰新基因发现新基因:是指在数据库中发现一些还没有被注释的DNA序列。新基因序列:是指在数据库中已经存在,但在蛋白质水平上还没有完全匹配的基因序列,或者是在蛋白质水平上也有完全匹配的但却来自于另一个物种的基因序列。方法步骤首先从一个已知的蛋白质序列出发,搜索一个DNA数据库;找到尚未注释的、与查询序列相关的序列匹配,得到新发现的基因和对应的蛋白质;采用多种措施来验证匹配结果,证实确实发现了新的基因。举个栗子尿激酶(英语:Urokinase)由肾脏生成,可直接激活纤维蛋白溶酶原转变成纤溶酶。为从尿中提取的第一代天然溶栓药。在NCBI的搜索栏中搜索“Protein”中

2、的“Urokinase ”urokinase, partial Homo sapiens366 aa proteinAccession:AAA61252.1GI:340146GenPeptFASTAGraphicsRelated Sequences回到BLAST主页,选择tblastn,做蛋白质核酸比对输入尿激酶编号,在这里我们选择HTGS,当然也可以选择EST什么的按下这个按钮开始搜索。这需要时间这里是消息显示框,当鼠标放在坐标下的横线上,会显示代表的hit的信息颜色比例尺,代表hit的得分(score)区间,可以简单的理解为红色的线表示有较好的比对结果输入序列的坐标每一条线段代表一个hit

3、,在线段上点击,会链接到该hit详细的比对信息部分。这些匹配的蛋白质可能:在一些数据库中得到的结果完全匹配或者几乎完全匹配。这就不是新基因了。一些数据库的结果也非常匹配,而该数据库中编码这些蛋白质的DNA还没有被注释过。这种情况可能是新基因。一些搜索结果并不是非常匹配。这就需要依赖经验来判断哪些数据库中的匹配是真正的匹配,哪些不是。选择Drosophila melanogaster,Sequence ID: gb|AC018145.1|AC018145黑腹果蝇的基因组用数据库搜索来判断它是否是真的新蛋白质将Alignments(比对信息)中出现的序列(红色标出部分)作为输入项在一个非冗余(nr

4、)数据库中逐一进行BLASTP搜索。回到主页在此页面中用“页面查找”功能(Ctrl+F),看页面中是否有属于Drosophila melanogaster(黑腹果蝇的基因组)的蛋白。结果显示“未找到”。结果表明它和其它一些蛋白质相当近源,但它在GenBank数据库中还没有被注释过。.对于新基因的寻找,首要是在于起始蛋白的选择。选得不好,可能在尝试许多次之后,发现自己仍不能找到新的基因。为此,选择最新一期杂志文章上公布出来的某种蛋白,或者某种病毒,可能更易成功。熟悉NCBI网站上的几种BLAST检索比对工具,理解搜索结果的统计学意义以及预测的可信度等,也能帮助加快搜索速度。但鉴于不同网站提供同一

5、类型的服务时,基于不同的实现方法,且这些方法大都根据不同的数据集构造并测试,我们很难客观地评判各种方法的优劣。因此,只使用一种特定的方法有许多不利之处,遵循统计学的“平均结果优于单一选择”这一原则,可以综合各种方法以提高结果的鲁棒性和可信性。由此,可以将我们寻找得到的新基因,到欧洲分子生物学实验室(EMBL)的EBI数据库进行FASTA检索比对,能够进一步地确认我们所找到的基因序列是否是一条新的基因序列。 .实际上,对于一个未知的基因序列,鉴定是否是个新基因序列,几乎所有的BLAST工具都可以做到。但不同的BLAST工具在使用时,仍然有侧重点。就核苷酸序列而言,由于标准的BLAST工具采用的缺省“段”字长要比megablast小,因此在搜索相似性时更敏感,换句话说,如果搜索的目的侧重于相似性,那么应该使用blastn工具。而megablast更适用于较长序列的鉴定,它的好处在于速度较快。 .大多数情况下,按照BLAST的默认参数进行相似性的搜索能够获得较为理性的结果。但仍有必要通过改变一些参数以适应不同的需求。例如使用氨基酸替代矩阵BLOSUM来寻找亲缘关系较远的序列,或者通过改变字长大小,来改变BLAS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论