第八章序列注释及提交_第1页
第八章序列注释及提交_第2页
第八章序列注释及提交_第3页
第八章序列注释及提交_第4页
第八章序列注释及提交_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chapter8MetabolismPathway,

GeneAnnotationandSubmission

第八章代谢途径、基因注释及提交Unit1MetabolismPathway

代谢途径分析数据库信息组织KEGG(45.0版,2008年1月)包括了700个以上物种的代谢、信号转导、基因调控、细胞过程的通路。BioCyc(11.6版,2008年1月)包括了260个物种的代谢通路及基因组数据,其中包括详细注释的大肠杆菌(E.coli)相关信息的数据库EcoCyc。PUMA2(2008年1月)存放了预先计算的超过200个物种的代谢通路信息。BioSilico整合信息的数据库,提供对多个代谢数据库的访问。常用的代谢数据库KEGG(京都基因与基因组百科全书)是基因组破译方面的数据库。KEGG提供了Java的图形工具来访问基因组图谱,比较基因组图谱和操作表达图谱,以及其它序列比较、图形比较和通路计算的工具,可以免费获取。KEGG的网址是:http://www.genome.ad.jp/kegg/KEGG数据库基因名称输出结果(Description,Module,Reference,Relatedpathwayetc.)点击放大图片后可以随意查看路径中的每一个酶在代谢中的位置。Unit2Annotation基因注释1.碱基组成分析:

C+G含量分析,CG偏离度分析2.密码子偏嗜使用分析:

不同物种编码同一氨基酸时对密码子 使用的偏嗜性不同。3.开放阅读框鉴定:

openreadingframe,ORF4.编码序列鉴定

基因组注释内容

5.特殊功能序列鉴定:

结构特征、特殊序列等,利用计算机软件及相应网站等进行鉴定6.同源性基因检索:

Blast7.直系同源蛋白聚类(COG)分析:

全基因组对全基因组比较Unit3Submission

序列提交测序工作者可以把自己工作中获得的新序列提交给NCBI,添加到Genbank数据库。这个任务可以由基于Web界面的BankIt或独立程序Sequin来完成。BankIt是一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。BankIt适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列。EST序列和GSS序列也不应用BankIt提交。大量的序列提交可以由Sequin程序完成。Sequin程序能方便的编辑和处理复杂注释,并包含一系列内建的检查函数来提高序列的质量保证。它还被设计用于提交来自系统进化、种群和突变研究的序列,可以加入比对的数据。在不同操作系统下运行的Sequin程序都可以在/sequin/下找到,Sequin的使用说明可详见其网页。BankIt的网址是:/BankIt

Sequin的相关网址是:/Sequin/1、登陆BankIt页面:/BankIt/

2、填写表单内容

3、确认表单内容

4、等待电子邮件返回信息。BankIt提交序列的详细过程:精确的碱基数BankIt界面下拉下拉填写详细信息如果填写的信息有误会自动返回如果没有错误,在确认之后等待返回E-mail.下拉Unit4TargetGeneAnalysis

目标基因分析序列分析内容核酸序列分析基因编码区组分分析GC含量/Codonbias引物设计限制性酶切位点分析基因编码区结构分析基因结构分析选择性剪切分析/SNP分析基因调控区域分析蛋白质序列分析蛋白质一级序列分析蛋白质理化性质分析蛋白质二级结构分析蛋白质二级结构预测蛋白质序列信号位点分析蛋白质超二级结构分析蛋白质结构域分析蛋白质高级结构分析蛋白质三维结构模拟其他其他分析内容序列比对注释多序列比对系统发育分析1.ORF的识别GENSCAN:/GENSCAN.or/extro剪切位点分析Spidey:/Spidey/3.选择性剪切分析

ProSplicer:.tw/

预测结果预测结果4.CpG岛区域分析

CpgPlot/CpGRrport/Isochore:

http://www.ebi.ac.uk/emboss/cpgplot输出结果5.核心启动子及转录因子结合位点

PormoterScan::80/molbio/proscan输出结果6.转录终止信号的预测

Hcpolya:

r.it/~webgene/wwwHC_polya_ex.html输出结果7.密码子使用偏好性分析

Codonusage:/sms/index.html输出结果8.限制性核酸内切酶位点分析Primer;DNAMan9.蛋白质理化性质分析ProtParam:http://www.expasy.ch/tools/protparam.html结果输出氨基酸组成元素组成分子量半衰期其他10.蛋白质二级结构预测

PHD:

/

Sign-UpForFree11.蛋白质结构域

InterPro:

http://www.ebi.ac.uk/interProScan输出结果1详细报表12.蛋白质三维结构预测

SWISS-MODEL://SWISS-MODEL.html输出结果:

E-mail:***.pdb文件13.分子系统发育分析2008级生化与分子生物学专业硕士研究生,《生物信息学》作业:作业格式:论文前言方法(主要相关软件或网址)结果与分析结论参考文献在论文中应包含下列内容:1.利用你所学的数据库检索方法获得一段你感兴趣的DNA序列(基因或mRNA)。标明序列名称、登录号(accession#)。下载该基因mRNA和蛋白的GenBank格式文件。2.查找与该基因相关的文献,写出前言并从中总结该基因的研究意义。3.查找该基因编码的蛋白质序列特征,包括氨基酸组成、等电点等理化性质等。4.查找该基因是否有已知的三维结构数据,并下载该结构文件。5.利用BLAST工具查找与该基因mRNA和氨基酸序列同源的基因(请征对nr数据库比较),至少要写出10个同源序列的登录号(accessi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论