版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.2生物信息学资源3.2.1基因组信息3.2.2蛋白质信息3.2.3整合生物信息13.2.1基因组信息
GenBank的建立与发展
GenBank的分类学检索向GenBank投送序列2
GenBank的建立与发展GeneticSequenceDataBank80年代初由美IG公司和LANL国家实验室创立现在GenBank由美国国家生物信息中心(NCBI)管理运行GenBank的主要目标是收集已发表的和自行投送的核苷酸序列及相关的文献资料3
GenBank的分类学检索如,查水生植物睡莲科(Nymphaeaceae)的序列资料在GenBank查询框中输入“Nymphaeaceae”查询结果为01.htm
02.htm
AF136285.htm6向GenBank投送序列序列格式:FASTA格式等下载安装Sequin提交步骤:使用Sequin软件73.2.2蛋白质信息蛋白质信息的三个层次和相应的数据库一级氨基酸序列AVILDRYFH一级数据库二级基序[AS]-[IL]2-X[DE]-R-[FYW]2-H二级数据库三级域调谐子a,b,c@,*,#三级数据库8蛋白质的一级数据库PIR(ProteinInformationResource):由美国国立生物研究基金会(NBRF)建立MIPS:由慕尼黑蛋白质序列信息中心建立SWISS-PORT和TrEMBL:为日内瓦大学建立NRDB(Non-RedundantDataBase):为NCBI-GenBank建立,由6个数据库复合而成OWL:为英国利兹大学和Daresbury实验室建立,由4个数据库复合而成SWISS-PROT+TrEMBL:由EBI建立,由2个数据库复合而成9蛋白质的二级数据库是建立在一级数据库基础上的蛋白质基序、指纹等方面信息资源二级数据库一级数据库来源内容PROSITESWISS-PROT正则表达ProfilesSWISS-PROT加权矩阵PRINTSOWL*已对位排列基序PfamSWISS-PROT隐马尔可夫模型BLOCKSPROSITE/PRINTS*已对位排列基序IDENTITYBLOCKS/PRINTS*模糊正则表达10蛋白质的三级数据库SCOP:收录已知结构的蛋白质之间的结构与进化关系信息,主要有三个水平主要是结构分类数据库,依赖于人们对结构相似性的定义与评价标准基因家族(genefamily)(同一性>=30%)基因超家族(genesuperfamily)(同一性较底,但结构和功能等特性说明它们具有共同的起源)折叠(fold)(具有相同的二级结构,则认为具有共同的折叠)11CATH:由伦敦大学建立(该系统收录了蛋白质结构的等级域分类信息,分5个水平)4个域级:①α为主结构,②β为主结构,③α-β或α/β或α+β结构④很少的二级结构内容构造:蛋白质二级结构的排列拓扑结构:二级结构的全面形状和连通性同源性:具有≥35%序列的同一性及具有共同祖先序列:序列同一性≥35%的域显示出高度相似的结构和功能123.2.3整合生物信息查询分子序列查询系统树TreeBASE系统:哈佛、荷兰莱顿、加州大学合作建立系统发育研究资料包括原始数据、系统发育树、文献信息及相关算法查水生植物睡莲科(Nymphaeaceae)的系统发育3分子数据挖掘工具3.3.1序列相似性查询软件3.3.2通用序列查询和模式识别工具3.3.3构建序列查询协议3.3.4数据挖掘的例子——GeneMine183.3.1序列相似性查询软件基本原理
BLAST系列软件
BLAST检索例子
BLAST与其他算法的比较19基本原理BLAST(basiclocalalignmentsearchtool,KarlinandAltschul1990)序列同源性(sequencehomology)相似性记分(similarityscore)全局排列(globalalignment,NeedlemanandWunsch1970)局部排列(localalignment,SmithandWaterman1981)20BLAST系列软件查询序列氨基酸序列DNA序列BLASTptBLASTnBLASTntBLASTxtBLASTx检索蛋白质序列数据库检索翻译后核苷酸序列数据库检索核苷酸数据库检索蛋白质序列数据库检索翻译后核苷酸序列数据库21BLASTp流程蛋白质序列BLASTp比较查询序列与蛋白质数据库(如SWISS-PROT)中的已知序列输出文件分析(如序列对位排列)推导可能的蛋白质功能22tBLASTn流程蛋白质序列tBLASTn比较DNA数据库(如GenBank-ESTdb)中的六框翻译核苷酸序列输出文件分析(如序列对位排列)23核苷酸序列(DNA和RNA)BLASTn比较比较查询序列与DNA数据库(如NCBI-GenBank)中的已知序列输出文件分析(如序列对位排列)BLASTn流程24新序列的DNABLASTx比较六框翻译的氨基酸序列与蛋白质数据库(如SWISS-PROT)中的已知序列输出文件分析(如序列对位排列、终止密码子)BLASTx
流程发现潜在的编码区(外显子)发现潜在的编码区翻译成氨基酸序列25BLAST检索的例子 atcattcaattagacgtgttctattcgcacatggaaaaaacccatatacgcgtacagagctttacgtctcttaatatcaatatggcgatttaataatagatttttagaaagggagtaatagtcctttgacaatcgtatacatatacaaatatatctatatatatacacgcacagcacatgttttacaaacgaggcgtgcatattgtccaaagtgcacaatttaaatcctctttcaatttatttcgtcatcataaaagtaacgcgtgtaccaatttggacggtcgggcgtaaatctttcaaaaccttcggagtaataatacaaatatgatattactagtcctagaaagaatacgatatatacaaagttaattatatatttattatattcatttaggtacccgatacagtcatatactttatttgtgtatgtcaaataaagctgaccacatccaaatattcatggcagcacacgctctattactttcagatagacttgttgtacaaaaaattttaacttttaaaaaacttcatctatattcatgtatgatgaaaatagaatgtcagttataaaaagttatatttttttgacttcaacgagagggtggtttttattttatcagaatatatatattaatatatatattcgaatcgtaaacaaaaacacaaatcgttcgatattacaaaatattgaaaaagatcaacattccataaataaatacagacttgtcgtgtattatacgaacactgNCBI26272829303132333435BLAST与其他算法的比较算法计算值记分矩阵间隔罚分时间原始文献Needleman-WunschGlobalsimilarityArbitraryPenalty/gapQO(n2)1970Sellers(global)distanceUnityPenalty/residueRkO(n2)1974Smith-WatermanLocalsimilaritySij<0.0Affineq+rkO(n2)1981,Gotoh1982FASTAApprox.localsimilaritySij<0.0Limitedgapsizeq+rkO(n2)/KLipman85,Pearson88BLASTpSij<0.0MultiplesegmentsO(n2)/KAltshuletal1990363.3.2通用序列查询和模式
识别工具SRS系统:是EMBnet中的数据检索工具,可通过名称、分类学等级、序列进行检索PROSITE模式识别工具:在蛋白质数据库系统中,基序(motif)和标识分析程序均属模式识别工具。模体:在对核酸或蛋白质进行同源性比较研究时,发现很多核酸或蛋白质包括一些功能不同的核酸或蛋白质都可能含有相似的结构方式。早年的注意力局限在一级结构上,近年也用于比较蛋白质高级结构的同源性。37383940414243DNA序列六框翻
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络安全技术发起人协议书
- 矿山开采土方施工协议
- 武汉市飞机租赁合同范本
- 康复设备租赁合同小区康复规定
- 国际度假村建设合同范本
- 商品房限价销售管理规定
- 供应链优化条例
- 珠宝首饰合同签订及执行管理办法
- 污水处理项目评审案例
- 古城墙遗址翻新改造合同
- 《2023级学生手册》奖、惩资助、文明部分学习通超星期末考试答案章节答案2024年
- 国开2024年秋《机械制图》形考作业1-4答案
- 2024中国中煤招聘笔试参考题库含答案解析
- 2024年四川省自然资源投资集团有限责任公司招聘笔试参考题库附带答案详解
- 义务教育物理课程标准(2022年版)测试题文本版(附答案)
- 23S519 小型排水构筑物(带书签)
- 涉诈风险账户审查表
- GA/T 544-2021多道心理测试系统通用技术规范
- 矩阵论知到章节答案智慧树2023年哈尔滨工程大学
- 个人车位租赁合同电子版
- 露天采石场开采方案
评论
0/150
提交评论