生物信息学数据库检索ppt课件_第1页
生物信息学数据库检索ppt课件_第2页
生物信息学数据库检索ppt课件_第3页
生物信息学数据库检索ppt课件_第4页
生物信息学数据库检索ppt课件_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学数据库信息检索教研室薛晓芳2019年11月2日生物信息学概念生物信息学概念 生物信息学是对生物学数据进行收集、处置、存储、检索和分析的一门交叉学科 研究生物信息的采集、处置、存储、传布、分析和解释等各个方面,通过综合数学、计算机科学和生物学的工具与技术来揭示大量而复杂的生物数据所赋有的生物学奥秘 研究目标是发展和利用先进计算技术解决生物学难题生物信息学数据库生物信息学数据库 大量生物学数据的存储和利用离不开数据库 用于结构化存储生物数据,以便进一步对数据进行分析和利用数据库的数据来源数据库的数据来源 两大主要来源 经典的生物医学研究:大量生物医学科研工作者根据自己的兴趣开展的个别研究

2、 大规模组学研究:代表性工作是大规模人类基因组学和蛋白质组学研究 经典生物医学研究经典生物医学研究 针对某较小领域开展深入研究,采集的生物学数据 对大量零碎的生物学数据,进一步收集、整理和利用,对推动生物医学的研究有重要意义 最具代表性的是KEGG数据库,该数据库整理收录了大量代谢网络PATHWAY的研究成果,描绘了生物体内代谢网络涉及的各种分子及关系大规模组学研究大规模组学研究 上世纪90年代初启动人类基因组计划,短时间内产生海量生物学数据 随着基因组计划进行,多种相关高通量研究逐渐开展起来 基于表达序列标签EST和DNA微阵列的高通量转录组研究 基于生物质谱的蛋白质组表达谱和修饰谱研究 基

3、于酵母双杂交等技术的高通量蛋白质-蛋白质相互作用组研究 代谢组等相关的组学研究组学数据库分类组学数据库分类 一级数据库:通过收集组学数据构建的数据库 二级和三级数据库:对一级数据库数据进一步分析、归纳和整理,目的性和实用性 TRANSFAC:转录因子和结合位点数据库 SMART、pFam数据库:收录了可能的蛋白质结构域信息,并提供了特定算法工具生物信息学数据库的地位和作用生物信息学数据库的地位和作用经典生物医学实验经典生物医学实验大量零碎数据大量零碎数据数据收集整理数据收集整理大规模组学实验大规模组学实验海量组学数据海量组学数据数据存储、注释数据存储、注释数数 据据 库库生物医学应用生物医学应

4、用理论分析理论分析检索查询检索查询生物学研究生物学研究生物信息学数据库类型生物信息学数据库类型 核酸研究Nucleic Acids Research杂志 每年第一期为生物信息学数据库专刊,收录最主要的生物学相关数据库 2019年的核酸研究杂志提供的数据库列表将国际上生物学数据库归纳为14类(/nar/database/c/)核酸研究核酸研究的的14类数据库类数据库Nucleotide Sequence Databases 核酸序列数据库RNA sequence databases RNA序列数据库Protein sequence databases 蛋白质序

5、列数据库Structure Databases 结构数据库Genomics Databases (non-vertebrate) 基因组数据库(非脊椎动物)Metabolic and Signaling Pathways 代谢和信号通路Human and other Vertebrate Genomes 人和其他脊椎基因组Human Genes and Diseases 人基因和疾病Microarray Data and other Gene Expression DatabasesProteomics Resources微阵列和其他基因表达数据库蛋白质组资源Other Molecular B

6、iology Databases 其他分子生物学数据库Organelle databases 细胞器数据库Plant databases 植物数据库Immunological databases 免疫学数据库常用分类类型常用分类类型 序列数据库 结构数据库 功能数据库 其它专业数据库主要内容主要内容 生物信息学数据库类型生物信息学数据库类型 序列数据库序列数据库 结构数据库结构数据库 功能数据库功能数据库 其它专业数据库其它专业数据库 生物信息学数据库的检索生物信息学数据库的检索 检索方法概述检索方法概述 检索实践和案例检索实践和案例一、序列数据库一、序列数据库 主要收录核酸和蛋白质序列数据主

7、要收录核酸和蛋白质序列数据 包括由基因组计划产生的基因组及其表达包括由基因组计划产生的基因组及其表达序列,由基因组序列所推测的编码和非编序列,由基因组序列所推测的编码和非编码核酸和蛋白质序列,以及个别生物学实码核酸和蛋白质序列,以及个别生物学实验中测序获得的核酸和蛋白质序列验中测序获得的核酸和蛋白质序列一、序列数据库一、序列数据库(基因组基因组) Genome Database(GDB)数据库数据库 Ensembl,由由EMBL - EBI和和Sanger研究所联合开研究所联合开发发,对后生动物基因组的自动注释和维护对后生动物基因组的自动注释和维护/ 包括人

8、、鼠、斑马鱼和果蝇包括人、鼠、斑马鱼和果蝇4种真核生物基因组种真核生物基因组的注释分析,主要依据已测序获得的基因组序列,的注释分析,主要依据已测序获得的基因组序列,定位所有已知基因,并预测未知新基因,同时为定位所有已知基因,并预测未知新基因,同时为这些基因提供功能、疾病相关特征等方面的注释这些基因提供功能、疾病相关特征等方面的注释信息;信息;Ensembl基因组注释的核心是基因预测,基因组注释的核心是基因预测,考虑到现有预测方法的限制,该系统整合了多种考虑到现有预测方法的限制,该系统整合了多种预测方法,并提供了各种预测方法结果的下载预测方法,并提供了各种预测方法结果的下载 UCSC Genom

9、e Browser,加州大学圣克鲁兹分加州大学圣克鲁兹分校建立校建立,包括各种脊椎和无脊椎动物,以及主要模包括各种脊椎和无脊椎动物,以及主要模式生物的基因组数据式生物的基因组数据 /一、序列数据库一、序列数据库(核酸核酸) GenBank、EMBL、DDBJ /Genbank,ebi.ac.uk/embl/,ddbj.nig.ac.jp/ 三个数据库每天互相交换数据三个数据库每天互相交换数据 GenBank可通过可通过NCBI的检索系统的检索系统Entrez获取,获取, Entrez集成来自主要集成来自主要DNA和蛋白序列数据库的数

10、和蛋白序列数据库的数据,包括物种、基因组、定位、蛋白结构和结构据,包括物种、基因组、定位、蛋白结构和结构域等信息域等信息 各种专业核酸数据库各种专业核酸数据库 非冗余参考序列数据库非冗余参考序列数据库RefSeq 密码子使用数据库密码子使用数据库Codon Usage Database CUTG 基因可变剪接数据库基因可变剪接数据库ASDB 转录因子数据库转录因子数据库TRANSFAC一、序列数据库一、序列数据库(蛋白质蛋白质)国际主要蛋白质数据库的数据来源及其关系吴松锋等, 遗传, 2019, 27(5): 687-693 主要蛋白质序列数据库主要蛋白质序列数据库 UniProt unipr

11、 由由Swiss-Prot、TrEMBL和和PIR蛋白质数据库联合蛋白质数据库联合构建,提供蛋白质序列和功能注释的核心资源。由构建,提供蛋白质序列和功能注释的核心资源。由三个子库组成:(三个子库组成:(1UniProtKB,知识库,知识库2UniRef:参考簇:参考簇3UniParc,所有公开的蛋白,所有公开的蛋白质序列,包括每个序列源数据库的追溯信息质序列,包括每个序列源数据库的追溯信息 IPI ebi.ac.uk/IPI/ 国际蛋白质索引数据库,针对蛋白质组研究中利用国际蛋白质索引数据库,针对蛋白质组研究中利用数据库搜索鉴定蛋白的策略而构建的参考数据库,数据库搜索鉴定蛋白的策略

12、而构建的参考数据库,月更新月更新 整合国际上主要的蛋白质数据库整合国际上主要的蛋白质数据库SwissProt,Refseq,PIR,TrEMBL,RefSeq,Ensembl,H-Inv DB翻译的蛋白数据),整合过程中,直接翻译的蛋白数据),整合过程中,直接接受手工注释结果接受手工注释结果 Nr NCBI构建,非冗余蛋白质数据库,为每个蛋白质构建,非冗余蛋白质数据库,为每个蛋白质序列记录赋予一个唯一的序列记录赋予一个唯一的gi号,并将序列完全一致号,并将序列完全一致的非冗余蛋白质合并成簇的非冗余蛋白质合并成簇蛋白质功能模体和结构域数据库蛋白质功能模体和结构域数据库 功能模体或活性位点数据库功

13、能模体或活性位点数据库(protein domains, families and functional sites) PROSITE /prosite,收集了上千个序,收集了上千个序列模体列模体 PRINTS(Protein motif fingerprint database) bioinf.manchester.ac.uk/dbbrowser/PRINTS/ 结构域数据库结构域数据库(families,domains,regions,sites) Pfam pfam.sanger.ac.uk/ SMART smart.embl-heidelberg.de InterP

14、ro ebi.ac.uk/interpro 二、结构数据库二、结构数据库 核酸和蛋白质的空间结构数据库,一般通核酸和蛋白质的空间结构数据库,一般通过过X射线衍射和核磁共振获得数据,也有同射线衍射和核磁共振获得数据,也有同源建模等计算方法获得源建模等计算方法获得二、结构数据库二、结构数据库(核酸核酸) 核酸结构数据库核酸结构数据库(NDB, /) 收录核酸的晶体结构数据,包含收录核酸的晶体结构数据,包含X射线衍射和射线衍射和核磁共振的结果,可通过核磁共振的结果,可通过ADIT (the AutoDep Input Tool)同时将结构存储到同时将结构存储

15、到NDB和和PDB中,提供序列号检索功能,可以用中,提供序列号检索功能,可以用NDB或或PDB的的ID号检索,结果包含核酸结构号检索,结果包含核酸结构的简要信息和图片的简要信息和图片 Rfam数据库数据库, rfam.sanger.ac.uk/ RNA家族多重序列比对,一致性二级结构和家族多重序列比对,一致性二级结构和协方差模型,基于多重序列比对的非编码协方差模型,基于多重序列比对的非编码RNA家族的变异模式家族的变异模式二、结构数据库二、结构数据库(蛋白质蛋白质) PDB /pdb/ RCSB(Research Collaboratory for Structural Bio

16、informatics) 国际上专门用于处理和发布生物大分子三维结构的知识库,国际上专门用于处理和发布生物大分子三维结构的知识库,提供数据库的检索和下载服务,以及提供数据库的检索和下载服务,以及PDB数据文件格式和数据文件格式和其它文档的说明,使用软件可对其它文档的说明,使用软件可对PDB数据库记录用多种模数据库记录用多种模式显示生物大分子三维结构式显示生物大分子三维结构 蛋白质结构分类数据库蛋白质结构分类数据库SCOP scop.mrc-lmb.cam.ac.uk/scop/ 包含从包含从PDB数据库中提取的所有结构域,并详细描述已知数据库中提取的所有结构域,并详细描述已知蛋白质结构之间的关

17、系蛋白质结构之间的关系 MMDB NCBI的分子模型数据库的分子模型数据库/sites/entrez?db=structure/ 包括由包括由x射线衍射和核磁共振实验得到的所有射线衍射和核磁共振实验得到的所有PDB生物分生物分子三维结构,与原始的子三维结构,与原始的PDB结构相比,增加一些附加信息:结构相比,增加一些附加信息:经程序验证的显性化学图像信息、一致的二级结构衍生定经程序验证的显性化学图像信息、一致的二级结构衍生定义、与义、与MEDLINE相匹配的引用、基于源自生物实体的蛋相匹配的引用、基于源自生物实体的蛋白质或核酸链进行分类的分子匹配白质或核酸链进行

18、分类的分子匹配三、功能数据库三、功能数据库 收录生物分子的功能数据,由收录生物分子的功能数据,由ID号与序列和结构数据链接号与序列和结构数据链接 组织表达谱和亚细胞定位组织表达谱和亚细胞定位 根据不同组织中的根据不同组织中的EST、SAGE或芯片杂交信号,绘制出不或芯片杂交信号,绘制出不同组织中表达基因的图谱:同组织中表达基因的图谱: BodyMap bodymap.ims.u-tokyo.ac.jp/ Unigene /sites/entrez?db=unigene SAGEmap /projects/SAGE/ GEO ncb

19、/projects/geo/ Stanford Microarray Database /microarray 亚细胞定位数据库:亚细胞定位数据库: PSORTdb / DBSubLoc /dbsubloc.html 膜蛋白质数据库膜蛋白质数据库TMPDB bioinfo.si.hirosaki-u.ac.jp/TMPDB/ 线粒体蛋白质数据库线粒体蛋白质数据库MitoP2 mitop.de:8080/mitop2/三、功能数据库三、功能数据库 蛋白翻译后修饰蛋白翻译

20、后修饰 dbPTM .tw/ ,磷酸化、糖基化和硫,磷酸化、糖基化和硫修饰,也收录和蛋白质翻译后修饰相关的生物信息,确认修饰,也收录和蛋白质翻译后修饰相关的生物信息,确认的修饰信息、的修饰信息、Swiss-Prot蛋白中可能存在的三类修饰信息、蛋白中可能存在的三类修饰信息、部分针对某种修饰的数据库部分针对某种修饰的数据库 部分某种修饰数据库部分某种修饰数据库 O-GlycBasecbs.dtu.dk/databases/OGLYCBASE/)只收录)只收录O糖基化糖基化数据;数据;PhosphoB/)只收录磷)只收录

21、磷酸化位点的数据;酸化位点的数据;RESIDebi.ac.uk/RESID/) 收录蛋白收录蛋白质修饰的注释和结构的数据质修饰的注释和结构的数据 蛋白质蛋白质-蛋白质相互作用数据库蛋白质相互作用数据库 DIP /,由实验验证的蛋白质,由实验验证的蛋白质-蛋白质蛋白质相互作用数据,包括蛋白质的信息、相互作用的信息和检相互作用数据,包括蛋白质的信息、相互作用的信息和检测相互作用的实验技术测相互作用的实验技术 IntAct ebi.ac.uk/intact ,提供用于蛋白质相互作用数据,提供用于蛋白质相互作用数据存储、展示和分析的开源数据库和工具包,可对相互作

22、用存储、展示和分析的开源数据库和工具包,可对相互作用数据在网页上进行文本和图像的展示,允许用户通过数据在网页上进行文本和图像的展示,允许用户通过GO注注释或释或InterPro结构域注释进行网络的扩充结构域注释进行网络的扩充 三、功能数据库三、功能数据库 代谢网络和信号途径代谢网络和信号途径 KEGG(Kyoto Encyclopedia of Genes and Genomes) genome.ad.jp/kegg/ 系统分析基因功能、联系基因组信息和功能信息的系统分析基因功能、联系基因组信息和功能信息的知识库知识库 GENES收录完整和部分测序的基因组序列;收录完整和部分测序的基因组序列;

23、PATHWAY数据库存储更高级的功能信息,包括图解数据库存储更高级的功能信息,包括图解的细胞生化过程和同系保守的子通路等信息;的细胞生化过程和同系保守的子通路等信息; LIGAND数据库收录关于化学物质、酶分子和酶反应数据库收录关于化学物质、酶分子和酶反应等信息等信息四、其它专业数据库四、其它专业数据库 人类基因和疾病数据库人类基因和疾病数据库 OMIM(/sites/entrez?db=omim) 收录所有已知的遗传病、遗传性状和基因,除收录所有已知的遗传病、遗传性状和基因,除简略描述各种疾病的临床特征、诊断、治疗和预简略描述各种疾病的临床特征、诊断、治疗和预

24、防外,还提供致病基因的连锁关系、染色体定位、防外,还提供致病基因的连锁关系、染色体定位、组织结构、动物模型及其参考文献等信息组织结构、动物模型及其参考文献等信息 dbSNP(/sites/entrez?db=SNP )收录已经识别的收录已经识别的SNPs的数据库的数据库 HapMap Project()收录了三大人群收录了三大人群(非洲人非洲人,高加索人和亚洲人群高加索人和亚洲人群)主要的变异模式主要的变异模式,所所选择的选择的SNPs具有相对代表性具有相对代表性 CGED(lifesciencedb.jp/cged/)收录多种癌症的收录

25、多种癌症的临床和基因表达数据临床和基因表达数据,更新到更新到2019年年四、其它专业数据库四、其它专业数据库 基于电泳和生物质谱的蛋白质组数据库基于电泳和生物质谱的蛋白质组数据库 SWISS-2DPAGE(/ch2d/)收录各种双收录各种双向电泳或向电泳或SDS的电泳图,并提供蛋白在电泳图中的电泳图,并提供蛋白在电泳图中的位置及其信息的位置及其信息 PRIDE(ebi.ac.uk/pride/)数据库收集国际蛋白质数据库收集国际蛋白质组计划所产出的鉴定结果数据组计划所产出的鉴定结果数据 PeptideAtlas(/)收录大规模收录大规模LC-

26、MS/MS实验鉴定的蛋白信息,并将信息匹配到实验鉴定的蛋白信息,并将信息匹配到Ensembl数据库数据库 dbLEP()为肝脏蛋白质组计划设为肝脏蛋白质组计划设计,提供鉴定结果及可追溯的信息,包括可供评计,提供鉴定结果及可追溯的信息,包括可供评估结果质量的鉴定肽段数和质谱图谱等,同时还估结果质量的鉴定肽段数和质谱图谱等,同时还提供大量的注释信息,更新到提供大量的注释信息,更新到2019年年四、其它专业数据库四、其它专业数据库 免疫学数据库免疫学数据库 IMGTimgt.cines.fr数据库是关于免疫球蛋白、数据库是关于免疫球蛋白、T细胞受体、主要组织相容性复合体以

27、及人类和细胞受体、主要组织相容性复合体以及人类和哺乳动物免疫系统相关蛋白的综合数据库,由序哺乳动物免疫系统相关蛋白的综合数据库,由序列数据库、基因组和结构数据库、网站资源数据列数据库、基因组和结构数据库、网站资源数据库和各种研究工具数据库组成库和各种研究工具数据库组成 dbMHC/mhc/)提供人类组)提供人类组织相容性抗原织相容性抗原HLA的序列数据和临床上干细的序列数据和临床上干细胞移植及风湿性关节炎等数据,也提供全世界胞移植及风湿性关节炎等数据,也提供全世界90多个人群的多个人群的HLA位点、等位基因和单倍型频率的位点、等位基因和单倍型频率的遗传检测工具遗

28、传检测工具生物信息学数据库总结生物信息学数据库总结如此多的数据库如何掌握?如此多的数据库如何掌握?不用掌握,只需要有印象不用掌握,只需要有印象( (某些领域著名数据库某些领域著名数据库) ),需要时再找相应的,需要时再找相应的数据库:新的或较小的数据库数据库:新的或较小的数据库以上所讲数据库皆为各类数据库,多数重要的是数据集本身,对于检以上所讲数据库皆为各类数据库,多数重要的是数据集本身,对于检索来讲,需要在常用生物信息学系统上进行索来讲,需要在常用生物信息学系统上进行( (如如EntrezEntrez、SRSSRS和和ExpasyExpasy,大多数据库集成于此大多数据库集成于此) )数据库

29、是不断更新和发展的,网址变化、新的数据库出现、旧数据库数据库是不断更新和发展的,网址变化、新的数据库出现、旧数据库不再维护数据不存在等等,需要从互联网上不断寻找不再维护数据不存在等等,需要从互联网上不断寻找数据库之间的关系,以及数据库中内容等等需要同学自己在互联网中数据库之间的关系,以及数据库中内容等等需要同学自己在互联网中寻找自己所关心的内容,在数据库网站上看简介和使用方法,搜索引寻找自己所关心的内容,在数据库网站上看简介和使用方法,搜索引擎查询某些同类数据库的关系,发信询问服务器如擎查询某些同类数据库的关系,发信询问服务器如NCBINCBI等等以上所讲数据库只是给一些概念和印象,希望同学以

30、后在自己所研究以上所讲数据库只是给一些概念和印象,希望同学以后在自己所研究领域或平时接触到的领域中碰到这些数据库有所了解,不陌生领域或平时接触到的领域中碰到这些数据库有所了解,不陌生生物信息学数据库的检索生物信息学数据库的检索 主要检索系统和工具主要检索系统和工具 Entrez(National Center for Biotechnology Information,NCBI) SRS(European Bioinformatics Institute,EBI) ExPasy Expert Protein Analysis System (Swiss Institute of Bioinfo

31、rmatics,SIB) 日本、欧洲、美国其他研究机构的工具平日本、欧洲、美国其他研究机构的工具平台台一、数据库字段检索一、数据库字段检索 / 例例1: 用用ID号检索号检索protein数据库序列及相关信息数据库序列及相关信息 人人TPA(tissue plasminogen activator)蛋白蛋白质质 ID号:号:AAO34406一、数据库字段检索一、数据库字段检索 检索步骤检索步骤 在在NCBI界面中选择界面中选择“protein数据库数据库 在检索框中填写在检索框中填写“AAO34406”,点击,点击“GO”Fasta格式蛋白质特性参考文献物种起源

32、原序列复制后,可到BLAST中进行相似性对比 例例2:同时获得多个蛋白的信息:同时获得多个蛋白的信息 获得多个蛋白信息 Display设置输送到文件、剪切板等 例例3:一次性获取几百:一次性获取几百/上千蛋白信息上千蛋白信息 使用使用Batch Entrez 将序列号存储在文件中将序列号存储在文件中(每个序列号一行,每个序列号一行,不要有其它任何字符不要有其它任何字符),点击,点击“阅读阅读”即可即可得到结果列表得到结果列表 /sites/batchentrez上传序列文件 关键字检索数据库记录关键字检索数据库记录 数据库字段未知数据库字段未知 例例4: 查询查

33、询tissue plasminogen activator蛋白信蛋白信息息315条记录 70条记录 选择题名中有选择题名中有RecNameRecName被识别序列的记录被识别序列的记录 tissue plasminogen activator and tissue plasminogen activator and human and Recnamehuman and Recname名称是所需要的 蛋白SwissProt号以P/Q开头gi号 Fasta格式序列 例6: 获取核酸序列:人类血小板衍生因子的序列 关键词:Platelet derived growth factor homo sap

34、iens 限定字段:基因定义标题) Platelet derived growth factorTI and homo sapiensTI基因定义 碱基数、核酸类型序列长度 物种来源 参考文献 染色体特性 NCBI structure查询查询检索步骤检索步骤检索栏中直接输入的检索词包括:检索栏中直接输入的检索词包括:PDB PDB 代代码码, , 蛋白质名蛋白质名, , 作者作者, , 或期刊名或期刊名搜索,得出检索初步结果,需注意筛选搜索,得出检索初步结果,需注意筛选也许出现多个指定的蛋白质存在的记录也许出现多个指定的蛋白质存在的记录, , 反映不同实验技术情况反映不同实验技术情况, , 并

35、出现或缺乏各并出现或缺乏各种配合基或金属离子种配合基或金属离子也许包含全长分子的不同片段也许包含全长分子的不同片段还有许多突变体蛋白质结构还有许多突变体蛋白质结构包含了包含了PDBPDB记录记录( (实验性描述实验性描述, PDB, PDB代码代码) )显示结构概略页显示结构概略页点击次要结构点击次要结构 Secondary StructureSecondary Structure按钮按钮对观看对观看3D 3D 分子的结构有用分子的结构有用观看完整蛋白质结构按钮观看完整蛋白质结构按钮FullFullProtein StructuresProtein Structures须下载须下载Cn3DCn

36、3D软件)软件) Viewing 3D StructuresViewing 3D Structures实例实例 例例7 7:查找铁氧化还原蛋白的三维结构:查找铁氧化还原蛋白的三维结构 蛋白质代码:蛋白质代码:1doi1doi 铁氧化还原蛋白名:铁氧化还原蛋白名:ferredoxin feferredoxin fe蛋白质代码蛋白质描述:来自死海古菌的铁氧化还原蛋白发表文献生物体分类名称显示三维结构参考文献蛋白质链栏,鼠标放在栏上,显示残基;点击显示分子各条链、邻族结构点击显示存储域点击显示序列Genome数据库检索数据库检索 Map Viewer (Map Viewer (图形显示器图形显示器)

37、,),可观看数据库内带有可观看数据库内带有综合遗传和自然图的各种有机体基因组、全部染综合遗传和自然图的各种有机体基因组、全部染色体、序列集成数据色体、序列集成数据 通常检索的是序列全长序列通常检索的是序列全长序列cDNAcDNA,难以检索某一,难以检索某一序列特定区域,了解序列特定区域,了解5 5或或3 3的核酸序列或对内含的核酸序列或对内含子等其它分子生物学内容进行分析子等其它分子生物学内容进行分析 例例8 8: 利用利用Map ViewerMap Viewer获取特定基因周围的获取特定基因周围的基因组序列基因组序列 选择选择“Genome数据库,找到数据库,找到Map viewer工具点击

38、进入工具点击进入获取FMR1基因组3, 5端序列OMIM数据库数据库 例例9 9: 查找角化过度症营养不良性神经查找角化过度症营养不良性神经病)病) Keratoderma,palmoplantarKeratoderma,palmoplantar染色体位点内容目录相关数据库连接二、序列数据的相似性检索二、序列数据的相似性检索 常用工具:常用工具:BLAST(Basic Local Alignment BLAST(Basic Local Alignment Search Tool)Search Tool)、FASTAFASTA /Blast.cgibl

39、/Blast.cgi 5 5种查询方式种查询方式 例例1010:检索人:检索人TPATPA蛋白的同源蛋白序列蛋白的同源蛋白序列 选择选择“protein blastprotein blast”5种查询方式输入SP号,gi号或序列 上传比对序列文件 工作名称 选择比对数据库 生物组织名称 选择算法参数,可用默认值 类似性图谱比对结果描述详细比对结果比对积分报告数据库标识符蛋白定义积分值比对结果检索序列匹配的数据库记录打分情况匹配结果引物设计引物设计 引物:在聚合反应中作为底物引发聚合产物的短引物:在聚合反应中作为底物引发聚合产物的短的序列统称为引物。的序列统称为引物。PCRPCR反应中扩增一个已知序列反应中扩增一个已知序列DNA,DNA,对其引物须有一定的满足条件对其引物须有一定的满足条件, ,才能有效地扩才能有效地扩增模板序列增模板序列, ,这些条件有:(这些条件有:(1 1引物长度为引物长度为2020个个碱基碱基2 2引物序列与被扩增的序列不具有同源性引物序列与被扩增的序列不具有同源性3 3引物中引物中G+CG+C碱基的含量以碱基的含量以40%60%40%60%为宜等为宜等 根据引物设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论