版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章生物信息学数据库资源演示文稿现在是1页\一共有101页\编辑于星期四1第二章生物信息学数据库资源现在是2页\一共有101页\编辑于星期四2提纲:模式生物测序3大核酸数据库蛋白质数据库现在是3页\一共有101页\编辑于星期四3提纲:模式生物测序3大核酸数据库蛋白质数据库现在是4页\一共有101页\编辑于星期四4humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis一、模式生物现在是5页\一共有101页\编辑于星期四5模式生物基因组计划模式生物基因组计划酵母、线虫、果蝇、细菌、拟南芥等共约50多种已完成,70余种正在进行。目前总量已达60亿碱基对!现在是6页\一共有101页\编辑于星期四6virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians现在是7页\一共有101页\编辑于星期四7模式生物(ModelOrganism)病毒(Virus)不具有细胞形态结构,仅由核酸和蛋白质构成;如:人艾滋病毒HIV、SARS冠状病毒体积小,10~300nm;严格的专性细胞内寄生;对抗生素不敏感。电子显微镜下的SARS冠状病毒100nm现在是8页\一共有101页\编辑于星期四8Escherichiacoli
大肠杆菌大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。EscherichiacoliO157:H7EscherichiacoliK12模式生物(ModelOrganism)现在是9页\一共有101页\编辑于星期四9Saccharomycescerevisiae
酿酒酵母真菌界的单细胞真核生物,它的全基因组已在1996年测定。模式生物(ModelOrganism)现在是10页\一共有101页\编辑于星期四10秀丽线虫Caenorhabditiselegans
一种透明的、生活在海滩泥沙中的小虫。细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元;
有6条染色体,全基因组于1998年测定,长9.7Mb
模式生物(ModelOrganism)现在是11页\一共有101页\编辑于星期四11Drosophilamelanogaster
果蝇繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。
模式生物(ModelOrganism)现在是12页\一共有101页\编辑于星期四12Arabidopsisthaliana
拟南芥个体生活周期只有6周的十字花科小草,是一种理想的模式植物。模式生物(ModelOrganism)现在是13页\一共有101页\编辑于星期四13Oryzasativa
水稻单子叶植物模式植物,390-430MB模式生物(ModelOrganism)现在是14页\一共有101页\编辑于星期四14模式生物(ModelOrganism)非洲瓜蟾(Xenopuslavias)1个受精卵在24小时内分裂到各种器官初具雏形的程度;现在是15页\一共有101页\编辑于星期四15模式生物(ModelOrganism)斑马鱼(Daniorerio)身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育过程的良好对象。现在是16页\一共有101页\编辑于星期四16模式生物(ModelOrganism)小鼠(Musmusculus)基因组大小与人类相近,约30亿个核苷酸对;现在是17页\一共有101页\编辑于星期四17现在是18页\一共有101页\编辑于星期四18现在是19页\一共有101页\编辑于星期四19提纲:模式生物测序3大核酸数据库蛋白质数据库现在是20页\一共有101页\编辑于星期四20主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,现在是21页\一共有101页\编辑于星期四213大核酸数据库基因组数据库的相关背景主要的基因组数据库资源重点介绍GenBank现在是22页\一共有101页\编辑于星期四22ATTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA现在是23页\一共有101页\编辑于星期四23DNA序列数据库最早于1982年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代。此后不久因一项美国国家健康研究中心与洛斯阿拉莫斯国家实验室的合同而诞生了GenBank。日本的DNA数据库(DDBJ),在几年后加入了数据收集的合作。基因组数据库的发展历史现在是24页\一共有101页\编辑于星期四24基因组数据库的发展历史1988年一次三方会议之后(现在称之为“国际DNA序列数据库合作计划”)达成协议,对数据库的记录采用共同的格式现在三个中心都收集直接提交的数据,并在三者之间发布。
现在是25页\一共有101页\编辑于星期四25三大基因数据库Genbank
Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(TheNationalCenterforBiotechnologyInformation,
NCBI)建立和维护的。
NCBI的网址是:。EMBL(TheEuropeanMolecularBiologyLaboratory
)核酸序列数据库
由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。
数据库网址是:。
DDBJ(DNADataBankofJapan)数据库
日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。
DDBJ的网址是:。现在是26页\一共有101页\编辑于星期四26GenBankPublicfreeAvailableviaInternetEMBLDataLibraryDDBJ(DNADataBankofJapan)三大基因数据库之间的关系现在是27页\一共有101页\编辑于星期四27现在是28页\一共有101页\编辑于星期四28美国的核酸数据库GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗从1979年开始建设,1982年正式运行。现在是29页\一共有101页\编辑于星期四29现在是30页\一共有101页\编辑于星期四30欧洲分子生物学实验室的EMBL数据库也于1982年开始服务。现在是31页\一共有101页\编辑于星期四31现在是32页\一共有101页\编辑于星期四32日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。现在是33页\一共有101页\编辑于星期四33现在是34页\一共有101页\编辑于星期四34现在是35页\一共有101页\编辑于星期四35现在是36页\一共有101页\编辑于星期四36现在是37页\一共有101页\编辑于星期四37现在是38页\一共有101页\编辑于星期四38现在是39页\一共有101页\编辑于星期四39提纲:模式生物测序3大核酸数据库蛋白质数据库现在是40页\一共有101页\编辑于星期四40蛋白质数据库现在是41页\一共有101页\编辑于星期四41主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,现在是42页\一共有101页\编辑于星期四4260年代“蛋白质信息资源”(ProteinInformationResource,简称PIR)雏形产生1984年,“蛋白质信息资源”计划正式启动,蛋白质序列数据库PIR也因此而诞生。1988年,美国的NBRF、日本的国际蛋白质信息数据库JIPID和德国的慕尼黑蛋白质序列信息中心MIPS合作成立了国际蛋白质信息中心(PIR-International),共同收集和维护蛋白质序列数据库PIR。现在是43页\一共有101页\编辑于星期四43
PIR(proteininformationresource)1.由美国NCBI翻译自GenBank的DNA序列(1984年);2.在EMBL和GenBank数据库上均建立了镜像站点;3.数据依据注释的质量分为4类。
网址:http://www-/分类名称(Name)说明(Comment)记录数(Numberofentries)PIR1已分类、已注释(Classifiedandannotated)13572PIR2已注释(Annotated)69368PIR3未核实(Unverified)7508PIR4未翻译(Unencodedoruntranslated)196PIR数据库的分类情况(Release51.03)现在是44页\一共有101页\编辑于星期四44现在是45页\一共有101页\编辑于星期四45除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所EBI共同维护和管理。
现在是46页\一共有101页\编辑于星期四46
SWISS-PROT
1.瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护(1986年);2.在EMBL和GenBank数据库上均建立了镜像站点;3.数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释;
SWISS-PROT的网址:现在是47页\一共有101页\编辑于星期四47现在是48页\一共有101页\编辑于星期四48
PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。TrEMBL:现在是49页\一共有101页\编辑于星期四49蛋白质结构数据库现在是50页\一共有101页\编辑于星期四50主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,现在是51页\一共有101页\编辑于星期四51
PDB(proteindatabank)1.目前最主要的蛋白质分子结构数据库;2.1970年代建立,美国Brookhaven国家实验室维护管理;3.1988年,由美国RCSB(researchcollaboratoryforstructuralbiology)管理;4.以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等;
PDB的网址:http://(美国)现在是52页\一共有101页\编辑于星期四52现在是53页\一共有101页\编辑于星期四53现在是54页\一共有101页\编辑于星期四54如何AccessPDB记录?现在是55页\一共有101页\编辑于星期四55如何AccessPDB记录?现在是56页\一共有101页\编辑于星期四56如何AccessPDB记录?现在是57页\一共有101页\编辑于星期四57如何AccessPDB记录?DownloadPDBfileViewPDBfileStructureviewoptions现在是58页\一共有101页\编辑于星期四58如何AccessPDB记录?现在是59页\一共有101页\编辑于星期四59如何AccessPDB记录?现在是60页\一共有101页\编辑于星期四60Questions:下列数据库分别是什么类型的数据库?GenBank,PIR,DDBJ,SWISS-PROT,PDB,EMBL,TrEMBL,现在是61页\一共有101页\编辑于星期四61第三章生物信息学数据库资源--数据库查询现在是62页\一共有101页\编辑于星期四62现在是63页\一共有101页\编辑于星期四63现在是64页\一共有101页\编辑于星期四64现在是65页\一共有101页\编辑于星期四65PubMed的特点收录的文献多!!大部分与生命科学相关自动词语匹配链接点多,部分在网上免费获得全文也可以直接定购原文现在是66页\一共有101页\编辑于星期四66二、检索规则现在是67页\一共有101页\编辑于星期四67二、检索规则现在是68页\一共有101页\编辑于星期四68现在是69页\一共有101页\编辑于星期四69现在是70页\一共有101页\编辑于星期四70现在是71页\一共有101页\编辑于星期四71复杂检索限制字段类别常用的有:Author:BaoYM[au]Title:stress[ti]Tilte/Abstract:stress[title/abstract]Date:1999:2009[dp]
现在是72页\一共有101页\编辑于星期四72复杂检索布尔逻辑运算:AND、OR、NOT必须大写。逻辑符的运算次序是从左至右,括号内的检索式可作为一个单元,优先运行。布尔逻辑检索允许在检索词后面附加字段标识例如:rice[ti]ANDBaoYM[au]AND2008:2009[dp]现在是73页\一共有101页\编辑于星期四73现在是74页\一共有101页\编辑于星期四74Question1:如何查找由ZhuJ实验室于2005以后发表的,题目中显示关于水稻的文献?现在是75页\一共有101页\编辑于星期四75Question2:如:我要查找BaoYM在Nature或Science上发表的论文1BaoYM[au]AND(Nature[Journal]ORScience[Journal])
2BaoYM[au]ANDNatureORScience[Journal]
3BaoYM[au]ANDNature[Journal]ORScience[Journal]4BaoYM[au]AND(NatureORScience)[Journal]哪一个检索语言是正确的?现在是76页\一共有101页\编辑于星期四76在PubMed页面上选择AdvancedSearch:现在是77页\一共有101页\编辑于星期四77在PubMed页面上选择AdvancedSearch:现在是78页\一共有101页\编辑于星期四78在PubMed页面上选择Limits:现在是79页\一共有101页\编辑于星期四79在PubMed页面上选择Limits:现在是80页\一共有101页\编辑于星期四80如何获取GenBank中的序列?现在是81页\一共有101页\编辑于星期四81同样存在限制字段:常用的有:Author:XingJY[au]
title:BMAL1[ti]organism:pig[organism]或者直接输入:Accession:
HQ657211[Accession]GeneName:BMAL1[GeneName]ProteinName:BMAL1
[ProteinName]如:XingJY[au]ANDBMAL1[ti]ANDpig[organism]如果没有限定,就是任意字段。如何获取GenBank中的序列?现在是82页\一共有101页\编辑于星期四82现在是83页\一共有101页\
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年四川中建三局装饰有限公司招聘笔试参考题库含答案解析
- 2025年国网电力科学研究院武汉南瑞有限责任公司招聘笔试参考题库附带答案详解
- 2025-2030全球高压有载分接开关行业调研及趋势分析报告
- 2025年全球及中国医用 PTFE 管行业头部企业市场占有率及排名调研报告
- 2025年度店铺债权债务转让合同范本
- 2025年度店铺租赁权转让及装修设计咨询服务合同3篇
- 二零二五年度车库购置与物业管理合作协议4篇
- 2024铁路货运合同铁路运输货物交付与验收协议3篇
- 二零二五年度餐厨废弃物处置与废弃物处理设施改造合同3篇
- 2025年度个人与个人草原生态修复工程合同范本
- 南通市2025届高三第一次调研测试(一模)地理试卷(含答案 )
- 2025年上海市闵行区中考数学一模试卷
- 2025中国人民保险集团校园招聘高频重点提升(共500题)附带答案详解
- 重症患者家属沟通管理制度
- 法规解读丨2024新版《突发事件应对法》及其应用案例
- IF钢物理冶金原理与关键工艺技术1
- 销售提成对赌协议书范本 3篇
- 劳务派遣招标文件范本
- EPC项目阶段划分及工作结构分解方案
- 《跨学科实践活动4 基于特定需求设计和制作简易供氧器》教学设计
- 信息安全意识培训课件
评论
0/150
提交评论