生物信息学资源1_第1页
生物信息学资源1_第2页
生物信息学资源1_第3页
生物信息学资源1_第4页
生物信息学资源1_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学资源1第1页/共70页2复习:细胞蛋白质核酸第二章生物信息学的生物学基础第2页/共70页3Questions:1.蛋白质二级结构有哪些?2.真核生物的启动子有什么作用?3.TSS,外显子和内含子的概念。4.如何判断起始密码子和终止密码子?内含子?5.基因表达调节有哪些?第3页/共70页4请画出示意图:1.中心法则2.真核生物基因的一般结构第4页/共70页5核酸中心法则

复制

DNA

转录

逆转录

复制

RNA

蛋白质

翻译

调控第5页/共70页6TATA盒

翻译起始植物C/GAANNATGG动物A/GNNATGG

各内含子加poly(A)信号植物G/AATAA1-3动物AATAAA

终止密码子

各个外显子

AGGA或

CAAT盒

加帽位点5'm7GpppNp

5'端真核基因的一般结构

TSS

第6页/共70页7编号名称第一章生物信息学引论第二章生物信息学的生物学基础第三章生物信息学数据库资源第四章DNA和蛋白质序列分析第五章系统发生分析第六章基因表达数据分析第七章其他常用生物信息学工具第八章电子克隆的原理和应用第九章基本生物信息学工具的开发与应用第7页/共70页8第三章生物信息学数据库资源第8页/共70页9提纲:模式生物测序3大核酸数据库蛋白质数据库第9页/共70页10提纲:模式生物测序3大核酸数据库蛋白质数据库第10页/共70页11humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis一、模式生物第11页/共70页12模式生物基因组计划模式生物基因组计划酵母、线虫、果蝇、细菌、拟南芥等共约50多种已完成,70余种正在进行。目前总量已达60亿碱基对!第12页/共70页virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians第13页/共70页14模式生物(ModelOrganism)病毒(Virus)不具有细胞形态结构,仅由核酸和蛋白质构成;如:人艾滋病毒HIV、SARS冠状病毒体积小,10~300nm;严格的专性细胞内寄生;对抗生素不敏感。电子显微镜下的SARS冠状病毒100nm第14页/共70页15Escherichiacoli

大肠杆菌大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。EscherichiacoliO157:H7EscherichiacoliK12模式生物(ModelOrganism)第15页/共70页16Saccharomycescerevisiae

酿酒酵母真菌界的单细胞真核生物,它的全基因组已在1996年测定。模式生物(ModelOrganism)第16页/共70页17秀丽线虫Caenorhabditiselegans

一种透明的、生活在海滩泥沙中的小虫。

细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元;

有6条染色体,全基因组于1998年测定,长9.7Mb

模式生物(ModelOrganism)第17页/共70页18Drosophilamelanogaster

果蝇繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。

模式生物(ModelOrganism)第18页/共70页19Arabidopsisthaliana

拟南芥个体生活周期只有6周的十字花科小草,是一种理想的模式植物。模式生物(ModelOrganism)第19页/共70页20Oryzasativa

水稻单子叶植物模式植物,390-430MB模式生物(ModelOrganism)第20页/共70页21模式生物(ModelOrganism)非洲瓜蟾(Xenopuslavias)

1个受精卵在24小时内分裂到各种器官初具雏形的程度;第21页/共70页22模式生物(ModelOrganism)斑马鱼(Daniorerio)身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育过程的良好对象。第22页/共70页23模式生物(ModelOrganism)小鼠(Musmusculus)基因组大小与人类相近,约30亿个核苷酸对;第23页/共70页24第24页/共70页25第25页/共70页26提纲:模式生物测序3大核酸数据库蛋白质数据库第26页/共70页27主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,第27页/共70页283大核酸数据库基因组数据库的相关背景。主要的基因组数据库资源。重点介绍GenBank第28页/共70页29ATTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA第29页/共70页30DNA序列数据库最早于1982年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代。此后不久因一项美国国家健康研究中心与洛斯阿拉莫斯国家实验室的合同而诞生了GenBank。日本的DNA数据库(DDBJ),在几年后加入了数据收集的合作。基因组数据库的发展历史第30页/共70页31基因组数据库的发展历史1988年一次三方会议之后(现在称之为“国际DNA序列数据库合作计划”)达成协议,对数据库的记录采用共同的格式现在三个中心都收集直接提交的数据,并在三者之间发布。

第31页/共70页32三大基因数据库Genbank

Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。

NCBI的网址是:。EMBL核酸序列数据库

由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。

数据库网址是:http://www.ebi.ac.uk/embl/。

DDBJ数据库

日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。

DDBJ的网址是:http://www.ddbj.nig.ac.jp/。第32页/共70页33GenBankPublicfreeAvailableviaInternetEMBLDataLibraryDDBJ(DNADataBankofJapan)三大基因数据库之间的关系第33页/共70页34/http://www.ddbj.nig.ac.jp/searches-e.htmlhttp://www.ebi.ac.uk/embl/第34页/共70页35美国的核酸数据库GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗从1979年开始建设,1982年正式运行;第35页/共70页36第36页/共70页37

欧洲分子生物学实验室的EMBL数据库也于1982年开始服务第37页/共70页38第38页/共70页39日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。第39页/共70页40第40页/共70页41/http://www.ddbj.nig.ac.jp/searches-e.htmlhttp://www.ebi.ac.uk/embl/第41页/共70页42GenBank

/第42页/共70页43第43页/共70页44第44页/共70页45第45页/共70页46第46页/共70页47提纲:模式生物测序3大核酸数据库蛋白质数据库第47页/共70页48蛋白质数据库第48页/共70页49主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,第49页/共70页5060年代“蛋白质信息资源”(ProteinInformationResource,简称PIR)雏形产生1984年,“蛋白质信息资源”(ProteinInformationResource,简称PIR)计划正式启动,蛋白质序列数据库PIR也因此而诞生。1988年,美国的NBRF、日本的国际蛋白质信息数据库JIPID和德国的慕尼黑蛋白质序列信息中心MIPS合作成立了国际蛋白质信息中心(PIR-International),共同收集和维护蛋白质序列数据库PIR。第50页/共70页51

除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所EBI共同维护和管理。

第51页/共70页52

PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。第52页/共70页53

SWISS-PROT

1.瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护(1986年);

2.在EMBL和GenBank数据库上均建立了镜像站点;3.数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释;

SWISS-PROT的网址:/sprot第53页/共70页54第54页/共70页55

PIR(proteininformationresource)1.由美国NCBI翻译自GenBank的DNA序列(1984年);

2.在EMBL和GenBank数据库上均建立了镜像站点;

3.数据依据注释的质量分为4类。

网址:/分类名称(Name)说明(Comment)记录数(Numberofentries)PIR1已分类、已注释(Classifiedandannotated)13572PIR2已注释(Annotated)69368PIR3未核实(Unverified)7508PIR4未翻译(Unencodedoruntranslated)196PIR数据库的分类情况(Release51.03)第55页/共70页56第56页/共70页57蛋白质结构数据库第57页/共70页58主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,第58页/共70页59

PDB(proteindatabank)

1.目前最主要的蛋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论