生物信息学资源课件1_第1页
生物信息学资源课件1_第2页
生物信息学资源课件1_第3页
生物信息学资源课件1_第4页
生物信息学资源课件1_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学Bioinformatics1复习:细胞蛋白质核酸第二章生物信息学的生物学基础2Questions:1. 蛋白质二级结构有哪些?2. 真核生物的启动子有什么作用?3. TSS,外显子和内含子的概念。4. 如何判断起始密码子和终止密码子?内含子?5. 基因表达调节有哪些?3请画出示意图:1. 中心法则2. 真核生物基因的一般结构4核酸中心法则 复制 DNA 转录 逆转录 复制 RNA 蛋白质 翻译 调控5TATA盒 翻译起始植物C/GAANNATGG动物A/GNNATGG 各内含子加poly(A)信号植物 G/AATAA1-3动物 AATAAA 终止密码子 各个外显子 AGGA或 CA

2、AT盒 加帽位点 5m7GpppNp 5端 真核基因的一般结构 TSS 6编号名称第一章生物信息学引论第二章生物信息学的生物学基础第三章生物信息学数据库资源第四章DNA和蛋白质序列分析第五章系统发生分析第六章基因表达数据分析第七章其他常用生物信息学工具第八章电子克隆的原理和应用第九章基本生物信息学工具的开发与应用7第三章 生物信息学数据库资源8提纲:模式生物测序3大核酸数据库蛋白质数据库9提纲:模式生物测序3大核酸数据库蛋白质数据库10humanArabidopsisThermotoga maritimaEscherichia coliBuchnerasp. APSRickettsia pro

3、wazekiiUreaplasma urealyticumBacillus subtilisDrosophila melanogasterThermoplasma acidophilumPlasmodium falciparumHelicobacter pylori mouseCaenorhabitis elegansratBorrelia burgorferiBorrelia burgorferiAquifex aeolicusNeisseria meningitidis Z2491Mycobacterium tuberculosis 一、模式生物11模式生物基因组计划模式生物基因组计划 酵

4、母、线虫、果蝇、细菌、拟南芥等共约50多种已完成,70余种正在进行。目前总量已达60亿碱基对! 12virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenome sizes in nucleotide pairs (base-pairs)10410810510610710111010109bony fishamphibians模式生物(Model Organism)病毒(Virus) 不具有细胞形态结构,仅由核酸和蛋白质构成; 如:人艾滋病毒HIV、SARS冠状病毒 体积小,10300nm; 严

5、格的专性细胞内寄生; 对抗生素不敏感。电子显微镜下的SARS冠状病毒100nm14Escherichia coli大肠杆菌大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。Escherichia coli O157:H7Escherichia coli K12模式生物(Model Organism)15Saccharomyces cerevisiae酿酒酵母真菌界的单细胞真核生物,它的全基因组已在1996年测定。模式生物(Model Organism)16秀丽线虫Caenorhabditis elegans一种透明

6、的、生活在海滩泥沙中的小虫。 细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元; 有6条染色体,全基因组于1998年测定,长9.7Mb模式生物(Model Organism)17Drosophila melanogaster果蝇繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。 模式生物(Model Organism)18Arabidopsis thaliana拟南芥个体生活周期只有6周的十字花科小草,是一种理想的模式植物。模式生物(Model Organism)19Oryza sativa水稻单子叶植物模式植物,390-430MB模式生物(Model Organism)20

7、模式生物(Model Organism)非洲瓜蟾(Xenopus lavias) 1个受精卵在24小时内分裂到各种器官初具雏形的程度;21模式生物(Model Organism)斑马鱼(Danio rerio) 身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育过程的良好对象。22模式生物(Model Organism)小鼠(Mus musculus) 基因组大小与人类相近,约30亿个核苷酸对;232425提纲:模式生物测序3大核酸数据库蛋白质数据库26主要的数据库资源核酸序列数据库主要有GenBank, EMBL, DDBJ等.蛋白质序列数据库主要有SWISS-PROT, PIR, TrE

8、MBL等,蛋白结构数据库有PDB, MMDB等,与基因组有关的数据库还有dbEST, OMIM等,273大核酸数据库基因组数据库的相关背景。主要的基因组数据库资源。重点介绍GenBank28ATTGACTAPrimary vs. Derivative DatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTA

9、TAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA29DNA序列数据库最早于1982年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代。此后不久因一项美国国家健康研究中心与洛斯阿拉莫斯国家实验室的合同而诞生了GenBank。日本的DNA数据库(DDBJ),在几年后加入了

10、数据收集的合作。基因组数据库的发展历史30基因组数据库的发展历史1988年一次三方会议之后(现在称之为“国际DNA序列数据库合作计划”)达成协议,对数据库的记录采用共同的格式现在三个中心都收集直接提交的数据,并在三者之间发布。 31三大基因数据库GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。NCBI的网址是:。EMBL核酸序列数据库由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。数据库网址是:http:/www

11、.ebi.ac.uk/embl/。DDBJ数据库日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。DDBJ的网址是:http:/www.ddbj.nig.ac.jp/。32GenBankPublicfreeAvailableviaInternetEMBL Data LibraryDDBJ (DNA Data Bank of Japan)三大基因数据库之间的关系33http:/http:/www.ddbj.nig.ac.jp/searches-e.htmlhttp:/www.ebi.ac.

12、uk/embl/34美国的核酸数据库GenBankBanson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7从1979年开始建设,1982年正式运行;3536 欧洲分子生物学实验室的EMBL数据库也于1982年开始服务3738日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。3940http:/http:/www.ddbj.nig.ac.jp/searches-e.htmlhttp:/www.ebi.ac.uk/embl/41GenBankhttp:/4243444546提纲:模式生物测序3大核酸数据库蛋白质数据库47蛋白

13、质数据库48主要的数据库资源核酸序列数据库主要有GenBank, EMBL, DDBJ等.蛋白质序列数据库主要有SWISS-PROT, PIR, TrEMBL等,蛋白结构数据库有PDB, MMDB等,与基因组有关的数据库还有dbEST, OMIM等,4960年代“蛋白质信息资源”(Protein Information Resource,简称PIR)雏形产生1984年,“蛋白质信息资源”(Protein Information Resource,简称PIR)计划正式启动,蛋白质序列数据库PIR也因此而诞生。1988年,美国的NBRF、日本的国际蛋白质信息数据库JIPID和德国的慕尼黑蛋白质序列

14、信息中心MIPS合作成立了国际蛋白质信息中心(PIR-International),共同收集和维护蛋白质序列数据库PIR。50 除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。 该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所 EBI共同维护和管理。 51 PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。 蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。52 SWISSPROT 1. 瑞士日内瓦大学医学生物化学系

15、和欧洲生物信息学研究所(EBI)合作维护(1986年); 2. 在EMBL和GenBank数据库上均建立了镜像站点; 3. 数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释; SWISS-PROT的网址: /sprot5354 PIR(protein information resource) 1. 由美国NCBI翻译自GenBank的DNA序列(1984年); 2. 在EMBL和GenBank数据库上均建立了镜像站点; 3. 数据依据注释的质量分为4类。 网址: http:/www-/分类名称(Name)说明(Comment)记录数(Number of entries)PI

16、R1已分类、已注释(Classified and annotated)13572PIR2已注释(Annotated)69368PIR3未核实(Unverified)7508PIR4未翻译(Unencoded or untranslated)196PIR数据库的分类情况(Release 51.03)5556蛋白质结构数据库57主要的数据库资源核酸序列数据库主要有GenBank, EMBL, DDBJ等.蛋白质序列数据库主要有SWISS-PROT, PIR, TrEMBL等,蛋白结构数据库有PDB, MMDB等,与基因组有关的数据库还有dbEST, OMIM等,58 PDB(protein data bank) 1. 目前最主要的蛋白质分子结构数据库; 2. 1970年代建立,美国Brookhaven国家实验室维护管理; 3. 1988年,由美国RCSB(research collaboratory for structural biology)管理; 4. 以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等; PDB的网址:http:/pdb(美国) 59606

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论