版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学资源1第1页/共70页2复习:细胞蛋白质核酸第二章生物信息学的生物学基础第2页/共70页3Questions:1.蛋白质二级结构有哪些?2.真核生物的启动子有什么作用?3.TSS,外显子和内含子的概念。4.如何判断起始密码子和终止密码子?内含子?5.基因表达调节有哪些?第3页/共70页4请画出示意图:1.中心法则2.真核生物基因的一般结构第4页/共70页5核酸中心法则
复制
DNA
转录
逆转录
复制
RNA
蛋白质
翻译
调控第5页/共70页6TATA盒
翻译起始植物C/GAANNATGG动物A/GNNATGG
各内含子加poly(A)信号植物G/AATAA1-3动物AATAAA
终止密码子
各个外显子
AGGA或
CAAT盒
加帽位点5'm7GpppNp
5'端真核基因的一般结构
TSS
第6页/共70页7编号名称第一章生物信息学引论第二章生物信息学的生物学基础第三章生物信息学数据库资源第四章DNA和蛋白质序列分析第五章系统发生分析第六章基因表达数据分析第七章其他常用生物信息学工具第八章电子克隆的原理和应用第九章基本生物信息学工具的开发与应用第7页/共70页8第三章生物信息学数据库资源第8页/共70页9提纲:模式生物测序3大核酸数据库蛋白质数据库第9页/共70页10提纲:模式生物测序3大核酸数据库蛋白质数据库第10页/共70页11humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis一、模式生物第11页/共70页12模式生物基因组计划模式生物基因组计划酵母、线虫、果蝇、细菌、拟南芥等共约50多种已完成,70余种正在进行。目前总量已达60亿碱基对!第12页/共70页virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians第13页/共70页14模式生物(ModelOrganism)病毒(Virus)不具有细胞形态结构,仅由核酸和蛋白质构成;如:人艾滋病毒HIV、SARS冠状病毒体积小,10~300nm;严格的专性细胞内寄生;对抗生素不敏感。电子显微镜下的SARS冠状病毒100nm第14页/共70页15Escherichiacoli
大肠杆菌大肠杆菌是研究得最为详尽的一个模式生物。这种只有1.6微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。EscherichiacoliO157:H7EscherichiacoliK12模式生物(ModelOrganism)第15页/共70页16Saccharomycescerevisiae
酿酒酵母真菌界的单细胞真核生物,它的全基因组已在1996年测定。模式生物(ModelOrganism)第16页/共70页17秀丽线虫Caenorhabditiselegans
一种透明的、生活在海滩泥沙中的小虫。
细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元;
有6条染色体,全基因组于1998年测定,长9.7Mb
模式生物(ModelOrganism)第17页/共70页18Drosophilamelanogaster
果蝇繁殖很快、容易诱发变异的小昆虫。总长达1.8亿核苷酸。
模式生物(ModelOrganism)第18页/共70页19Arabidopsisthaliana
拟南芥个体生活周期只有6周的十字花科小草,是一种理想的模式植物。模式生物(ModelOrganism)第19页/共70页20Oryzasativa
水稻单子叶植物模式植物,390-430MB模式生物(ModelOrganism)第20页/共70页21模式生物(ModelOrganism)非洲瓜蟾(Xenopuslavias)
1个受精卵在24小时内分裂到各种器官初具雏形的程度;第21页/共70页22模式生物(ModelOrganism)斑马鱼(Daniorerio)身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育过程的良好对象。第22页/共70页23模式生物(ModelOrganism)小鼠(Musmusculus)基因组大小与人类相近,约30亿个核苷酸对;第23页/共70页24第24页/共70页25第25页/共70页26提纲:模式生物测序3大核酸数据库蛋白质数据库第26页/共70页27主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,第27页/共70页283大核酸数据库基因组数据库的相关背景。主要的基因组数据库资源。重点介绍GenBank第28页/共70页29ATTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA第29页/共70页30DNA序列数据库最早于1982年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代。此后不久因一项美国国家健康研究中心与洛斯阿拉莫斯国家实验室的合同而诞生了GenBank。日本的DNA数据库(DDBJ),在几年后加入了数据收集的合作。基因组数据库的发展历史第30页/共70页31基因组数据库的发展历史1988年一次三方会议之后(现在称之为“国际DNA序列数据库合作计划”)达成协议,对数据库的记录采用共同的格式现在三个中心都收集直接提交的数据,并在三者之间发布。
第31页/共70页32三大基因数据库Genbank
Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。
NCBI的网址是:。EMBL核酸序列数据库
由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。
数据库网址是:http://www.ebi.ac.uk/embl/。
DDBJ数据库
日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。
DDBJ的网址是:http://www.ddbj.nig.ac.jp/。第32页/共70页33GenBankPublicfreeAvailableviaInternetEMBLDataLibraryDDBJ(DNADataBankofJapan)三大基因数据库之间的关系第33页/共70页34/http://www.ddbj.nig.ac.jp/searches-e.htmlhttp://www.ebi.ac.uk/embl/第34页/共70页35美国的核酸数据库GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗从1979年开始建设,1982年正式运行;第35页/共70页36第36页/共70页37
欧洲分子生物学实验室的EMBL数据库也于1982年开始服务第37页/共70页38第38页/共70页39日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。第39页/共70页40第40页/共70页41/http://www.ddbj.nig.ac.jp/searches-e.htmlhttp://www.ebi.ac.uk/embl/第41页/共70页42GenBank
/第42页/共70页43第43页/共70页44第44页/共70页45第45页/共70页46第46页/共70页47提纲:模式生物测序3大核酸数据库蛋白质数据库第47页/共70页48蛋白质数据库第48页/共70页49主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,第49页/共70页5060年代“蛋白质信息资源”(ProteinInformationResource,简称PIR)雏形产生1984年,“蛋白质信息资源”(ProteinInformationResource,简称PIR)计划正式启动,蛋白质序列数据库PIR也因此而诞生。1988年,美国的NBRF、日本的国际蛋白质信息数据库JIPID和德国的慕尼黑蛋白质序列信息中心MIPS合作成立了国际蛋白质信息中心(PIR-International),共同收集和维护蛋白质序列数据库PIR。第50页/共70页51
除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所EBI共同维护和管理。
第51页/共70页52
PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。第52页/共70页53
SWISS-PROT
1.瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护(1986年);
2.在EMBL和GenBank数据库上均建立了镜像站点;3.数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释;
SWISS-PROT的网址:/sprot第53页/共70页54第54页/共70页55
PIR(proteininformationresource)1.由美国NCBI翻译自GenBank的DNA序列(1984年);
2.在EMBL和GenBank数据库上均建立了镜像站点;
3.数据依据注释的质量分为4类。
网址:/分类名称(Name)说明(Comment)记录数(Numberofentries)PIR1已分类、已注释(Classifiedandannotated)13572PIR2已注释(Annotated)69368PIR3未核实(Unverified)7508PIR4未翻译(Unencodedoruntranslated)196PIR数据库的分类情况(Release51.03)第55页/共70页56第56页/共70页57蛋白质结构数据库第57页/共70页58主要的数据库资源核酸序列数据库主要有GenBank,EMBL,DDBJ等.蛋白质序列数据库主要有SWISS-PROT,PIR,TrEMBL等,蛋白结构数据库有PDB,MMDB等,与基因组有关的数据库还有dbEST,OMIM等,第58页/共70页59
PDB(proteindatabank)
1.目前最主要的蛋
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年保山c1客运资格证考试项目
- 2024年珠海道路旅客运输从业资格证模拟试题
- 吉首大学《结构模型设计制作》2021-2022学年第一学期期末试卷
- 吉林艺术学院《音乐美学Ⅰ》2021-2022学年第一学期期末试卷
- 吉林艺术学院《色彩基础训练II》2021-2022学年第一学期期末试卷
- 2024年共同经营宾馆合作协议书模板
- 2024年供货肉类合同范本
- 2024年大宗商办租赁合同范本
- 2024年大型储罐合同范本
- 公司与公司劳务外包协议书范文范本
- 水痘护理课件
- 肩关节镜术的健康宣教
- 2024年广西铝业集团有限公司招聘笔试参考题库附带答案详解
- 设立招投标代理公司可行性研究报告
- 四年级家长会(-完整版)
- 黑龙江省哈尔滨市南岗区2023-2024学年九年级上学期期末语文试题
- PCBA工艺管制制程稽查表
- 临床实践教学设计临床病例讨论与分析
- 小学呼吸道传染预防课件
- 幼儿园教职工消防培训课件
- 《朱兰质量手册》课件
评论
0/150
提交评论