生物信息学概论_第1页
生物信息学概论_第2页
生物信息学概论_第3页
生物信息学概论_第4页
生物信息学概论_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-6-101生物信息学生物信息学Bioinformatics2022-6-102理论课讲授内容理论课讲授内容第一讲第一讲 生物信息学概论生物信息学概论第二讲第二讲 医学信息学基础及信息学基本技术医学信息学基础及信息学基本技术第三讲第三讲 生物信息中心、核酸和蛋白质序列生物信息中心、核酸和蛋白质序列 资源资源第四讲第四讲 生物信息重要数据库生物信息重要数据库2022-6-103第五讲第五讲 序列比对序列比对第六讲第六讲 生物医学文献及生物医学文献及PCR第七讲第七讲 序列特征分析序列特征分析第八讲第八讲 生物信息学与基因芯片生物信息学与基因芯片2022-6-104生物生物信息信息学概论学

2、概论2022-6-105内容内容生物信息学概况生物信息学概况 生物信息学简介生物信息学简介 生物信息学、生物学基础生物信息学、生物学基础 历史、内容、任务、技术和方法历史、内容、任务、技术和方法 发展趋势及研究热点发展趋势及研究热点 生物信息学简介生物信息学简介2022-6-107三大自然科学之谜三大自然科学之谜 宇宙的起源宇宙的起源 生命的诞生生命的诞生 思维的奥秘思维的奥秘2022-6-1082022-6-109What is bioinformatics? from /wiki/Bioinformatics Bioinformatics and

3、 computational biology involve the use of techniques including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems usually on the molecular level. Research in computational biology often overlaps with syste

4、ms biology. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution. 2022-6-1010生物生物信息信息学学 说文解字:生物说文解字:生物 +

5、信息信息 + 学学 (bioinformatics) biology + information + theory 广义广义 应用信息科学的方法和技术,研究生物体系应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也理、病理、药理过程中的各种生物信息,或者也可以说成是可以说成是生命科学生命科学中的中的信息科学信息科学。 狭义狭义 应用应用信息科学信息科学的理论、方法和技术,管理、的理论、方法和技术,管

6、理、分析和利用分析和利用生物分子生物分子数据。数据。 2022-6-1011生物学家生物学家( (生物学问题生物学问题) )数学物理学家数学物理学家计算机科学家计算机科学家( (基础理论问题基础理论问题) )工程师工程师(技术应用)(技术应用)计算生物学计算生物学/ /生物信息学:生物信息学:三种科学文化的融合三种科学文化的融合2022-6-1012A marriage of BiologyInformationtechnology2022-6-1013数据数据算法算法应用应用(Bioinformatics)美国人类基因组计划实施五年后的总结美国人类基因组计划实施五年后的总结报告中,对生物信息

7、学作了以下定义报告中,对生物信息学作了以下定义: 生物信息学是一门交叉科学,它包含了生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,综合运用数学、和解释等在内的所有方面,综合运用数学、计算机科学和生物学的各种工具,来阐明和计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。理解大量数据所包含的生物学意义。2022-6-10152022-6-1016曼哈顿原子弹计划曼哈顿原子弹计划阿波罗登月计划阿波罗登月计划人类基因组计划人类基因组计划(Manhattan Project) 美国陆军部于美国陆

8、军部于1942年年6月开始实施的利月开始实施的利用核裂变反应来研用核裂变反应来研制原子弹的计划制原子弹的计划 阿波罗计划(阿波罗计划(Projec Apollo),是美国从),是美国从1961年到年到1972年从事的年从事的一系列载人登月飞行任一系列载人登月飞行任务务 2022-6-101760年代初,美国总统年代初,美国总统Kennedy提出两个科学计划:提出两个科学计划:登月计划登月计划攻克肿瘤计划攻克肿瘤计划 人类遗传信息的复杂性人类遗传信息的复杂性人类基因组计划人类基因组计划(HGP,Human Genome Project)2022-6-1018生命活动三要素:物质、能量、信息生命活

9、动三要素:物质、能量、信息 DNA: 遗传物质遗传物质(遗传信息的载体遗传信息的载体) 双螺旋结构双螺旋结构 A, C, G, T四种基本字符的复杂文本四种基本字符的复杂文本 基因基因(Gene):具有遗传效应的:具有遗传效应的DNA分子片段分子片段2022-6-1019 基因组基因组(Genome)(Genome):包含包含细胞或生物体细胞或生物体全套的遗传信息的全部全套的遗传信息的全部 遗传物质。遗传物质。原核生物原核生物( (细菌、病毒等细菌、病毒等) ) 真核生物真核生物( (真菌、植物、动物等真菌、植物、动物等) )人类基因组:人类基因组: 3.2109 bp 2022-6-1020

10、尽管比之于人类登月,尽管比之于人类登月,HGP的投入资金的投入资金要少得多,但要少得多,但HGP对人类生活的影响要对人类生活的影响要更为深远更为深远。因为随着这个计划的完成,。因为随着这个计划的完成,DNA分子中编码的分子中编码的遗传信息将对人类存遗传信息将对人类存在的化学基础作出最终的回答在的化学基础作出最终的回答。这将不。这将不仅帮助我们理解我们是如何作为健康的仅帮助我们理解我们是如何作为健康的人发挥正常功能的,而且也将在化学水人发挥正常功能的,而且也将在化学水平上解释遗传因子在各种疾病,如癌症、平上解释遗传因子在各种疾病,如癌症、早老痴呆症、精神分裂症等一些严重危早老痴呆症、精神分裂症等

11、一些严重危害人类健康的疾病中的作用。毕竟害人类健康的疾病中的作用。毕竟对人对人类自身更深入的了解是人类活动中最重类自身更深入的了解是人类活动中最重要的一个部分。要的一个部分。Watson ,1990,Science2022-6-10211984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组因组DNA序列的意义序列的意义1985 Dulbecco在在Science撰文撰文 “肿瘤研究的转折点肿瘤研究的转折点:人人 类基因组的测序类基因组的测序” 美国能源部美国能源部(DOE)提出提出“人类基因组计划人类基因组计划”草案草案1987 美国能源

12、部和国家卫生研究院(美国能源部和国家卫生研究院(NIH)联合为)联合为“人类人类 基因组计划基因组计划”下拨启动经费约下拨启动经费约550万美元万美元1989 美国成立美国成立“国家人类基因组研究中心国家人类基因组研究中心Watson担任担任 第一任主任第一任主任1990.10 经美国国会批准,人类基因组计划正式启动经美国国会批准,人类基因组计划正式启动2022-6-1022 第一个自由生物体流感嗜血菌第一个自由生物体流感嗜血菌(H. inf)的全的全基因组测序完成基因组测序完成1996 完成人类基因组计划的遗传作图完成人类基因组计划的遗传作图 启动模式生物基因组计划启动模式生物基因组计划H.

13、inf全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenorhabditis elegans秀丽线虫秀丽线虫2022-6-10231997 大肠杆菌大肠杆菌(E.coli)全基因组测序完成全基因组测序完成1998 完成人类基因组计划的物理作图完成人类基因组计划的物理作图 开始人类基因组的大规模测序开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争公司加入,与公共领域竞争 启动水稻基因组计划启动水稻基因组计划1999.7 第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因组大肠杆

14、菌及其全基因组水稻基因组计划水稻基因组计划2022-6-10242000 Celera公司宣布完成果蝇基因组测序公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组国际公共领域宣布完成第一个植物基因组拟南芥全基拟南芥全基 因组的测序工作因组的测序工作Drosophila melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥2022-6-10252001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面2000.6.26 公共领域和公共领域和Celera公司同时宣布完成人类基因组工作草图公司同时宣布完成人类基因组工作

15、草图2001.2.15 Nature刊文发表国际公共领域结果刊文发表国际公共领域结果2001.2.16 Science刊文发表刊文发表Celera公司及其合作者结果公司及其合作者结果2022-6-1026 1999年年12月月1日日,22号染色体测序完成号染色体测序完成 2006年年5月月18日日, 美国和英国科学家在英国美国和英国科学家在英国自然自然杂志网络版上发表了人类最后一个杂志网络版上发表了人类最后一个染色体染色体1号染色体的基因测序号染色体的基因测序 全部人类基因组约有全部人类基因组约有2.91Gbp,约有,约有39000多多个基因;个基因; 1号染色体包含基因数量最多,达号染色体包

16、含基因数量最多,达3141个,是平均水平的两倍,共有超过个,是平均水平的两倍,共有超过2.23亿个碱基对;亿个碱基对; 19号染色体是含基因最丰富的号染色体是含基因最丰富的染色体,而染色体,而13号染色体含基因量最少号染色体含基因量最少2022-6-1027 随着实验数据和可利用信息急剧增加,信息的管理和随着实验数据和可利用信息急剧增加,信息的管理和分析成为分析成为HGP的一项重要的工作的一项重要的工作 发现生物学发现生物学规律规律解读生物解读生物遗传密码遗传密码认识生命的本质认识生命的本质研究基因组数据研究基因组数据之间的关系之间的关系分析现有的分析现有的基因组数据基因组数据利用数学模型利用

17、数学模型和计算技术和计算技术2022-6-1028 各学科参与、协作:生命科学、数学、物理学、化学、计算机各学科参与、协作:生命科学、数学、物理学、化学、计算机 科学、材料科学以及伦理、法律等社会科学科学、材料科学以及伦理、法律等社会科学 首要科学问题首要科学问题 如何找到记载在基因组如何找到记载在基因组DNA一维结构上控制生命时间、空间一维结构上控制生命时间、空间 的调控信息的编码方式和调节规律。的调控信息的编码方式和调节规律。 应用数学、复杂系统理论、信息论、非线性科学应用数学、复杂系统理论、信息论、非线性科学 催生催生生物信息学、计算生物学生物信息学、计算生物学 芯片技术芯片技术 交叉性

18、技术领域:物理学、微电子信息技术、生化技术、信交叉性技术领域:物理学、微电子信息技术、生化技术、信 息技术、自动化、材料科学息技术、自动化、材料科学 结构生物学结构生物学 前沿领域之一:生物物理学、生物化学、晶体学、波谱学、前沿领域之一:生物物理学、生物化学、晶体学、波谱学、 光谱学以及光谱学以及X射线晶体衍射技术、核磁共振技术射线晶体衍射技术、核磁共振技术2022-6-1029 生物学数据的收集、存储、管理与提供生物学数据的收集、存储、管理与提供 基因组序列信息的提取和分析基因组序列信息的提取和分析 功能基因组相关信息分析功能基因组相关信息分析 生物大分子结构模拟和药物设计生物大分子结构模拟

19、和药物设计 生物信息分析的技术与方法研究生物信息分析的技术与方法研究 应用与发展研究应用与发展研究生物信息学的主要研究内容生物信息学的主要研究内容2022-6-1030基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR2022-6-1031数据库搜索及序列比较数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比较寻找相搜索同源序列在一定程度上就是通过序列比较寻找相似序列似序列 序列比较序列比较的一个基本操作就是的一个基本操作就是比对比对(Alignment),即),即将两个序列的

20、各个字符(代表核苷酸或者氨基酸残基)将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种两个序列共有的排列顺序,这是序列相似程度的一种定性描述定性描述 多重序列比对多重序列比对研究的是多个序列的共性。序列的多重研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。究一组蛋白质之间的进化关系。 2022-6-1032基因组序列分析基因组序列分析 遗传语言分析遗传语言

21、分析天书天书 基因组结构分析基因组结构分析 基因识别基因识别 基因功能注释基因功能注释 基因调控信息分析基因调控信息分析 基因组比较基因组比较CTCAGATTGAACGCTGGcGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGCAGCTTGCTGCTTCGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAG

22、TAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCACCCACACTGGAACTGAGACGACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGTGTTGAGGTTAATAACCTCATCGATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCG

23、TTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGT

24、GGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCcGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCAGGCCGGGAACTCA

25、AAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTA2022-6-1034基因表达数据的分析与处理基因表达数据的分析与处理 基因表达数据分析基因表达数据分析是目前生

26、物信息学研究的热是目前生物信息学研究的热 点和重点点和重点 目前对基因表达数据的处理主要是进行目前对基因表达数据的处理主要是进行聚类分聚类分 析析,将表达模式相似的基因聚为一类,在此基将表达模式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能础上寻找相关基因,分析基因的功能 所用方法所用方法主要有:相关分析方法、模式识别技主要有:相关分析方法、模式识别技术中的层次式聚类方法、人工智能中的自组织术中的层次式聚类方法、人工智能中的自组织映射神经网络、主元分析方法映射神经网络、主元分析方法 等等 表达数据表达数据缺点缺点:仅反映仅反映mRNA丰度,噪声,丰度,噪声,2022-6-1035

27、蛋白质结构预测蛋白质结构预测 蛋白质的生物蛋白质的生物功能功能由蛋白质的由蛋白质的结构结构所决定,蛋所决定,蛋白质结构预测成为了解蛋白质功能的重要途径白质结构预测成为了解蛋白质功能的重要途径 蛋白质结构预测分为蛋白质结构预测分为: : 二级结构预测二级结构预测 空间结构预测空间结构预测 蛋白质折叠蛋白质折叠2022-6-1036 在一定程度上二级结构的预测可以归结为模式识别问题在一定程度上二级结构的预测可以归结为模式识别问题 在二级结构预测方面主要方法有:在二级结构预测方面主要方法有: 立体化学方法立体化学方法 图论方法图论方法 统计方法统计方法 最邻近决策方法最邻近决策方法 基于规则的专家系

28、统方法基于规则的专家系统方法 分子动力学方法分子动力学方法 人工神经网络方法人工神经网络方法 预测准确率超过预测准确率超过70%的第一个软件是基于神经网络的的第一个软件是基于神经网络的PHD系统系统2022-6-1037 在空间结构预测方面,比较成功的理论方法是在空间结构预测方面,比较成功的理论方法是同源模型法同源模型法 该方法的依据是:相似序列的蛋白质倾向于折该方法的依据是:相似序列的蛋白质倾向于折叠成相似的三维空间结构叠成相似的三维空间结构 运用同源模型方法可以完成所有蛋白质运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作的空间结构预测工作 发展趋势及研究热点发展趋势及研究

29、热点2022-6-1039系统生物学系统生物学(Systems Biology): 由分析为主走向分析与综合并举的系统方法由分析为主走向分析与综合并举的系统方法 微观微观还原论还原论 整体整体系统论系统论统一生物学统一生物学(General Biology): 探索生命活动本质,产生统一的生命观和统一的生物学探索生命活动本质,产生统一的生命观和统一的生物学实验、理论、计算生物学:实验、理论、计算生物学: (Experimental, Theoretical, Computational Biology ) 生命科学与数、理、化、计算机等学科的大综合、大交叉生命科学与数、理、化、计算机等学科的大

30、综合、大交叉生物技术的产业化生物技术的产业化(Biotechnology): 基础研究转化为生产力基础研究转化为生产力 生物工程技术生物工程技术农、林、医药农、林、医药2022-6-1040生物大分子的结构与功能研究生物大分子的结构与功能研究基因组与细胞的研究基因组与细胞的研究基因组比较研究基因组比较研究关于遗传、发育、分化、进化的综合理论研究关于遗传、发育、分化、进化的综合理论研究脑科学和神经科学研究脑科学和神经科学研究行为科学研究行为科学研究生态学研究生态学研究人体功能研究人体功能研究研究手段:研究手段:实验、理论、计算相结合实验、理论、计算相结合2022-6-1041 当今生物信息学界的

31、大部分人都当今生物信息学界的大部分人都把注意力集中在把注意力集中在基因组、蛋白质组、基因组、蛋白质组、蛋白质结构蛋白质结构以及与之相结合的以及与之相结合的药物设药物设计计上,随蛋白组学、代谢组学进一步上,随蛋白组学、代谢组学进一步的发展,将在的发展,将在整体整体水平进行。水平进行。 2022-6-1042基因组基因组 新基因的发现新基因的发现 通过计算分析从通过计算分析从EST(Expressed Sequence Tags)序列库中拼接出完整的新基因编码区,)序列库中拼接出完整的新基因编码区,也就是通俗所说的也就是通俗所说的“电子克隆电子克隆”;通过计算分;通过计算分析从基因组析从基因组DN

32、A序列中确定新基因编码区,经序列中确定新基因编码区,经过多年的积累,已经形成许多分析方法,如根过多年的积累,已经形成许多分析方法,如根据编码区具有的独特序列特征、根据编码区与据编码区具有的独特序列特征、根据编码区与非编码区在碱基组成上的差异、根据高维分布非编码区在碱基组成上的差异、根据高维分布的统计方法、根据神经网络方法、根据分形方的统计方法、根据神经网络方法、根据分形方法和根据密码学方法等。法和根据密码学方法等。 2022-6-1043非蛋白编码区生物学意义的分析非蛋白编码区生物学意义的分析 2022-6-1044 非蛋白编码区约占人类基因组的非蛋白编码区约占人类基因组的95%,其,其生物学

33、意义目前尚不是很清楚,但从演化观点生物学意义目前尚不是很清楚,但从演化观点来看,其中必然蕴含着重要的生物学功能,由来看,其中必然蕴含着重要的生物学功能,由于它们并不编码蛋白,一般认为,它们的生物于它们并不编码蛋白,一般认为,它们的生物学功能可能体现在对基因表达的时空调控上。学功能可能体现在对基因表达的时空调控上。2022-6-1045研究非蛋白编码区生物学意义的两种策略:研究非蛋白编码区生物学意义的两种策略: 一种一种是基于已有的已经为实验证实的所有功能是基于已有的已经为实验证实的所有功能已知的已知的DNA元件的序列特征,预测非蛋白编码区元件的序列特征,预测非蛋白编码区中可能含有的功能已知的中

34、可能含有的功能已知的DNA元件,从而预测其元件,从而预测其可能的生物学功能,并通过实验进行验证;可能的生物学功能,并通过实验进行验证; 另一种另一种则是通过数理理论直接探索非蛋白编码则是通过数理理论直接探索非蛋白编码区的新的未知的序列特征,并从理论上预测其可区的新的未知的序列特征,并从理论上预测其可能的信息含义,最后同样通过实验验证。能的信息含义,最后同样通过实验验证。 2022-6-1046基因组整体功能及其调节网络的系统把握基因组整体功能及其调节网络的系统把握 把握生命的本质,仅仅掌握基因组中部分把握生命的本质,仅仅掌握基因组中部分基因的表达调控是远远不够的,因为生命现象基因的表达调控是远

35、远不够的,因为生命现象是基因组中所有功能单元相互作用共同制造出是基因组中所有功能单元相互作用共同制造出来的。来的。基因芯片基因芯片技术由于可以监测基因组在各技术由于可以监测基因组在各种时间断面上的整体转录表达状况,因此成为种时间断面上的整体转录表达状况,因此成为该领域中一项非常重要和关键的实验技术,对该领域中一项非常重要和关键的实验技术,对该技术所产生的大量实验数据进行高效分析,该技术所产生的大量实验数据进行高效分析,从中获得基因组运转以及调控的整体从中获得基因组运转以及调控的整体系统的机系统的机制制或者是网络机制,便成了生物信息学在该领或者是网络机制,便成了生物信息学在该领域中首先要解决的问

36、题。域中首先要解决的问题。 2022-6-1047基因组演化与物种演化基因组演化与物种演化 (生命之树)2022-6-1048 尽管已经在分子演化方面取得了许多重要的成尽管已经在分子演化方面取得了许多重要的成就,但仅仅依靠某些基因或者分子的演化现象,就想就,但仅仅依靠某些基因或者分子的演化现象,就想阐明物种整体的演化历史似乎不太可靠。例如,智人阐明物种整体的演化历史似乎不太可靠。例如,智人与黑猩猩之间有与黑猩猩之间有98%-99%98%-99%的结构基因和蛋白质是相同的,的结构基因和蛋白质是相同的,然而表型上却具有如此巨大的差异,这就不能不使我然而表型上却具有如此巨大的差异,这就不能不使我们联

37、想到形形色色千差万别的建筑楼群,它们的外观们联想到形形色色千差万别的建筑楼群,它们的外观如此不同,但基础的部件组成却是几乎一样的,差别如此不同,但基础的部件组成却是几乎一样的,差别就在于这些基础部件的组织方式不同,这就提示我们就在于这些基础部件的组织方式不同,这就提示我们基因组整体组织方式而不仅仅是个别基因在研究物种基因组整体组织方式而不仅仅是个别基因在研究物种演化历史中的重要作用。由于基因组是物种所有遗传演化历史中的重要作用。由于基因组是物种所有遗传信息的储藏库,从根本上决定着物种个体的发育和生信息的储藏库,从根本上决定着物种个体的发育和生理,因此,理,因此,从基因组整体结构组织和整体功能调

38、节网从基因组整体结构组织和整体功能调节网络方面,结合相应的生理表征现象,进行基因组整体络方面,结合相应的生理表征现象,进行基因组整体的演化研究,将是揭示物种真实演化历史的最佳途径。的演化研究,将是揭示物种真实演化历史的最佳途径。 2022-6-1049 基因组对生命体的整体控制必须通过它所表达的全部基因组对生命体的整体控制必须通过它所表达的全部蛋白质来执行,由于基因芯片技术只能蛋白质来执行,由于基因芯片技术只能反映从基因组到反映从基因组到RNA的转录水平上的表达的转录水平上的表达情况,由于从情况,由于从RNA到蛋白质还到蛋白质还有许多中间环节的影响,因此仅凭基因芯片技术我们还有许多中间环节的影

39、响,因此仅凭基因芯片技术我们还不能最终掌握生物功能具体执行者不能最终掌握生物功能具体执行者蛋白质的整体表蛋白质的整体表达状况;达状况; 近几年在发展基因芯片的同时,人们也发展了一套研近几年在发展基因芯片的同时,人们也发展了一套研究究基因组所有蛋白质产物表达情况基因组所有蛋白质产物表达情况蛋白质组蛋白质组研究技研究技术,从技术上来讲包括术,从技术上来讲包括二维凝胶电泳技术二维凝胶电泳技术和和质谱质谱测序技测序技术。通过二维凝胶电泳技术可以获得某一时间截面上蛋术。通过二维凝胶电泳技术可以获得某一时间截面上蛋白质组的表达情况,通过质谱测序技术就可以得到所有白质组的表达情况,通过质谱测序技术就可以得到

40、所有这些蛋白质的序列组成。这些都是技术实现问题,最重这些蛋白质的序列组成。这些都是技术实现问题,最重要的就是如何运用要的就是如何运用生物信息学理论方法生物信息学理论方法去分析所得到的去分析所得到的巨量数据,从中还原出巨量数据,从中还原出生命运转和调控的整体系统生命运转和调控的整体系统的分的分子机制。子机制。 蛋白质组蛋白质组 2022-6-1050 基因组和蛋白质组研究的迅猛发基因组和蛋白质组研究的迅猛发展,使许多新蛋白序列涌现出来,展,使许多新蛋白序列涌现出来,然而要想了解它们的功能,只有氨然而要想了解它们的功能,只有氨基酸序列是远远不够的,因为蛋白基酸序列是远远不够的,因为蛋白质的功能是通

41、过其三维高级结构来质的功能是通过其三维高级结构来执行的,而且执行的,而且蛋白质三维结构也不蛋白质三维结构也不一定是静态的,在行使功能的过程一定是静态的,在行使功能的过程中其结构也会相应的有所改变中其结构也会相应的有所改变。因因此,得到这些新蛋白的完整、精确此,得到这些新蛋白的完整、精确和动态的和动态的三维结构三维结构就成为摆在我们就成为摆在我们面前的紧迫任务。目前除了通过诸面前的紧迫任务。目前除了通过诸如如X射线晶体结构分析、多维核磁共射线晶体结构分析、多维核磁共振(振(NMR)波谱分析和电子显微镜)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,二维晶体三维重构(电子晶体学,EC)等物理方

42、法得到)等物理方法得到蛋白质三维结蛋白质三维结构构蛋白质结构蛋白质结构 2022-6-1051 另外一种广另外一种广泛使用的方法就是泛使用的方法就是通过通过计算机辅助预计算机辅助预测测的方法,目前,的方法,目前,一般认为蛋白质的一般认为蛋白质的折叠类型只有数百折叠类型只有数百到数千种,远远小到数千种,远远小于蛋白质所具有的于蛋白质所具有的自由度数目,而且自由度数目,而且蛋白质的折叠类型蛋白质的折叠类型与其氨基酸序列具与其氨基酸序列具有相关性,这样就有相关性,这样就有可能直接从蛋白有可能直接从蛋白质的氨基酸序列通质的氨基酸序列通过计算机辅助方法过计算机辅助方法预测出蛋白质的三预测出蛋白质的三维结构维结构 2022-6-1052新药设计新药设计 2022-6-1053 随着结构生物学的发展,相当数量的蛋白随着结构生物学的发展,相当数量的蛋白质以及一些核酸、多糖的三维结构获得精确测定,质以及一些核酸、多糖的三维结构获得精确测定,基于生物大分子结构知识的药物设计成为当前的基于生物大分子结构知识的药物设计成为当前的热点。生物信息学的研究不仅可提供热点。生物信息学的研究不仅可提供生物大分子生物大分子空间结构的信息空间结构的信息,还能提供还能提供电子结构电子结构的信息,如的信息,如能级、表面电荷分布、分子轨道相互作用等以及能级、表面电荷分布、分子轨道相互作用等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论