版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人类后基因组研究进展随着人类基因组计划(HGP)的顺利进行,生物医学研究已进入后基因组时代(Postgenomeera)[1]。基因组学的研究从结构基因组学(Structuralgenomics)过渡到功能基因组学(Functionalgenomics)。结构基因组学代表基因组分析的早期阶段,这个阶段以建立生物体高分辨遗传、物理和转录图谱为主。而以功能基因组学为代表的后基因组时代是利用结构基因组学提供的信息,系统的研究基因功能。它以高通量、大规模实验方法及统计与计算机分析为特征[2]。8~10万个基因的功能研究比HGP更为复杂和艰巨,必将成为下个世纪生命科学研究的主战场。后基因组研究涉及的主要内容及方法有:
1.生物信息学(Bioinformatics)
随着人类基因组计划(HGP)在世界范围内的展开,产生了巨量的基因信息,分析这些信息是人类基因组研究必不可少的内容。这也促成了生物信息学的发展。生物信息学是用数理和信息科学的观点、理论和方法去研究生命现象,组织和分析呈指数增长的生物学数据的一门学科。研究DNA和蛋白质,以计算机为主要工具,发展各种软件,把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息之后进行蛋白质空间结构的模拟和预测,然后依据特定蛋白质功能进行必要的药物设计。故此,生物信息学是由数据库、计算机网络和应用软件三大部分组成,对基因组信息学、蛋白质结构模拟以及药物设计的研究为主要目的的学科。结构基因组学提供了巨大的DNA和蛋白质数据,功能基因组学的一个任务就是如何充分利用数据库去研究基因功能。
生物信息学在人类基因中的应用主要有:
(1)新基因的发现与鉴定
使用基因组信息学的方法是发现新基因的重要手段,比如在啤酒酵母完整基因组(约1200万bp)所包含的5932个基因中,大约60%是通过信息分析得到的。
(2)非编码区信息结构分析
虽然对约占人类基因组95%的非编码区的作用人们还不清楚,但从生物进化的观点看来,这部分序列必定具有重要的生物功能。普遍的认识是,它们与基因在四维时空的表达调控有关。应用生物信息学可以分类与确定非编码区中各种组分、寻找新的非三联体的编码方式、研究编码区和非编码区中信息调节规律等三个方面来揭示非编码区的秘密。
(3)对生物进化的研究
自1859年Darwin的物种起源(OriginofSpecies)发表以来,进化是对人类自然科学和自然哲学发展的最重大贡献之一。自上世纪中叶以来,随着分子生物学的不断发展,进化论的研究也进入了分子水平,并建立了一套依赖于核酸、蛋白质序列信息的理论方法。现在随着序列信息的大量出现开展分子进化的研究具有了极好时机。
(4)完整基因组的比较研究
在后基因组时代,生物信息学家面对的不仅是序列和基因而是越来越多的完整基因组,由此而来的比较基因组学必须通过生物信息分析法采用现代手段来完成。
(5)大规模基因功能表达谱的分析
大规模基因功能表达谱的分析从数学角度看不是简单的NP问题、动力系统问题或不确定性问题,目前发展的新方法和工具无论是生物芯片还是蛋白质组技术都更强烈地依赖于生物信息学的理论、技术与数据库。
(6)药物设计
传统的药物研制主要是从大量的天然产物,如动物、植物、微生物和合成有机、无机化合物中进行筛选。往往得到一个可供临床使用的药物要筛选1万种不同的化合物,要经过10年左右的时间和耗资2.5~3.0亿美元。当前生物信息学的研究不仅可提供生物大分子空间结构的信息,还能提供电子结构的信息,如能级、表面电荷分布、分子轨道相互作用等以及动力学行为的信息,如生物化学反应中的能量变化、电荷迁移、构象变化等。理论模拟还可研究包括生物分子及其周围环境(如水、离子等)的复杂体系和生物分子的量子效应。这些模拟的结果为天然生物大分子的改性和基于受体结构的药物分子设计提供了依据。
2.基因功能研究
人类后基因组计划的关键点是基因的功能研究,这也是对功能基因加以开发利用研究的基础。主要包括以下内容:
2.1
基因表达谱的绘制
基因表达mRNA的水平反映了在一定环境、细胞类型、生长阶段和一定细胞状态下基因的功能信息。因此绘制所有基因的表达谱非常重要。目前,科学工作者已相继建立了mRNA差异显示、代表性差异分析、抑制性消减杂交、基因表达系列分析和cDNA微阵列等技术。新近在综合上述技术的优缺点的基础上建立的基因鉴定集成法是具有充分利用生物基因信息数据库进行基因鉴定(识别),并能提高稀有拷贝基因鉴定效率的优点。
2.2
基因调控研究
基因表达调控是功能基因组学研究的主要内容之一,不同条件下基因表达谱的变化是基因组调控的结果。这种调控直接决定了不同组织细胞中蛋白质的变化,进而影响相应的生化代谢通路的作用,最终引起一定的表型变化。所以,欲研究某一特定基因的功能,就不能不研究其表达的调控方式和机理。此外,现已知道,许多模式生物基因组虽然在长度上比人类的少,但所包含的基因数基本一致,只是少了一些非编码序列和在基因组中所处位置有所不同,这种差异造成他们表达谱的很大不同,因此,基因表达谱的差异是基因调控的不同之故。
2.3
模式生物体和比较基因组学研究
利用模式生物基因组与人类基因组之间编码顺序上和组织结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构,这便是比较基因组学。
所有生物都是通过一个共同的进化树联系在一起。因此研究一个生物可为其它生物提供有用的信息,其主要促进作用体现在:(1)利用基因顺序上的同源性克隆人类疾病基因。(2)模式生物基因组研究揭示人类疾病基因。(3)充分利用模式生物实验系统上的优越性来为最终了解人类基因服务。(4)模式生物基因组研究加深了对基因组结构的认识。(5)比较基因组作图使连锁信息和基因组资源从作图较为详尽的物种转移到作图不完善的物和用于复杂性状的分析。
目前与人类基因组计划同步进行的模式生物有E.coli、酵母、线虫、果蝇和小鼠,还有一些与人类生活密切相关的哺乳动物。酵母作为第一个真核生物基因组于1996年完成DNA测序;线虫作为第一个多细胞生物基因组于1998年底完成测序。而果蝇、小鼠和其它模式生物的基因组也以惊人的速度在进行。大量数据的积累将使人类对于生命以及人类自身有崭新的认识。
2.4
功能基因组学的研究方法
(1)诱变技术
定向诱变(targetedmutagenesis):定向诱变是利用同源重组技术,使胚胎干细胞(embryonicstemcell,EScell)内目的基因产生定点突变,这些突变可进一步用于基因敲除、转基因动物、显性负突变等研究。最近两年发展了许多构建靶结构的新方法如酿酒酵母中微同源重组(microhomologousrecombination),通过PCR的方法产生一个特定的靶DNA片段,这个片段含有一个两侧带有与酵母基因同源的35~50bp作为选择性标记,就足以促进酵母的同源重组,而在小鼠ES细胞中,至少需要19kb的连续基因组DNA才能产生有效的同源重组。以往这种方法只用在酵母中,现在也用到小鼠上。
表型诱变(phenotypedrivenmutagenesis)定向诱变方法是用于已知基因的突变,而表型诱变是用于未知基因,其主要优点是无需知道哪个基因以及这些基因的何种突变导致特定的表型或疾病[1]。用表型诱变剂进行诱变后,可以用筛查整个基因组的办法来寻找新的显性或隐性突变。该方法需要大量的小鼠杂交群体,工作量较大,但这种全基因组扫描法是筛查整个基因组中单一突变的最好方法,因为任何一个导致一定表型的可能突变都可以被检测出来。
(2)进化印记方法
基于生物的进化历程必定会在分子序列上留下相应的进化印记,即家族特异模体和直系同源簇特异模体组成的功能特异模体。首先用严格的进化分析方法把基因家族划分成各个直系同源簇,然后构建家族及每个直系同源簇的特异模体,借助已有的生物学事实,形成功能模体库。每一个未知基因产物的功能就用搜索此功能模体库来鉴定。
3.蛋白质组学研究(Proteomics)
由于生物功能的主要体现者是蛋白质,而蛋白质有其自身特有的活动规律,仅仅从基因的角度来研究是远远不够的。蛋白质的修饰加工、转运定位、结构形成、蛋白质与蛋白质的相互作用、蛋白质与核酸的相互作用等,均无法从在基因组水平上的研究获知。1990年代中期,国际上萌发了一门在整体水平上研究细胞内蛋白质的组成及其活动规律的新兴学科——蛋白质组学(Proteomics)。
蛋白质组(Proteome)的概念最早是在1994年由澳大利亚Macquarie大学的MarcWilkins和KeithWilliams首先提出来的。目前,美国、澳大利亚、欧洲和日本等已纷纷成立了有关的研究机构和公司,有人预测21世纪生命科学的重心将从基因组学转移到蛋白质组学。蛋白质组学以蛋白质组为研究对象,从蛋白质整体水平上来认识生命活动的规律。蛋白质组学的核心内容包括两个部分:蛋白质组研究体系的建立、完善和重要的生物学问题有关的功能蛋白质组研究[9]。
3.1
蛋白质组研究的主要手段
相对于基因组研究的进展速度,蛋白质组的研究显得相对滞后,主要原因是研究手段中众多技术问题尚未很好解决。从这几年中对基因组全序列分析已经完成的一些低等生物蛋白质组的研究看来,目前最现实、最有效的技术是双向凝胶电泳分离纯化蛋白质,结合计算机定量分析电泳图谱,并进一步用质谱对分离到的蛋白质进行鉴定,并运用现代生物信息学的知识和技术对所得到的天文数字的数据进行处理,对蛋白质以及它们执行的生命活动作出尽可能最精细、最准确、最本质的阐述[10]。当前蛋白质组的研究可分为两个阶段:第一阶段是建立一个细胞或一个组织或一个机体在“正常”条件下的蛋白质二维凝胶图谱,或称参考图谱,即所谓“组成蛋白质组”。第二阶段则要研究在各种条件下的蛋白质组的变化,从中总结出生命活动的规律,可以称为“功能蛋白质组”。
(1)双向凝胶电泳
双向凝胶电泳在1975年由O’Farrell以及Klose和Scheele等人发明,其原理是第一向基于蛋白质的等电点不同用等电聚焦分离,第二向则按分子量的不同用SDS分离,把复杂蛋白混合物中的蛋白质在二维平面上分开。近年来经过多方面改进已成为研究蛋白质组的最有实用价值的核心方法。
(2)“双向”高效柱层析
所谓“双向”高效柱层析,实际上是先进行一次分子筛柱层析,从柱上流出的蛋白峰自动进入第二向层析,通常是利用蛋白质表面疏水性质进行分离的反向柱层析[12]。这第二次分离的原理与双向电泳中利用蛋白质等电点分离完全不同,因此两种方法起到互相补充的作用。和双向电泳相比,“双向”高效柱层析的优点是可以适当放大,分离得到较多的蛋白量以供鉴定。另一个优点是流出的蛋白峰可以直接连通进入质谱进行鉴定,避免了“印迹”的步骤和因此引起的的缺点。
(3)质谱技术上面所说的两种技术都是分离技术,而质谱则是鉴定技术。质谱技术的原理并不新鲜,但是在1980年代早期出现的两种新的离子化技术,使质谱从仅能分析小分子挥发物质到可以研究生物大分子,1980年代末又发明了两种更新的离子化技术,一种是介质辅助的激光解吸/离子化(matrix-assistedlaserdesorption/ionization,MALDI),另一种是电喷雾离子化(electrosprayionization,ESI)。这些技术使能快速而极为准确地测定生物大分子的分子量;再结合各种新的质谱分析技术,便可以在各种水平上研究蛋白质,为蛋白质研究开辟了新的道路,使蛋白质组研究从蛋白质鉴定深入到高级结构研究,以及各种蛋白之间的相互作用研究。可以预见,未来的质谱技术必将是从基因组到其功能的各级水平的蛋白质研究的主要工具。用质谱技术可以进行的从基因组到蛋白质功能的研究可以归纳为表1。
表1
用质谱技术可以进行的从基因组到其功能的蛋白质研究问题/任务有关的质谱技术在基因组,蛋白序列库和EST序列库用MALDI或ESIMS,ESIMS/MS中筛到的蛋白是已知蛋白吗?MALDIPSD做肽谱,或做全蛋白的ESIMS/MS如未知,提供足够的序列信息做克隆蛋白鉴定,二级修饰,二硫键,异构体(序列错误)ESIMS/MS,MALDIPSD分子量测定,再用MALDI或ESIMS或MS/S做肽谱高级结构:折叠,稳定性,单体或多聚体用ESIMS监测重氢交换,MALDI或ESIMS监测表面标记,非变性条件下ESIMS,MALDIMS监测交联蛋白质何时和什么分子,怎样相互作用?亲和技术与MALDI或ESIMS结合,MALDI或ESIMS监测表面标记和有限水解
(4)生物信息学当前生物信息学已经不仅是高效地进行对基因组/蛋白组数据的分析,而且可以对已知的或新的基因产物进行全面的功能分析。例如用生物信息学对用质谱得到的肽指纹图谱(peptidemassfingerprinting)数据分析出了一个新的在进化过程中保守的模序(motif),它对蛋白质的结构和功能具有重要意义。用分子模建(molecularmodelling)揭示了在耐热菌Thermusaquaticus的肽延伸因子EFTu中的一个模序(340~345)对维持三个结构域之间的整体构象的完整性有重要意义。肽指纹图谱原先只是一个普通的蛋白质分析技术,但通过生物信息学处理则可以得到有功能意义的结构信息,甚至预测部分蛋白质的功能。
3.2
蛋白质组研究的应用
蛋白质组研究在学术上的重大意义已如前述。同时,其研究成果还将在医药和工业上得到广泛应用。对人类基因组在不同病理条件下所表达的蛋白质组的比较研究,和对一些致病细菌蛋白组的研究,将对了解疾病的原因和进行防治起到决定性的作用。现在肺病杆菌的基因全序列已经测定,蛋白组的研究也已开始进行[14]。心肌肥大症的蛋白组研究也已经起动,发现了与肌肉收缩密切有关的一种肌球蛋白的过度表达。农业上,育种也将从现在的通过个别基因的转移来改进个别性能,进人整体性能的改善。除人基因组外,有50多种生物的基因组分析已经完成或即将完成。一种在90℃生长的单细胞生物Aquifex的基因组的信息显然将对新的工业用酶的开发作出贡献,而病原体Staohylococusaureus基因组和蛋白质组的研究将发展新的抗菌素。可以预期蛋白质组研究必将对人类生活质量的提高和人的寿命的延长起巨大的作用。
4.基
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 事故处理的协议书
- 二手房购房协议书范例
- 重金属中毒性肾病病因介绍
- 幼儿园食堂食品卫生安全培训课件
- 《计算机文化基础 》课件-第7章
- (参考资料)罐头生产线环评报告表
- 工程材料概述-李子42课件讲解
- 2023年天津市市区重点中学高考语文一模试卷
- 保洁保绿员例行培训课件
- 《软体工程课程联盟》课件
- GB 29216-2012食品安全国家标准食品添加剂丙二醇
- 齐鲁工业大学信息管理学成考复习资料
- 公务员面试-自我认知与职位匹配课件
- 中频电治疗仪操作培训课件
- 柔弱的人课文课件
- 动物寄生虫病学课件
- 电梯曳引系统设计-毕业设计
- 三度房室传导阻滞护理查房课件
- 讲课比赛精品PPT-全概率公式贝叶斯公式-概率论与数理统计
- 药理学39人工合成抗菌药课件
- 班会课件 勿以恶小而为之勿以善小而不为
评论
0/150
提交评论