医学分子生物学1剖析_第1页
医学分子生物学1剖析_第2页
医学分子生物学1剖析_第3页
医学分子生物学1剖析_第4页
医学分子生物学1剖析_第5页
已阅读5页,还剩167页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE116医学分子生物学全国高等医药院校研究生规划教材供基础、临床、预防、口腔医学、护理学、药学专业用医学分子生物学主编查锡良副主编药立波主审刘德培编者(以姓氏笔画为序)冯作化(华中科技大学同济医学院)金颖(上海第二医科大学)申宗候(复旦大学上海医学院)昌增益(清华大学)李刚(北京大学医学部)药立波(第四军医大学)杨安钢(第四军医大学)贺竹梅(中山大学)宋惠萍(中南大学湘雅医学院)查锡良(复旦大学上海医学院)屈伸(华中科技大学同济医学院)徐安龙(中山大学)周春燕(北京大学医学部)前言继20世纪50年代Watson和Crick揭示了遗传信息携带者DNA的双螺旋结构后,近50年来分子生物学的发展势如破竹。60年代中期遗传信息传递的中心法则的初步确定;70年代基因重组理论和技术的崛起;以及近二三十年来基因的表达和调控及相关的发育分子生物学的进展;蛋白质翻译后加工、折叠、组装、转运,生物大分子相互识别、信号转导的深入研究等;一个个里程碑工作接踵而来。人类基因组计划业已完成,不久完整的人类基因组序列将呈现在人们面前。一个崭新的时代——后基因组时代已经来临。分子生物学是一门从生物大分子结构和功能水平上阐述各种生命现象的前沿学科,其内涵也随着生命科学的发展而日益丰富。尤为重要的是分子生物学的新理论、新技术迅速渗透到生命科学的各个领域,产生了诸如分子遗传学、分子生理学、分子免疫学、分子微生物学、分子神经生物学、分子病理学和分子药理学等新兴的交叉学科,医学分子生物学也应运而生。医学分子生物学是分子生物学的重要分支,它与基础医学和临床医学密切结合,研究生物大分子结构、功能、调控机制及其人体各种生理和病理状态的分子机制。医学分子生物学的进步大大促进了基础医学和临床医学的发展,有效地推动了新的诊断、治疗、预防方法的建立以及新的健康理念的发展。本教材为全国高等医药教材建设研究会组织编写的研究生规划教材系列之一。适用于全国高等医药院校及研究机构的硕士研究生。本教材在医学院校生物化学与分子生物学教学内容的基础上,更为深入和系统地介绍了分子生物学的基本理论和最新进展,并特别注重了与基础医学和临床医学的结合,以期为进一步学习其他研究生专业课程和开展医学科研工作奠定医学分子生物学基础。全书内容分为四篇:即基因、蛋白质、细胞信号转导和细胞增殖、分化与细胞凋亡。第一篇基因由8章组成,在介绍基因、基因组的概念、结构与功能基础上,着重阐述人类基因组计划的新成就、功能基因组、基因表达及其调控、与疾病发生发展和诊断治疗密切相关的分子机制、常用的基因操作原理等。第二篇蛋白质由5章组成,力求从动态角度出发,审视蛋白质结构与功能;介绍蛋白质“生老病死”的分子过程和酶学的新进展;强调时间、空间、微环境等因素对蛋白质正常和异常结构与功能的影响;同时,从科研实际出发,叙述研究蛋白质结构与功能的思路和技术方法,并呈现给读者若干悬而未决的蛋白质研究难题,留给读者更多的思考空间。第三篇细胞信号转导由5章组成,从分子水平介绍参与细胞信号转导的各种信号分子、受体的结构和功能,以及信号转导的原理及其规律;信号转导的重要通路及其生理作用;以及与疾病相关的信号转导异常;强调机体的各种生命活动都受到严密的调控,其中细胞信号转导系统起着不可替代的介导作用;同时,讨论了信号转导研究的发展趋势等。鉴于细胞信号转导研究在最近10年中的飞速发展及其在医学发展中的重要作用,这一部分的内容较以往各种教材更为详细。第四篇细胞增殖、分化与细胞凋亡由4章组成,主要介绍了近年来颇受重视的细胞周期、细胞分化、胚胎干细胞发育全能性、细胞凋亡调控的分子机制等,这些前沿内容与疾病发生发展和诊断治疗紧密相连,也是研究生开展基础医学和临床医学科学研究的必备知识。从培养研究生科学思维能力和科研工作能力的目标出发,本教材在编写方式和风格方面中力求强调科学史的沿革、经典实验结果、完整的理论知识和不同的学术观点的阐述,给读者一个充分的自学余地和想象空间。本书的编写人员由8所高校的12位教授组成。他们大部分来自医学院校,也有的来自综合性大学的生命科学学院。这种医学领域与非医学领域编写者的组合是医学院校教材编写的一种新的尝试,希望对于拓展医学院校研究生的知识面和科研思路有所裨益。各位编者在所撰写的章节中尽可能融会了个人的科研成果和教学经验,以使读者对相关理论有更为深刻的理解。在编写过程中,我们首先召开了编者会议集体讨论和议定了编写大纲和各章的知识点,分头执笔完成初稿以后,进行了通讯互审,最后又利用定稿会对全书进行了再次的审定和修改,以尽量提高编写质量。但是由于编写时间仓促、编者学识水平有限,加之分子生物学发展异常迅速,本书难免存在遗漏、错讹和缺憾之处,谨请使用本书的广大师生和科技工作者批评指正。本书每章末列出了以原始论文为主的若干参考文献,以供读者进一步学习参考。本书在正文中出现的专业名词后列出了英文原名及缩写,书末列有英汉、汉英词汇表和专业名词索引,便于读者查阅。需要指出的是,由于分子生物学专业新词汇层出不穷,其中有些词汇各家译法不一,尚无公认的译名,只能以英文原名列出,或使用暂译名。在本书的整个编写过程中,始终得到主审刘德培院士的指导和关心。刘院士对本书的编写大纲、初稿都进行了认真地审阅,并提出了宝贵的修改意见;中国协和医科大学杨克恭教授对本教材初稿的审阅付出了大量的精力;还有一批为本教材编写工作和编写会议作贡献的人士;在此一并表示衷心的感谢。查锡良药立波2002年6月

基因第一章 基因的结构与功能第一节遗传的基本单位-基因一、基因一词的由来及其含义的演变二、DNA的结构特点及其性质基因的结构特点与分类一、染色体DNA二、线粒体DNA第三节 基因(符号)的命名法一、基因命名的基本原则二、人类基因的命名法三、其他生物基因的命名法第二章基因组

第—节

基因组及基因作图

一、基因组与基因组学二、基因组存储了生物体整套的遗传信息

三、基因作图的概念四、人类基因定位的基本方法第二节

人类基因组计划

一、人类基因组计划的诞生及意义

二、人类基因组计划的4张图谱

三、人类基因组计划下一步的方向第三节

生物信息学及其在基因组研究中的应用

第四节

单核苷酸多态性及意义

一、DNA分子标记的发展

二、单核苷酸多态性的概念及其分析方法

三、单核苷酸多态性(SNPs)与疾病第五节

基因多态性与疾病相关性研究

一、基因多态性及其分析方法

二、基因多态性与疾病相关性的研究第六节药物基因组学

一、药物基因组学的概念

二、药物基因组学的诞生三、药物基因组学与基因多态性四、药物基因组学的应用DNA的生物合成与重组第一节复制DNA复制的基本特点原核生物染色体DNA的复制真核生物染色体DNA的复制DNA复制的方式逆转录第二节DNA损伤、突变和修复DNA损伤、突变的意义和类型DNA损伤、突变的引发因素DNA损伤、突变的修复DNA损伤、修复与人类疾病基因重组一、同源重组二、位点特异重组三、转座因子四、免疫球蛋白基因重排第四章原核生物基因的表达和调控第一节原核生物基因的表达一、转录起始二、RNA延伸三、转录终止四、转录后加工五、翻译的起始六、肽链的延伸七、翻译的终止八、原核生物基因转录和翻译的特点第二节原核基因表达的调控原核生物的顺式作用元件和转录调控蛋白转录起始调控的主要模式翻译的可调控性及调控方式第五章真核生物基因的表达和调控第一节真核生物基因的表达一、转录起始二、RNA延伸三、转录终止四、转录产物的加工五、RNA跨核膜运输六、翻译七、翻译后加工八、真核生物基因转录和翻译的特点第二节真核生物基因表达调控的分子机制真核生物的顺式作用元件真核生物的反式作用因子蛋白质与DNA的相互作用其他调控基因表达的因素第三节真核基因表达的调控DNA和染色质结构对转录的调控转录起始的调控转录后的调控翻译的可调控性及调控方式翻译后加工的调控意义第四节基因表达研究在医学研究中的意义对已知的单个或数个基因的表达研究基因表达谱的研究对大量基因的表达变化研究寻找在特定组织或细胞中表达的新基因基因表达调控研究在医学研究中的意义阐明生理或病理过程的分子机制基因治疗的基础研究第六章基因与疾病第一节基因变异与疾病基因结构变异与疾病基因表达异常与疾病原癌基因、抑癌基因与肿瘤外源基因的入侵与疾病线粒体DNA突变与疾病的关系动态突变相关的疾病第二节基因突变导致的常见疾病遗传性疾病肿瘤心血管疾病神经系统疾病病原微生物感染导致的疾病第七章基因操作第一节基因工程基本技术一、基因工程技术的产生及其科学意义二、基因工程技术的基本原理和步骤三、基因工程用载体四、基因工程常用工具酶五、目的基因的获得和重组载体的构建六、重组载体的导入、鉴定和表达第二节聚合酶链反应一、PCR技术的产生二、PCR技术的基本原理三、PCR技术的主要用途及其衍生技术第三节DNA序列分析第四节分子杂交和印迹技术一、印迹技术二、探针的种类和制备三、印迹技术的种类和用途第五节基因组文库和cDNA文库一、基因组文库和cDNA文库技术的产生二、基因组文库的建立、筛选和用途三、cDNA文库的建立、筛选和用途第六节基因重组动物模型一、转基因动物模型二、核转移技术三、基因剔除技术四、基因转移和基因剔除在医学发展中的应用第七节基因操作在医学发展中的意义一、疾病相关基因分析二、制造生物活性蛋白第八章基因诊断与基因治疗第一节基因诊断一、基因诊断的概念与特点二、基因诊断的主要技术和方法三、常见的基因异常及其检测四、疾病的基因诊断基因诊断在法医学上的应用第二节基因治疗基因治疗的概念基因治疗的基本程序基因治疗的主要策略和技术方法遗传病的基因治疗肿瘤的基因治疗感染性疾病的基因治疗基因治疗临床试验的现状分析基因治疗存在的问题与展望第二篇蛋白质第九章蛋白分子的折叠、组装、细胞内定位及降解第一节新生肽链需要折叠形成特定的天然构象 一、蛋白质折叠问题二、从热力学角度研究蛋白质折叠三、从动力学角度研究蛋白质折叠四、生物体内的蛋白质折叠问题五、蛋白质折叠的质量控制系统六、不同蛋白折叠过程的共性和个性七、膜蛋白的折叠问题八、蛋白质折叠的研究方法第二节寡聚蛋白的亚基需要经过一个组装过程蛋白质绝大多数都以寡聚或多聚体形式存在二、寡聚体的组装过程是一个分子特异识别的过程三、存在于细胞膜上的蛋白复合体的组装问题第三节蛋白分子在细胞内的定位决定于其自身的结构一、定位于细胞不同部位的蛋白分子携带有不同的结构信号二、真核细胞中的蛋白定位研究进展三、已知因蛋白定位出错而引起的疾病第四节蛋白分子在细胞内的降解一、N-末端规则二、使蛋白短命的内部序列三、细胞内蛋白降解的途径第十章蛋白质的结构与功能第一节蛋白质结构据结构进行的蛋白质归类二、蛋白质的结构特征三、从结构信息分析蛋白的功能第二节、蛋白质分子功能的实现过程一、蛋白质通过非共价相互作用完成生物功能二、非共价相互作用的物理本质三、蛋白通过与其他分子(配体)的特异相互作用而完成生物学功能四、蛋白质分子与配体结合的亲和力五、蛋白质与配体亲和力的解释和预测问题六、蛋白质与配体结合的可逆性七、蛋白质构象的动态性八、蛋白质分子的翻译后化学修饰第十一章蛋白质研究第一节蛋白质研究的历史回顾第二节蛋白质对象的选择和样品的获取一、研究对象的选择二、细胞的破碎三、去污剂处理溶解膜蛋白四、从细胞中释放的蛋白分子的稳定五、细胞碎片的去除六、目标蛋白质的纯化第三节蛋白质的检测和鉴定一、光谱学特性二、电泳检测三、测定纯化蛋白的分子大小四、测定蛋白质的氨基酸序列五、利用抗体探测特异蛋白质分子第四节蛋白质的结构分析一、氨基酸序列测定二、蛋白质空间结构的测定三、蛋白质结构变化检测四、蛋白分子的生物功能研究第五节蛋白质研究的发展趋势一、从单个蛋白到所有蛋白二、蛋白质组学三、蛋白质芯片技术第十二章蛋白质与医学第一节血红蛋白结构与功能一、血红蛋白基因二、结构与功能三、2,3-二磷酸甘油酸四、血红蛋白的新功能五、异常血红蛋白六、血红蛋白变构调节的作用机制第二节重要细胞外基质蛋白一、胶原二、纤连蛋白第三节细胞粘附分子一、整合蛋白二、钙粘蛋白三、免疫球蛋白超家族四、CD44五、粘附分子与肿瘤转移第四节朊病毒蛋白一、蛋白质错折叠疾病概况二、朊病毒蛋白第十三章酶学第一节酶的催化机制一、多元催化二、表面效应三、临近效应与定向排列四、诱导契合五、综合效应第二节

金属酶一、金属酶和金属激活酶二、金属在金属酶中的作用三、金属酶结构与功能的关系第三节

别构酶一、别构效应与别构酶二、别构酶的特征三、别构酶活性调节的机制四、别构酶对代谢的调节作用第四节

具有“酶”催化活性的生物分子一、核酶二、抗体酶三、其它生物催化剂第五节

同工酶一、同工酶的概念二、同工酶的分类三、同工酶的生物学意义第三篇细胞信号转导第十四章细胞通讯和信号分子第一节细胞通讯方式一、细胞直接联系的细胞通讯二、细胞间接联系的细胞通讯第二节细胞内重要信号分子一、蛋白激酶二、蛋白磷酸酶三、GTP结合蛋白四、第二信使合成及降解相关的酶五、信号蛋白衔接的分子基础第十五章细胞受体第一节受体研究的历史第二节膜受体的种类及其作用方式一、配体依赖性离子通道受体二、G蛋白偶联受体三、单个跨膜α螺旋受体第三节胞内受体一、胞内受体的基本结构二、蛋白质-DNA相互作用的结构基础第四节受体作用的特点一、高度专一性二、高亲和力三、可饱和性四、可逆性五、引起特定的生理效应第五节受体活性的调节一、磷酸化和去磷酸化二﹑配体-受体复合物的内化和降解三﹑膜磷脂的含量、成分和代谢第十六章细胞内信号转导通路第一节cAMP-蛋白激酶A通路一、G蛋白在cAMP-蛋白激酶A通路中的作用二、cAMP的合成与分解三、cAMP的作用机理四、PKA的作用第二节磷脂与Ca2+-蛋白激酶通路一、Ca2+-磷脂依赖性蛋白激酶途径二、Ca2+/钙调蛋白依赖性蛋白激酶第三节cGMP-蛋白激酶系统一、cGMP的合成二、cGMP的功能三、依赖cGMP的蛋白激酶第四节Ras-Raf-MAPK通路一﹑Ras-Raf-MAPK通路二﹑Ras-Raf-MAPK通路的调节第五节JAKs-STAT途径一、JAK二、细胞内信息分子——STAT三、JAK-STAT信息转导第六节TPK→PI-3激酶→Akt/PKB途径一、PI-3激酶家族二、D3-PPI的靶位点三、D3-PPIs调节的蛋白激酶四、Akt/PKB的下游信息流和生物学功能第七节核因子κB系统第八节TGF-β通路一、TGF-β通路的胞内底物二、TGFβ的信息转导第九节胞内受体介导的信息传递第十七章细胞信号转导异常与疾病第一节细胞信号转导异常的主要类型第二节G-蛋白耦联受体异常与疾病一、G-蛋白耦联受体与心血管疾病的关系二、G-蛋白耦联受体与肿瘤的关系三、G-蛋白耦联受体与遗传性疾病四、G-蛋白耦联受体与感染性疾病五、G-蛋白耦联受体与药物成隐性疾病第三节单次跨膜受体异常与疾病一、单次跨膜受体介导信号通路异常相关遗传病二、单次跨膜受体与炎症和应激反应第四节NO相关疾病一、NO与心血管疾病二、NO与肺部疾患三、NO与神经损伤四、NO与胃肠道疾病的关系五、NO与炎症第十八章细胞信号转导研究展望第一节细胞信号转导的规律和特点一、胞信号转导过程中信号的发生和终止二、细胞信号转导过程中的级联放大效应三、信号转导系统的通用性四、胞信号转导系统的复杂性第二节细胞信号转导研究的主要趋势一、单一分子、单一通路研究向多通路、规模化研究发展二、从定性研究向定量研究发展三、单纯生物学实验研究向计算机模拟研究的发展四、从体外研究向体内研究的发展五、从基础研究向应用研究的发展第四篇细胞增殖、分化与细胞凋亡的分子机制第十九章真核细胞细胞周期的调控第一节细胞周期及调控的概述细胞周期细胞周期调控的主要分子机制研究细胞周期调控的实验体系第二节对卵母细胞、卵及早期胚胎的研究细胞浆转移实验与成熟促进因子细胞周期蛋白泛素与APC四、细胞生长抑制因子第三节G1到S期转折和DNA复制的调节一、G1细胞周期蛋白和CDKs二、Rb蛋白和E2F转录因子三、DNA复制第四节G2/M转折和有丝分裂的调控一、有丝分裂开始的调控二、有丝分裂结束的调节第五节细胞周期蛋白激酶的抑制因子一、INK4家族的CKI二、CIP/KIP家族的CKIs三、新的CKI:14-3-3第六节细胞周期调节的关卡一、G1和G2期停滞二、S期关卡三、有丝分裂纺锤体组装不完全导致细胞分裂后期停滞第七节细胞周期与癌症一、G1/S转折关卡和癌症二、pRB与E2f三、p53和14-3-3四、CDK和p27第二十章哺乳类细胞分化的分子调控机制第一节概述一、谱系特化和决定二、核的全能性和卵母细胞胞质的作用第二节骨骼肌的分化调节一、MyoD家族生肌调节因子二、肌肉增强子结合因子和生肌调节因子共同实现成肌特异性三、肌肉增强子结合因子和生肌调节因子在成肌不同阶段的作用四、成肌细胞的最后分化五、成肌程序的维持六、成体肌肉中卫星细胞和多能干细胞第三节神经发生的调控机制一、神经发生需要与bHLH成肌蛋白相似的调节蛋白二、神经发育潜能的进行性限制需要抑制性HLH蛋白和局部细胞之间相互作用三、bHLH调节系统可能在其它类型细胞特化中起作用第四节胚胎干细胞保持发育多能性的分子机制一、保持胚胎干细胞自我更新的外部信号二、不依赖于LIF的信号三、多能性的内部决定因子第五节转分化和组织分化一、胰腺细胞向肝细胞的转分化二、成肌细胞向脂肪细胞的组织转化三、骨髓干细胞向肝细胞组织转化四、细胞融合产生的疑问第二十一章细胞凋亡及其调控第一节细胞凋亡的特征及生物学意义胞凋亡的基本特征二、细胞凋亡的生物学意义细胞凋亡的发生机理一、细胞凋亡的酶学基础二、细胞凋亡的诱导发生细胞凋亡的调控胞自身蛋白的调控作用二、病毒蛋白的调控作用三、细胞周期与细胞凋亡调控检测细胞凋亡的常用技术和方法一、细胞形态学的评价二、质膜完整性的评价三、DNA断裂的检测方法细胞凋亡与疾病一、细胞凋亡异常与疾病发生二、细胞凋亡的调节与疾病治疗第二十二章癌基因和抑癌基因第一节癌基因一、病毒癌基因二、细胞癌基因第二节抑癌基因一、抑癌基因的发现二、抑癌基因定义及举例三、DNA修复基因第三节癌基因、抑癌基因与细胞周期及细胞凋亡癌基因、抑癌基因与细胞周期癌基因、抑癌基因与细胞凋亡三、癌基因、抑癌基因在肿瘤发生中的协同作用第一篇基因从简单的病毒到复杂的高等动植物细胞,RNA和蛋白质的结构信息都是以基因的形式贮存在DNA(部分病毒是RNA)中的。从分子生物学意义上说,基因(gene)是核酸分子中贮存遗传信息的遗传单位,是指贮存RNA序列信息及表达这些信息所必需的全部核苷酸序列。其中贮存RNA序列信息的DNA区段称为结构基因,结构基因上游和下游控制转录的序列即为基因的调控序列。RNA的碱基序列信息直接来源于结构基因,其中大部分RNA(信使RNA)的序列中又贮存有蛋白质多肽链的氨基酸序列信息。分子生物学的核心内容是从分子水平研究基因和基因的活动,这些活动主要是通过核酸和蛋白质这两类生物大分子的活动来实现的。因此,有关核酸和蛋白质结构与功能的研究是对基因进行研究的基础。从分子水平研究基因和基因的活动,涉及到核酸和蛋白质的结构与功能、基因组的结构与功能、基因的复制与表达、基因表达的调控及其生物学效应,涉及到生物大分子之间的相互作用以及这些相互作用所形成的细胞间通讯和细胞内信号转导,涉及到基因的结构、功能、表达调控的分析和基因的制备、改造、调控、应用所需的各种技术体系。本篇介绍的内容包括基因的结构与功能,基因组(包括基因组及基因作图,基因组计划,基因组分析,基因多态性与疾病,单核苷酸多态性等),DNA复制、损伤、突变和修复、基因重组,基因表达以及基因表达的调控等,在“基因操作”一章中将对与基因研究有关的技术体系作简要介绍。医学分子生物学是分子生物学的一个重要分支,它主要研究人体生物大分子和大分子体系的结构、功能、相互作用及其与疾病发生、发展的关系。人体的生长、发育、衰老、死亡等生命现象,人体各种疾病的发生,都是与一种或多种基因有关,也常常涉及到细胞内信号转导。因此,医学分子生物学主要研究人体发育、分化和衰老的分子生物学基础、细胞增殖调控的分子基础,人体三大功能调控系统(神经、内分泌和免疫)的分子生物学基础,基因的结构异常或调控异常与疾病发生、发展之间的关系;同时,应用分子生物学理论和技术体系开展疾病的基因诊断和基因治疗、生物制药以及卫生防疫。本篇“基因与疾病”和“基因诊断与基因治疗”两章中将介绍基因结构异常、基因表达异常与疾病的关系,以及基因诊断和基因治疗的基本理论知识和相关研究进展。这些内容都是分子生物学基础理论和技术在医学研究中的重要应用,可以预料,基因工程、基因诊断和基因治疗等将在21世纪的医学中带来革命性变化。第一章 基因的结构与功能基因这一概念最初是在19世纪由遗传学家提出来的,而对其化学本质及功能的真正了解却是在20世纪40年代以后。如今生物学领域的许多新发现、新技术,包括基因治疗、基因诊断、基因工程、基因组计划以及克隆植物和动物等都与基因有关。基因作为分子生物学研究领域的主要内容之一,将生物化学、遗传学、细胞生物学等多种学科融合到一起,成为人们揭示生命奥秘的重要环节。第一节 遗传的基本单位—基因分子生物学实际上是在遗传学和生物化学发展到一定阶段相互渗透、相互融合形成的一门学科。对于基因的研究也是遗传学家们最早提出并且付诸于实践的。一、基因一词的由来及其含义的演变(一)从遗传因子到基因1866年,现代遗传学的奠基人Mendel提出了遗传因子学说,并对遗传因子(基因)的基本性质做了最早的论述。他通过豌豆杂交试验,发现黄豌豆植株与绿豌豆植株杂交,子代都是黄豌豆,黄色对绿色来说是显性。当子代自花授粉时,子代豌豆有黄有绿。Mendel根据实验结果认为,遗传性状是由成对的遗传因子决定的。在生殖细胞形成时,成对的遗传因子分开,分别进入两个生殖细胞中去。这被后人称为Mendel的第一定律或分离律(lawofsegregation)。Mendel还认为,在生殖细胞形成时,不同对的遗传因子可以自由组合,即Mendel第二定律或自由组合律(lawofassortment)。这两个定律是Mendel遗传因子学说的中心内容。但是Mendel的工作在当时并没有引起任何人的注意。直到1900年,他的发现才被Vries,Tschermak和Correns重新证实。1903年Sutton和Boveri分别注意到Mendel的遗传因子行为与生殖细胞形成和受精过程中染色体的行为完全平行,于是两人分别提出遗传因子就在染色体上。1909年Johannsen将遗传因子改称为基因(gene),并提出基因型(genotype)和表现型(phenotype)的概念。基因型是指逐代传递下去的成对因子的集合,因子中一个来源于父本,另一个来源于母本;表现型则是指一些容易区分的个体特征的总和。1910年,美国生物学家Morgan以果蝇(Drosophila)作为研究材料,发现有些基因的传代在不同性别的果蝇中有着不同的方式,表现为与“性染色体”的传递方式一致。同时,他还发现基因的连锁、交换和不分离现象,进一步创立了基因学说。Morgan的观察即证实了性染色体在性别决定中的作用,同时也证实了Sutton和Boveri关于基因是由染色体携带的假说。然而,在当时人们对基因的化学本质并不清楚。在20世纪30年代,通过对染色体的化学分析表明染色体是由核酸和蛋白质组成的,但是这两种成分并没有被看成是同等重要的。人们普遍认为基因是由蛋白质组成的,而核酸仅仅起着支撑性或储存能量的作用。直到1944年,Avery通过实验证实基因是由DNA组成的,才正式确定了基因的化学性质(详见本节“DNA的结构特点及其性质”)。(二)基因含义的演变早在人们对基因的化学本质有所了解之前,就有许多研究结果表明基因和有机体内发生的化学反应有关。1941年Beadle和Tatum在PNAS上发表了题为“链孢霉中生化反应的遗传控制”的研究报告,提出“一个基因一种酶”的假说(PNASUSA,1941,27:499-506)。他们以链孢霉(Neurospora)为实验材料,用X光照射霉菌,获得了大量的失去合成某种有机物能力的突变菌。由于链孢霉是单倍体,其中的每一个基因都只有一个拷贝。因此,对于基因的任何修饰都会引起相应的表现。他们将所获得的突变孢子或者加入到正常培养基中、或者加入到添加了维生素B1和维生素B6的培养基中,因而分离到了几十个需要某种维生素才能存活的突变菌株。通过将这些突变菌杂交发现,是某些基因突变引起了某些酶的改变,因而产生了不同的突变菌。而且一个基因控制着某一种特定的酶的合成。接着他们又发现了一种不能合成色氨酸的突变菌,并鉴定了一些能够使他们准确描述色氨酸合成途径的变异菌株和基因,发现该代谢途径的每一步都是由一个不同的基因控制的。为此他们提出“一个基因一种酶”的假说,并因此获得了1958年诺贝尔生理学和医学奖。毫无疑问,Beadle和Tatum建立的研究方法是研究代谢途径极为有效的工具。但是,对于具有多个亚单位的蛋白质来说,“一个基因一种酶”的假说却不够完善。进一步研究证实,如果一种蛋白质的几个亚单位相同,这种蛋白质称为同源多聚体(homomultimer),是由一个单基因编码的;如果一种蛋白质的几个亚单位不同,称为异源多聚体(heteromultimer),分别由不同的基因编码。因此,人们对“一个基因一种酶”的假说进行了修正,提出“一个基因一条多肽链”的概念。随着分子生物学的发展,尤其是人类基因组草图的顺利完成,人们对基因的定义又进行了进一步的探讨。2000年,美国科学家Bacon就基因的概念问题提出疑问。在他写给Morris和Wu的信中,他指出:就Johannsen在1909年对基因的定义而言,他并没有用基因这一概念来特指某种化学物质,而是针对其所具有的遗传特性的这种性质。因此,他怀疑将基因定义为DNA,是否完整而且令人满意(Isittruethatthegenecanbecompletelyandsatisfactorilydefinedbyasinglechemical,thedeoxyribonucleicacid,orDNA?)。2001年8月,《科学》杂志刊登了Bacon与Morris和Wu在几个月之间的七封通信的摘要。毫无疑问,在某些特定的生物体内,RNA也可以作为遗传信息的携带者。但是,就基因的定义而言,目前人们普遍接受的是:基因是含有生物信息的DNA片段,根据这些生物信息可以编码具有生物功能的产物,包括RNA和多肽链(Gene:ADNAsegmentcontainingbiologicalinformationandhencecodingforanRNAand/orpolypeptidemolecule)。二、 DNA的结构特点及其性质1868年,瑞士外科医生Miescher首次从人的脓细胞核内分离得到一种酸性物质,命名为核酸。随后人们又相继从其他种属的细胞核内分离得到类似的物质,并且发现生物界的核酸有两大类,既脱氧核糖核酸(deoxyribonucleicacid,DNA)和核糖核酸(ribonucleicacid,RNA)。核酸的发现与Mendel遗传定律的提出基本上是同一时期的事件,然而两者之间的关系、更确切的讲是DNA与基因的关系直到1944年才由McCarty和Avery通过实验得到证实。如今,DNA作为遗传信息的携带者已经得到公认。进一步的研究证实,在某些病毒中,RNA也可以作为遗传信息的携带者。(一)遗传信息储存在DNA的一级结构中1、“转化”现象的发现 肺炎球菌在揭示DNA作为遗传信息携带者的研究中发挥了极为重要的作用。早在1928年,英国医生Griffith就发现非致病的R型肺炎球菌(R为英文Rough的缩写)可以转变为致病的S型肺炎球菌(S为英文Smooth的缩写)。他将活的R型肺炎球菌与经过热灭活的S型肺炎球菌共同注射到小鼠体内,引起小鼠发病;而将这两种细菌分别注射给小鼠则不会引起小鼠发病。同时他还从发病的小鼠血液内检测到活的S型肺炎球菌。因此他推测某种物质从灭活的S型肺炎球菌转移到了R型肺炎球菌,并将S型肺炎球菌的致病性带给了R型肺炎球菌。1931年,Dawson和Sia在体外重复了这个转化实验。同时,Alloway利用已经杀死的致病性S型肺炎球菌的提取液,将非致病的R型肺炎球菌在体外转化为致病的肺炎球菌。这一实验为后人进行的提取“转化因子”的工作奠定了基础。2、“转化因子”的化学本质 1944年,McCarty、MacLeod和Avery在《实验医学杂志》上发表了他们历经将尽10年的实验结果。他们利用灭活的S型肺炎球菌的无细胞提取液进行了一系列分析,证实了DNA就是将S型肺炎球菌的致病性转移给R型肺炎球菌的物质。这一结论主要基于以下发现:①化学分析的结果提示这种物质符合DNA的性质;②这种物质的光学、超速离心以及电泳特性均符合DNA的特征;③将蛋白质和磷脂从抽提液中去除并不影响转化作用;④用胰蛋白酶和糜蛋白酶处理抽提液不影响转化作用;⑤用RNA酶处理抽提液也不影响转化作用;⑥用未被加热的血清处理抽提液则使其丧失转化能力,而人们已知血清中含有一种能够降解DNA的酶。这一工作成为生物化学发展的重要事件。在此之前,人们普遍认为蛋白质是遗传物质的携带者,而DNA仅仅起了次要的作用。但由于人们当时对DNA的结构和性质缺乏了解,Avery以及他的同事们无法使人们确信基因是由DNA组成的。实际上,他们自己在文章中的结论也是十分谨慎的,仅仅是概述了一种可能的关系。但是不能否认,他们的工作为“基因是由DNA组成的”这一理论奠定了基础。八年后(1952年),Hershey和Chase利用噬菌体证实了DNA的遗传性质。噬菌体的化学组成十分简单,只包括DNA和蛋白质,在20世纪初已被广泛研究。Avery等人的实验结果促使Hershey和Chase把重点放到了噬菌体DNA的研究上。他们用硫(35S)标记噬菌体的蛋白质分子,用磷(32P)标记DNA分子。将这些用放射性同位素标记的噬菌体放到含有细菌的培养液中,再经过一系列的实验,或去除噬菌体蛋白质、或去除噬菌体DNA,最终证实噬菌体体内与复制有关的物质是DNA,包裹DNA的蛋白质外壳只起到保护DNA、并帮助DNA注入到细菌细胞内的作用。这些实验证实了Avery等人在8年前利用不同体系得出的结论:DNA是遗传信息的携带者。1953年,当Watson和Crick在冷泉港会议上公布他们的DNA双螺旋结构时,Hershey和Chase的结果再度以概要形式被宣读,作为DNA具有遗传功能的附加证据。Hershey并因此与另外两位从事噬菌体研究的创始人Delbrück和Luria一起获得了1969年的诺贝尔生理学和医学奖。3、遗传信息的储存及遗传密码的破译 通过对DNA结构的分析,我们知道DNA是由碱基、脱氧核糖和磷酸三种成分组成的大分子。组成DNA的碱基有腺嘌呤(Adenine,A)、鸟嘌呤(Guanine,G)、胞嘧啶(Cytosine,C)和胸腺嘧啶(Thymine,T)。在DNA分子的戊糖中,与第2位碳原子(C-2)相连的羟基上缺少一个氧原子,称为脱氧核糖(deoxyribose)。脱氧核糖与碱基在戊糖的第1位碳原子(C-1)和嘧啶的第1位氮原子(N-1)或嘌呤的第9位氮原子(N-9)以糖苷键相连构成脱氧核苷(deoxynucleoside)。磷酸与脱氧核苷中的戊糖在第5位碳原子(C-5)之间通过磷酯键相连,构成脱氧核糖核苷酸,后者靠3,5磷酸二酯键连接而形成一条多核苷酸链。这一连接方式决定了DNA的多核苷酸链具有特定的方向性,其5端为磷酸基、3端为羟基,以53或35来表示。在DNA的一级结构中,脱氧核糖和磷酸都是相同的,核苷酸的差异主要是碱基不同,四种不同碱基的顺序也就代表了核苷酸的顺序。因此,核苷酸序列又称为碱基序列。大多数生物(除RNA病毒以外)的遗传信息都是贮存在DNA分子中。这些信息以特定的核苷酸排列顺序贮存在DNA分子上,如果核苷酸排列顺序变化,它的生物学含义也就改变。Watson和Crick在提出DNA双螺旋结构模型后,曾经指出“碱基的精确顺序就是携带有遗传信息的密码”。然而对“信息”和“密码”内在联系的真正了解却经历了一段相当复杂的路程。“遗传密码”与DNA序列的对应关系最初是由俄国物理学家Gamow提出的。他认为DNA的双螺旋结构提供了20种空间作为容纳氨基酸的“容器”,这些空间的形状取决于周围核苷酸的本质,不同的空间吸引了不同的氨基酸,这些氨基酸靠共价键连接起来形成多肽链。尽管Gamow的这一假设是错误的,但是他的关于遗传密码的想法,即核苷酸与氨基酸之间的对应关系还是被人们接受了。随着人们对tRNA的发现、对ATP在蛋白质合成过程中的作用的认识,以及放射性同位素标记氨基酸技术的应用,Matthaei与Nirenberg于1961年成功的利用多聚尿嘧啶合成了苯丙氨酸肽链第一个遗传密码,到1966年所有的密码子全部被鉴定清楚。我们现在已经知道DNA分子主要携带两类遗传信息。一类是有功能活性的DNA序列携带的信息,这些信息能够通过转录过程而转变成RNA(如mRNA,tRNA,rRNA)的序列,其中mRNA的序列中又含有蛋白质多肽链的氨基酸序列信息。另一类信息为调控信息,这是一些特定的DNA区段,能够被各种蛋白质分子特异性识别和结合。这些特定的DNA区段在以后的章节中将会介绍,如各种作用元件等。(二)DNA的双螺旋结构及其意义Watson和Crick于20世纪50年代否定了DNA的单螺旋结构和三螺旋结构,提出DNA是由两条多核苷酸单链结合形成的双螺旋(doublehelix)结构,并对这一结构进行了详细地描述。同时,他们还提出了DNA复制的假说。他们的发现是对人类遗传学的重大贡献,并因此于1962年与Wilkins一起获得了诺贝尔生理学和医学奖。Watson和Crick的DNA双螺旋结构模型的建立是20世纪生物学最重要的发现。近年的研究证实双链DNA在生物体内可以形成各种不同的构型。1、双螺旋结构的发现及特点 人们对DNA生物学性质的认识远远早于对其结构的了解。如前所述,早在40年代科学家们就已经发现DNA在不同菌种之间的转移可以将遗传信息从一个菌种转移到另一个菌种。许多证据表明DNA分子一定是由两条或更多条多核苷酸单链以某种方式组成。20世纪50年代初期,Wilkins和Franklin等人对DNA的X射线衍射照片进行了分析,推测出与Watson和Crick提出的模型相一致的DNA结构,为DNA双螺旋结构模型的建立提供了宝贵的数据资料。正是由于这些线索,为Watson和Crick的DNA双螺旋模型提供了重要的根据。Watson和Crick的DNA双螺旋结构的特点主要包括以下几点:①两条多核苷酸单链以相反的方向互相缠绕形成右手螺旋结构;②在这条双螺旋DNA链中,脱氧核糖与磷酸是亲水的,位于螺旋的外侧,而碱基是疏水的,处于螺旋内部;③螺旋链的直径为2.37nm,每个螺旋含10个碱基对(basepair,bp),其高度约为3.4nm;④由疏水作用造成的碱基堆积力(basetacking)和两条链间由于碱基配对形成的氢键是保持螺旋结构稳定性的主要作用力,A与T配对形成2个氢键,G与C配对形成3个氢键,配对的碱基在同一平面上,与螺旋轴相垂直;⑤碱基可以在多核苷酸链中以任何排列顺序存在。两条多核苷酸单链通过碱基配对(basepairing)形成氢键不仅是保持双螺旋结构稳定的主要作用力,更重要的是碱基配对的生物学含义。由于几何形状等原因,A只能与T配对,G只能与C配对,这种配对原则称为碱基互补配对。Chargaff的研究结果也完全支持这一结论,既A与T、G与C的比值在不同生物中几乎都是1。这就意味着在DNA复制过程中,以预先存在的DNA链作为模板就可以得到一条与其完全互补的子链,由此可以保证遗传信息的准确传递。Watson和Crick的DNA双螺旋结构称为B型结构,是细胞内DNA存在的主要形式。当测定条件改变,尤其是湿度改变时,B型DNA双螺旋结构会发生一些变化。例如,A型DNA双螺旋结构直径为2.55nm,每个螺旋含11个碱基对,其高度约为3.3nm。B型DNA双螺旋结构的其他构型变化还包括C,D和T型等(表1-1)。表1-1DNA双螺旋的主要参数类型每个螺旋碱基数碱基高度直径戊糖构象A110.26nm23ÅC3内型B100.34nm20ÅC2内型*C9.330.33nm19ÅC3外型D8.50.30nmZ120.37nm18Å外型***构象可变。**与嘧啶相连为C2内型构象,与嘌呤相连为C3外型构象。在自然界原核生物和真核生物基因组中还发现左手双螺旋DNA,其分子螺旋的方向与右手双螺旋DNA的方向相反,称为Z型螺旋。左手双螺旋DNA可能参与基因表达的调控,但其确切的生物学功能尚待研究。DNA双螺旋结构不同构型的意义并不在于其螺旋直径及其高度的变化,关键是由于这些变化而引起的表面结构的改变(见图1-1),进而影响其生物学功能。B型DNA双螺旋的表面并不是完全平滑的,而是沿其长轴有两个不同大小的沟。其中一个相对较深、较宽,称为大沟;另外一个相对较浅,较窄,称为小沟。A型螺旋也有两个沟,其中大沟更深,小沟更浅但较宽;Z型螺旋则仅呈现一个很窄很深的沟。DNA双螺旋的这种表面结构有助于DNA结合蛋白识别并结合特定的DNA序列。而这种表面构型的变化对于基因组DNA与其DNA结合蛋白的特异性相互作用具有重要的意义。(图1-1)2、其他类型的DNA结构 虽然双螺旋结构是DNA最常见的二级结构形式,DNA也可以形成不同于双螺旋的其它结构。(1)三股螺旋DNA 三股螺旋DNA(triplex)也称为三链DNA(triplestrandDNA,tsDNA),其结构是在DNA双螺旋结构的基础上形成的。双螺旋通过Watson-Crick氢键稳定,而三股螺旋尚需通过Hoogsteen氢键稳定(见图1-2)。三条链均为同型嘌呤(homopurine,Hpu)或同型嘧啶(homopyrimidine,Hpy),既整段的碱基均为嘌呤或嘧啶。根据三链的组成和相对位置分为两种基本类型:①嘌呤-嘌呤-嘧啶型(Pu-Pu-Py型,Pu代表嘌呤,Py代表嘧啶),在碱性介质中稳定;②嘧啶-嘌呤-嘧啶型(Py-Pu-Py型)在偏酸性pH中稳定。其中两条链为正常双螺旋,第三条嘧啶链位于双螺旋的大沟中,它与Pu链的方向一致,并随双螺旋结构一起旋转。三链DNA的两种类型有4种同分异构体。三链中碱基配对符合Hoogsteen模型,第三碱基在Py-Pu-Py型中为T=A=T、C+≡G≡C(与鸟嘌呤形成Hoogsteen键的“C”必须质子化)配对;在Pu-Pu-Py型中存在G≡G≡C、A=A=T配对。当DNA双链中含有H-回文序列(H-palindrone)时,既某区段DNA两条链分别为Hpu和Hpy,并且各自为回文结构时,任一条回文结构的5和3部分都可以形成分子内三股螺旋结构及剩余的半条回文结构游离单链。在一定条件下,含H-回文序列DNA还可形成小瘤DNA(noduleDNA),它在中性溶液中稳定。(图1-2)真核生物基因组中存在大量可形成三链DNA的多聚嘌呤核苷酸和多聚嘧啶核苷酸序列。这些序列有的存在于调控区,有的位于DNA复制的起点或终点,有的则位于染色体重组位点,提示它们可能与基因的表达调控、DNA的复制及染色体的重组有关。(2)十字型结构 十字型结构的分子基础是DNA分子中存在翻转重复序列。此时,不仅两条链互补,单链中的翻转重复区也可以互相配对形成双链分子。DNA变性后或因其他原因引起DNA分子两条链分开,再复性时翻转重复区的DNA可以自我配对,形成突出于双链之外的发卡结构(hairpinstructure),两个并列的发卡形成十字结构。与DNA双螺旋结构相比,十字形结构中氢键形成减少,而且失去了双螺旋DNA碱基堆积力的相互作用,因而稳定性不如双螺旋DNA。十字形结构可能在基因表达调控中有作用,但其确切的生物学功能有待研究。(图1-3)(3)DNA的超螺旋结构 DNA双螺旋进一步盘曲形成更加复杂的结构称为DNA的三级结构,即超螺旋结构(supercoil)。超螺旋的形成如果是由双螺旋绕数减少所引起的就称为负超螺旋,反之称为正超螺旋。生物体的闭环DNA都以超螺旋形式存在,如细菌质粒、一些病毒、线粒体的DNA等。线性DNA分子或环状DNA分子中有一条链有缺口时均不能形成超螺旋结构。真核生物染色体(chromosome)DNA成线性,其三级结构是DNA双链进一步盘绕在以组蛋白(H2A,H2B,H3,H4分子)为核心的结构表面,构成核小体(nucleosome)。许多核小体连接成串珠状,再经过反复盘旋折叠最后形成染色单体(chromatid)。染色质纤维经过几次卷曲折叠后,DNA形成复杂的多层次超螺旋结构,其长度大大压缩。超螺旋可能有两方面的生物学意义:①超螺旋DNA比松弛型DNA更紧密,使DNA分子体积变得更小,对其在细胞的包装过程更为有利;②超螺旋能影响双螺旋的解链程序,因而影响DNA分子与其它分子(如酶、蛋白质)之间的相互作用。(三)DNA的理化性质及应用DNA作为生物大分子具有一些特殊的理化性质。了解这些理化性质对于我们自如的掌握和应用DNA有极大的帮助,进而使我们更好的揭示生命的奥秘。1、一般理化性质 核酸为多元酸,具有较强的酸性,在酸性条件下比较稳定,而在碱性条件下容易降解。核酸属于大分子,已知最小的核酸分子如tRNA,其分子量也在20000以上。线形高分子DNA的粘度极大,在机械力的作用下容易发生断裂。因此在提取完整的基因组DNA时,具有一定的难度,一是提取的DNA不容易完全溶解,二是DNA容易发生断裂。而RNA分子远小于DNA,粘度也比较小。但由于RNA酶的广泛存在,在提取RNA时极易发生降解。2、紫外吸收 核酸所含的嘌呤和嘧啶分子中都有共轭双键,使核酸分子在250-280nm波长处有光吸收,其最大吸收峰在260nm处。这个性质可用于核酸的定量测定。核酸在260nm的光吸收值又称为OD260值。一个OD260值所含的核酸量对单链DNA、双链DNA、寡核苷酸以及RNA均有所不同。例如,一个OD260值包含50μg双链DNA,40μgRNA,33μg单链DNA。3、变性、复性与杂交 DNA双链以碱基之间形成氢键,相互配对而连接在一起。氢键是一种次级键,能量较低,容易受到破坏而使DNA双链分开。氢键的形成是一个自由能降低的过程,可以自发生成。局部分开的碱基对又可以重新形成氢键,使其恢复双螺旋结构。这使得DNA在生理条件下能够迅速分开和再形成,从而保证DNA生物学功能的行使。(1)变性 双螺旋的稳定靠碱基堆积力和氢键的相互作用来共同维持。如果因为某种因素破坏了这两种非共价键力,导致DNA两条链完全解离,就称为变性(denaturation)。导致变性的因素可以有温度过高、盐浓度过低及酸碱过强等。DNA变性是二级结构的破坏,双螺旋解体的过程,碱基对氢键断开,碱基堆积力遭到破坏,但不伴随共价键的断裂,这有别于DNA一级结构破坏引起的DNA降解过程。DNA变性常伴随一些物理性质的改变,如粘度降低,浮力密度增加,尤其重要的是光密度的改变。如前所述,核酸分子中碱基杂环的共轭双键,使核酸在260nm波长处有特征性光吸收。在双螺旋结构中,平行碱基堆积时,相邻碱基之间的相互作用会导致双螺旋DNA在波长260nm的光吸收比相同组成的游离核苷酸混合物的光吸收值低40%,这种现象称为减色(hypochromic)效应。DNA变性后立即引起这一效应的降低,与未发生变性的相同浓度DNA溶液相比,变性DNA在波长260nm的光吸收增强,这一现象称为增色(hyperchromic)效应。利用增色效应可以在波长260nm处监测温度变化引起的DNA变性过程。DNA的变性发生在一定的温度范围内,这个温度范围的中点称为融解温度(meltingtemperature),用Tm表示,即:使DNA分子内50%的双螺旋结构被解开的温度。Tm值与DNA的碱基组成和变性条件有关。DNA分子的GC含量越高,Tm值也越大,每增加1%(G+C),Tm增加0.4℃。Tm值还与DNA分子的长度有关,DNA分子越长,Tm值越大。此外,溶液离子浓度增高也可以使Tm值增大。(2)复性 DNA的变性是一个可逆过程,在适宜条件下,如温度或pH值逐渐恢复到生理范围,分离的DNA双链可以自动退火(annealing),再次互补结合形成双螺旋,这个过程称为复性(renaturation)。复性过程的发生主要与温度、盐浓度以及两条链之间碱基互补的程度有关。复性时互补链之间的碱基互相配对,这个过程可以分为两个阶段。首先,溶液中的单链DNA随即碰撞,如果它们之间的序列有互补关系,两条链经GC,AT配对,产生短的双螺旋区;然后碱基配对区沿着DNA分子延伸形成双链DNA分子。DNA复性后,由变性引起的性质改变也得以恢复。DNA复性的速度可以用下列公式来表示:Co•t1/2=1/kC代表在t时间单链DNA的浓度,K代表复性速度常数(单位是浓度-1•时间-1)。控制复性反应的参数是DNA浓度(Co)和保温时间(t)的乘积。达到半复性时的Co•t称为Co•t1/2,Co•t1/2越大,反应就越慢。复性的分子基础是碱基配对。不同来源的核酸变性后,混合在一起,只要这些核酸分子中含有可以形成碱基互补配对的序列,复性就可以发生。复性可以发生在碱基完全互补配对的序列之间,也可以在一定条件下发生在具有一定相似性(similarity)或同源性(homology)的碱基序列之间。DNA变性和复性的这种性质是核酸分子杂交的基础。(3)分子杂交 复性发生在不同来源的核酸链之间,形成杂化双链(heteroduplex)的过程称为杂交(hybridization)。不同来源的DNA可以杂交,DNA与RNA以及RNA之间也可以杂交。杂交的一方是待测的DNA或RNA,另一方是用于检测用的已知序列的核酸片断,称为探针。探针通常用同位素或非核素标记物进行标记,然后通过杂交反应就可以确定待测核酸是否含有与之相同的序列(有关探针的选择与标记的内容详见第七章)。杂交反应可以在液相中进行,即待测样品和探针都在溶液中(称为液相杂交);也可以是一方固定于固相支持物上,另一方在溶液中(称为固相杂交)。①RNA酶保护分析(RibonucleaseProtectionAssay,RPA):RPA是一液相杂交为基础发展起来的,可用于基因和mRNA的结构分析以及mRNA的定量研究。其原理是在体外经转录合成一个带有标记的单链RNA探针,此探针与待测RNA在序列上互补,二者杂交后,用RNA酶处理,未形成双链的RNA单链被水解成单核苷酸,杂交形成的双链RNA受到保护,不被降解,然后通过电泳进行RNA-RNA杂交体的检测(见图1-4)。RPA的检测方法十分灵敏,结果可靠,是分析mRNA定量、mRNA末端定位以及确定内含子位置的常用方法。(图1-4)②滤膜杂交:滤膜杂交是固相杂交的一种,是将待测核酸分子结合到不同的滤膜上,然后同存在于液相中的标记探针进行杂交。待测核酸样品可以直接点在滤膜上(称为斑点杂交);也可以先将核酸样品经琼脂糖凝胶电泳分离,再通过印迹技术(详见第七章)将核酸从凝胶中按原来的位置和顺序转移到滤膜上。这样可以比较准确地保持待测核酸片断在电泳图谱中的位置,同时又可以进行分子量测定。这一技术通常用于DNA的限制性内切酶图谱分析、判断DNA的限制性内切酶片断长度多态性以及RNA的定性、定量等研究。③原位杂交(insituhybridization):原位杂交是用标记探针与细胞或组织切片中的核酸进行杂交。这一方法可以保持组织或细胞的完整结构,因此可以精确的进行DNA或RNA在组织或细胞内的定位。此外,结合共聚焦显微镜的应用,这一方法还可以将特异的基因或DNA片段经荧光标记后在染色体上进行定位(fluorescenceinsituhybridization,FISH)。(图1-5)④DNA芯片(DNAchips):DNA芯片技术是近年发展起来的一项融合分子生物学与微电子学等多学科的高新技术。其基本原理类似于原位杂交。首先在特定的固相支持物表面(常用计算机硅芯片)原位合成寡核苷酸,或者将预先制备的DNA片段以显微打印的方式有顺序的固化于支持物表面,然后与经荧光、生物素或放射性核素标记的核酸样品杂交。具有与芯片上DNA序列互补的核酸样品既可以与芯片上的探针结合。通过对杂交信号的检测分析,便可以得到样品的遗传信息(基因序列、基因表达等)。固定于芯片的探针除了可以用合成的寡核苷酸或克隆的DNA片段、PCR产物以外,也可以用单链的DNA或RNA片段。待测的样品可以是DNA,也可以是mRNA。由于DNA芯片可以容纳大量的探针,可以对样品进行平行、快速、高效、敏感的检测,因此成为分子生物学研究的重要技术手段。同时,在临床医学以及药物研究与开发方面得到了广泛的应用。基因的结构特点与分类如前所述,就大多数生物而言,基因是遗传的基本单位,由DNA组成。在这些生物体内所有的基因以及重复序列DNA构成基因组(genome)。某些病毒的基因组则是由RNA组成的,这部分内容不在这里进行讨论。根据DNA在细胞中所处的位置,可以分为染色体DNA(又称核基因)和线粒体DNA。人的基因结构与原核生物以及其它低等真核生物的基因结构相比更为复杂,在这一节中将主要介绍人的基因结构。一、染色体DNA人类基因组包含3x109个碱基对,约有3万到3.5万个编码特异蛋白的基因,分布在23对染色体上。其中一号染色体上的基因数目最多,为4635个;Y染色体上的基因数目最少,为330个(截止到2002年4月)。不同生物的基因组大小差异很大。大肠杆菌的基因组含有4.2x106个碱基对;酵母的基因组含有1.3x107个碱基对;而某些哺乳动物的基因组含有的碱基对高达109以上。但是基因组的大小与基因的数目并没有直接的线性关系。酵母的第三号染色体含有5万个碱基对,携带有28个基因;而在玉米的基因组中,根据已知的部分序列的分析,其中一段DNA的5万个碱基对中,只有两个基因,其中一个基因的功能还是未知的。这种差异固然是长期进化的结果。我们今天所看到的这种进化结果就是不同生物的基因结构形成了各自的特点。表1-2、几种不同生物的基因组大小种属基因组(bp)病毒SV405.1x103λ噬菌体(λphage)4.9x104支原体(mycoplasma)3.0x105大肠杆菌(E.coli)4.2x106酵母(S.cerevisiae)1.3x107线虫(C.elegans)8.0X107果蝇(fruitfly)1.85x108小鼠(mouse)3.0x109人(H.sapiens)3.3x109小麦(wheat)1.7x1010(一)单拷贝基因与多基因家族最初,人们推测人类基因组含有8万到15万个基因。随着人类基因组计划的完成,通过对所获得基因组序列的分析,认为人类基因组含有3万到3.5万个编码特异蛋白的基因。而最新资料表明人类基因可能在5万个左右。这些基因,小的只有几百个碱基对,而大的可以多达200多万个碱基对,平均为3万个碱基对。许多基因是单拷贝基因,编码的蛋白质维系着细胞的功能,如酶、激素、受体、结构蛋白和调节蛋白等。这些单拷贝基因或低重复序列基因约占全基因组序列的75%。它们具有人类基因的共同结构特点。1、人类基因的结构特点 人类基因的显著特征是含有非编码的插入序列,称为内含子(intron)。内含子能够转录成mRNA前体(precursor),但是在mRNA前体的转录后加工过程中被剪切掉,因此不包括在成熟的mRNA序列中。(图1-6)被内含子分隔开的编码序列称为外显子(exon),剪接后连在一起形成成熟的mRNA,参与指导蛋白质合成。不同基因的内含子和外显子的数目及大小各不相同,人的胰岛素启动子因子1(insulinpromoterfactor1,IPF1)基因全长为5千个碱基对,含有2个外显子(852个碱基的mRNA)、1个内含子;而人的膜辅因子蛋白(membranecofactorprotein,MCP)基因全长超过8万个碱基对,含有14个外显子(1125个碱基的mRNA)、13个内含子。由此可见,内含子的序列远远大于编码序列(codingregion)。根据人类基因组草图的分析推测,基因的编码序列仅占全基因组序列的3%。内含子的生物学功能还不是非常清楚,有研究表明在某些基因中内含子的存在可以保证或增强基因的稳定表达。还有些基因的内含子中包含其他基因的编码序列,即基因内基因。例如,在人的神经纤维瘤病I型基因(neurofibromatosistype1,NF1)的第27内含子序列中,含有3个小基因:少突神经胶质细胞髓磷脂糖蛋白(oligodendrocytemyelinglycoprotein,OMG),嗜同病毒整合位点2A和2B(ecotropicvirusintegrationsite2A/2B,EVI2B,EVI2A),在这三个基因内也还都含有外显子和内含子。(图1-7)真核生物基因的两侧各有一段不被转录的序列,对基因表达、调控具有重要作用。在这些序列中主要有启动子、增强子和终止子等。(1)启动子(promoter) 一般位于基因转录起始点上游-100–-200碱基对范围,是能够与RNA聚合酶结合并起始转录的核苷酸序列,包括一组转录调控序列:①TATA盒(TATAbox):人类许多基因的转录起始点上游-25到-30碱基对的位置有一段高度保守的序列,即TATA盒。它由7个碱基组成,即TATAAAA或TATATAT。TATA盒是转录因子TFIID的结合位点,TFIID再与RNA聚合酶II形成复合物,启动基因转录(详见第四章:基因表达)。②CAAT盒(CAATBox):是位于转录起始点上游-70到-80个碱基对位置的一段保守序列,由9个碱基组成,即GGNCAATCT,其中N=C或T。CAAT盒与转录因子CTF结合,决定启动子转录的效率。③GC盒(GCBox):有一些基因没有TATA盒与CAAT盒,但在转录起始点上游-35碱基对的位置发现富含GC的核苷酸序列(GGGCGG),称为GC盒。GC盒能与转录因子Sp1结合,促进转录的过程。(图1-8)典型的启动子通常含有TATA盒以及上游的CAAT盒及GC盒。这类启动子一般具有一个转录起始点及较高的转录活性。仅有TATA盒和转录因子也可以构成最简单的启动子。然而,还有许多启动子不含TATA盒。这类启动子分为两类:一类是富含GC的启动子,最初发现于一些管家基因(housekeepinggenes),这类启动子一般含有数个分离的转录起始点;另一类启动子即不含TATA盒,也没有GC富含区,这类启动子可有一个或数个转录起始点,大多数转录活性很低或根本就没有转录活性,而只是在胚胎发育、组织分化和再生过程中受到调解。(2)增强子 增强子(enhancer)是一段短的DNA序列,其中含有多个作用元件,可以特异性的与转录因子结合,增强基因的转录活性。与启动子不同,增强子可以位于基因的任何位置。尽管通常处于转录起始点上游-100到-300个碱基对处,但在内含子中也发现有增强子的存在。增强子的功能于其位置和方向无关,可以是5→3方向,也可以是3→5方向。1986年Maniatis等研究干扰素-β(IFN-β)基因转录时发现其增强子内含有负调控序列,称为负增强子,又称为沉默子(silencer)。由于负增强子的发现,有人建议用调变子(modulator)取代增强子的概念。(3)终止子 终止子(terminator)是在结构基因中的最后一个外显子中的一段保守的AATAAA序列。在此位点的下游有一段GT或T丰富区,与AATAAA序列共同构成poly(A)的加尾信号。mRNA转录到此部位后,产生AAUAAA和随后的富含GU或U的序列,被结合在RNA聚合酶上的延长因子识别并与其结合,然后在AAUAAA下游10-30个碱基的部位切断RNA,并加上poly(A)尾。

2、多基因家族 多基因家族(multigenefamily)就其本意来讲是指核苷酸序列或编码产物的结构具有一定程度同源性的基因,其编码产物常常具有相似的功能。另外还有一种基因家族,是由多基因家族及单基因组成的更大的基因家族,它们的结构有程度不等的同源性,但是它们的功能不一定相同,称为基因超家族(genesuperfamily)。根据基因家族内成员同源性的程度,以下分别进行介绍。(1)核酸序列相同 这种家族实际上是一个基因的多次拷贝,成簇地排列在同一条染色体上,形成一个基因簇。包括rRNA基因家族、tRNA基因家族和组蛋白基因家族等。有些家族的基因在染色体上是串联排列的,如5SrRNA基因借间隙区串联成簇,其中每一个5SrRNA都被间隔序列分开,间隔序列的大小比5SrRNA的基因长度大2-6倍,而且还含有中度重复序列。每一个5SrRNA基因都被单独转录,产生出一个独立的RNA分子。真核细胞一般都有几百到一千多个tRNA基因,每种tRNA含有10个到几百个基因拷贝。同种tRNA往往串联在一起形成基因簇,但在基因间有非转录区分隔,可以比结构基因长将近10倍。组蛋白基因家族在染色体上的排列是另外一种形式,5种组蛋白基因串联成一个单元,许多单元再串联成一个大簇。这种重复成串的排列与DNA复制时需要大量的组蛋白有关。(2)核酸序列高度同源 在这种基因家族中,多数成员的同源性非常高。如人的生长激素基因家族,包括3种激素的基因:生长激素(growthhormone,GH)、胎盘促乳素(chorionicsamatomammotropin,CS)和催乳素(prolactin,PRL)。它们之间的同源性非常高,尤其是GH和CS之间,氨基酸序列有85%的同源性、mRNA序列有92%的同源性,说明它们来自于一个共同祖先基因。但是,PRL与GH和CS之间仅在氨基酸序列上有50%的同源,mRNA水平上的同源性非常低。这3种基因在不同的染色体上,GH和CS基因位于第17号染色体长臂,而PRL基因位于第6号染色体。α珠蛋白基因家族则是由高度同源的几个基因成簇的排列在同一条染色体上。有些基因可能同时发挥作用,也有些基因在不同发育阶段进行表达。(3)编码产物的功能或功能区同源 在某些基因家族成员之间,基因全长序列的相似性可能较低,但其编码产物却具有高度保守的功能区。如src癌基因家族,各成员基因结构并无明显的同源性,但每个基因产物都含有250个氨基酸顺序的同源蛋白激酶结构域。一些结构类似、功能相关的受体也是这样被划分成一个个家族的。还有些基因家族成员的DNA序列并不明显相关,但所编码的产物却具有共同的功能特征,如DEAD盒基因家族含有几个不同的基因,它们的产物都具有解旋酶的功能,其结构特征是8个氨基酸的保守序列,内含DEAD盒序列:Asp-Glu-Ala-Asp。(4)基因超家族 基因超家族的组成更为复杂,其成员虽然在结构上有一定的相似性,但是功能不一定相同。这些基因在进化上亲缘较远,最经典的是免疫球蛋白基因超家族。开始,这一家族只包括α2微球蛋白、MHCI类抗原的α链、II类抗原的α链和β链、Thy1、CD4、CD8等免疫相关分子的基因,以后又发现了许多免疫系统内以及与免疫无关的家族成员。通过应用计算机分析基因结构序列,可以使越来越多的基因归为一类,从而使原来的多基因家族成为基因超家族。例如丝氨酸蛋白酶(serineproteases)基因家族,原来是多基因家族。它们的基因产物都有一个特殊的功能区,具有酶的功能。丝氨酸是活性中心的关键氨基酸残基,因此称为丝氨酸蛋白酶家族。现在已有很多新成员加入进去,特别是载脂蛋白(apolipoprotein),只是转移胆固醇蛋白颗粒中的成分,而不具有水解蛋白质的酶功能。因此成为基因超家族。(二)假基因假基因(pseudogene,ψ)是指与某些有功能的基因结构相似,但不能表达基因产物的基因。这些基因起初可能是有功能的,在基因复制时编码序列或调控元件发生突变,或是插入了mRNA逆转录的cDNA,缺少基因表达所需要的启动子序列,变成了无功能的基因。由突变而引起的功能缺失通常是在编码区引入了终止子,这种假基因称为传统假基因(conventionalpseudogene)。例如,存在于α珠蛋白基因簇中的假基因(ψβ)就是由于在β基因编码序列的第20位碱基的丢失而引起移码突变所造成的。由插入了mRNA逆转录生成的cDNA而造成的假基因称为加工的假基因(processedpseudogene)。这种假基因实际上是一个功能基因的mRNA被逆转录成为cDNA,然后cDNA又被插入到基因组中。它们不含有内含子,大多数也没有基因表达所需要的调控区,因此不能被表达。(图1-9)假基因在高等哺乳动物基因组中是一种普遍的现象,许多多基因家族中的部分成员为假基因。通常,假基因仅占总基因数目当中极少的一部分。小鼠核糖体蛋白的编码基因是个例外。在这个基因家族中,只有一个是有功能的编码基因,而有15个假基因。在这种情况下,根据分子杂交结果进行基因数目分析时就要考虑到真正有功能的基因数目要远远低于杂交结果所预示的数目。假基因的存在可能是在长期进化过程中所形成的。但是作为一种没有生物学功能的基因,为什么能够一直保存下来,难道它们真的没有任何功能、还是我们所看到的假基因没有来得及被丢失?许多问题有待于解答。(三)重复序列DNA

在人类基因组中,编码序列只占基因组总DNA量的3%左右,非编码序列占95%以上。其中一部分是基因的内含子、调控序列等,另一部分便是重复序列(repeatsequences)。真核基因组的重复序列可以高达总DNA量的50%。重复序列中,除了编码rRNA、tRNA、组蛋白以及免疫球蛋白的结构基因外,大部分是非编码序列。其功能主要与基因组的稳定性、组织形式以及基因的表达调控有关。除单拷贝或低重复序列DNA外,根据重复序列出现的频率不同,可以将DNA序列分为高度重复序列DNA和中度重复序列DNA。1、高度重复序列DNA DNA序列在基因组中的重复次数可高达数百万次(>105),这种序列可以集中在某一区域串联排列。典型的高重复序列DNA有卫星DNA(satelliteDNA)和反向重复序列(invertedrepeats)。

(1)卫星DNA 卫星DNA实际上是出现在非编码区的串联重复序列。其特点是具有固定的重复单位,该重复单位首尾相连形成重复序列片段,通常存在于间隔DNA和内含子中。串联重复单位可以从2个碱基起,长短不等;重复次数可以从几次到数百次、甚至几十万次。串联重复序列是形成卫星DNA的基础。卫星DNA可以分为三类:①大卫星DNA(macro-satellite)也称经典卫星DNA,是在CsCl密度梯度离心时发现的。将基因组DNA打断成为约104碱基对大小的片段,加入到CsCl溶液进行超速离心形成密度梯度,原核生物DNA可显示一条宽带,而真核生物DNA除形成同样的主要宽带外,还出现其他条带,这些条带中的DNA称为卫星DNA。这是由于某段DNA分子中存在大量重复序列,DNA的(G+C)/(A+T)的比值不同于主带DNA的比值,因而密度也不同于主带DNA。大卫星DNA可以根据密度不同分为几种不同类型,同一类型不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论