人类基因的课件资料_第1页
人类基因的课件资料_第2页
人类基因的课件资料_第3页
人类基因的课件资料_第4页
人类基因的课件资料_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人类基因的课件资料第1页/共75页第二章人类基因基因的概念基因的化学本质人类基因和基因组的结构特点基因的生物学特性人类基因组计划第2页/共75页基因的概念1865年基因是一些特殊因子1871年发现核酸1903年染色体是遗传单位1910年基因位于染色体上1913年染色体包含线性排列的基因1927年突变是基因内的物理变化1931年交换引起重组1944年DNA是遗传物质1945年基因编码蛋白质1951年首次蛋白质测序1953年DNA双螺旋结构1958年DNA半保留复制1961年三联体密码发现1977年真核基因不连续性1977年DNA可以测序1995年首次基因组测序第3页/共75页基因的概念基因(gene)是决定一定功能产物的DNA序列。这种功能产物主要是蛋白质和RNA。一个基因的结构除了编码特定功能产物的DNA序列外,还包括对这个特定产物表达所需的邻接DNA序列。

第4页/共75页基因的化学本质

在整个生物界中,绝大部分生物(包括人类)基因的化学本质是DNA;在某些仅含有RNA和蛋白质的病毒中,基因的化学本质是RNA。

第5页/共75页一、DNA分子组成DNA分子的基本单位是脱氧核苷酸,依各自所携碱基的不同,可以分成A、G、C、T4种。将它们按一定顺序排列连接后即构成DNA单链。它们的排列顺序是DNA遗传的核心。二、DNA分子结构双螺旋结构模型基因的化学本质第6页/共75页第7页/共75页第8页/共75页第9页/共75页第10页/共75页第11页/共75页第12页/共75页第13页/共75页第14页/共75页人类基因组人类基因组(genome)是人的所有遗传信息的总和。它包括两个相对独立而相互关联的基因组:核基因组与线粒体基因组。通常人类基因组指的是核基因组。第15页/共75页人类基因组的组织结构

第16页/共75页第17页/共75页人类的基因或人类基因组中的功能序列可分为4大类,即单一基因、基因家族、拟基因和串联重复基因。基因家族—指由一个祖先基因经过重复和变异所形成的一组基因。有两类:(1)一个基因簇:由一个基因产生多次拷贝(几乎相同序列),成簇排列于同一染色体上。(2)多基因簇(图3-5):成簇地分布于几条不同的染色体上。如编码珠蛋白的基因:5个相关基因排列于16p染色体上。拟基因或假基因—指在多基因家族中某些成员不产生有功能的基因产物。基因的分类第18页/共75页第19页/共75页第20页/共75页第21页/共75页基因的结构真核生物基因的编码序列往往被非编码序列所分割,呈现断裂状的结构,故而也称断裂基因(splitgene)。一、外显子和内含子外显子(exon):编码序列内含子(intron):非编码序列第22页/共75页外显子-内含子的接头区是一高度保守的一致顺序,称为外显子-内含子接头。每一个内含子的5′端起始的两个碱基是GT,3′端最后的两个碱基是AG,通常把这种接头形式叫做GT-AG法则(GT-AGrule)。这两个序列是高度保守的,在各种真核基因的内含子中均相同。每个断裂基因中第一个外显子的上游和最末一个外显子的下游,都有一段不被转录的非编码区,称为侧翼顺序。基因的结构第23页/共75页第二节遗传的分子基础二、真核基因的分子结构特征第24页/共75页基因组的组成人类基因组按DNA序列分类既有单拷贝序列,也有重复频率不等的多拷贝序列。单拷贝序列:在基因组中仅有单一拷贝或少数几个拷贝,长度在800~1000bp之间,其中有些是编码细胞中各种蛋白质和酶的结构基因,占到人类基因组的大多数。重复多拷贝序列:分散地穿插于整个基因组中,根据复性的速度不同,又可分为简单序列DNA和中度重复DNA。第25页/共75页简单序列DNA(simple-sequenceDNA)或卫星DNA:以小于200bp的小片段为单位串联重复很多次,约占整个基因组的10%~15%,大多数长度可达105bp,多位于染色体的异染色质区。在蔗糖或氯化铯密度梯度超速离心图谱上观察到的位于染色体DNA主带旁边的小带DNA重复多拷贝序列第26页/共75页第27页/共75页重复多拷贝序列小卫星DNA(minisatelliteDNA):有15-100bp组成的重复单位,重复20-50次形成的1-5kb的短DNA微卫星DNA(microsatelliteDNA):某些存在于基因组的间隔序列和内含子等非编码区内的简单序列DNA,重复序列为1-6bp,被称为~。第28页/共75页中度重复DNA(intermediaterepeatDNA):约占整个基因组的25%~40%,以不同的量分布于整个基因组的不同部位。短分散元件(shortinterspersedelement):DNA的长度可短至100bp~500bp,拷贝数105以上。如Alu家族长分散元件(longinterspersedelement):可长达6000bp~7000bp,拷贝数为102~104

。如KpnI家族重复多拷贝序列第29页/共75页第30页/共75页

基因的生物学特性

DNA分子中碱基对的排列顺序蕴藏着遗传信息,决定了基因的基本功能和特性。基因复制与表达构成了基因的主要功能。

第31页/共75页遗传密码:在DNA的脱氧核苷酸长链上,每三个相邻的碱基序列构成一个三联体,每个三联体密码能编码某种氨基酸,所以三联体(triplet)是遗传信息的具体表现形式。因而三联体又称三联体密码(tripletcode)、遗传密码(geneticcode)或密码子(codon)。遗传信息的储存单位第32页/共75页编码链:5'-ATGAAACGAGTCTTATGA-3'反编码链:mRNA:3'-TACTTTGCTCAGAATACT-5'5'-AUGAAACGAGUCUUAUGA

-3'第33页/共75页遗传密码的特性通用性在绝大多数情况下,遗传密码在整个生物界中都是通用的。但也有一些例外存在,如线粒体DNA中有3个遗传密码与通用密码不同。简并性除少数氨基酸仅有一种密码子外,其余氨基酸都各被2~6个密码子编码,这种现象称为遗传密码的简并性(degeneracy)。起始密码和终止密码密码子AUG若位于mRNA的5′端起始处,则是蛋白质合成的起始信号,叫起始密码子(initiationcodon),同时编码甲酰甲硫氨酸和甲硫氨酸;若不是位于mRNA的起始端,则只具有编码甲硫氨酸的作用。密码子UAA、UAG和UGA不编码任何氨基酸,而是作为肽链合成的终止信号,称为终止密码子。第34页/共75页基因通过自我复制保持遗传的连续性基因具有自我复制(self-replication)的重要特性。复制发生在细胞分裂周期的S期,DNA双螺旋结构解旋为两条单股的多核苷酸链,以DNA分子自身的每一股单链为模板进行自我复制合成新的DNA分子。复制的起点由特定的碱基序列组成。真核生物的复制从多个位点同时开始进行。

第35页/共75页新链的复制过程具有一定的特点互补性:半保留性:反向平行性:不对称性:不连续性:基因通过自我复制保持遗传的连续性第36页/共75页第37页/共75页第38页/共75页第39页/共75页基因表达(geneexpression):是把基因所储存的遗传信息转变为由特定的氨基酸种类和序列构成的多肽链,再由多肽链构成蛋白质或酶分子,从而决定生物各种性状(表型)的过程。基因表达包括两个步骤:①以DNA为模板转录合成mRNA;②将遗传信息翻译成多肽链中相应的氨基酸种类和序列基因表达第40页/共75页转录(transcription):是在RNA聚合酶的催化下,以DNA的3′→5′单链(反编码链)为模板,按照碱基互补配对原则(但RNA以U和DNA的A配对,其余配对形式与复制时一致),以三磷酸核苷酸(NTP)为原料合成RNA的过程。转录的最终产物是mRNA、tRNA和rRNA等。基因表达第41页/共75页转录过程:一般将mRNA的合成分为起始、延伸和终止3个连续的步骤。①在起始阶段,RNA聚合酶Ⅱ与启动子结合,即可启动RNA的转录合成。②延伸过程是RNA聚合酶Ⅱ由全酶构型变为主酶构型,并沿着模板链的3′→5′方向移动,并精确地按照碱基互补原则,以三磷酸核苷酸(UTP、CTP、GTP和ATP)为底物,在3′端逐个添加核苷酸,使mRNA不断延伸;③终止是RNA聚合酶Ⅱ在DNA模板上移动到达终止信号时,RNA合成的停止。

第42页/共75页第43页/共75页第44页/共75页已发现的一些启动子包括TATA框(TATAbox)、CAAT框(CAATbox)、GC框(GCbox)以及增强子(enhancer)等,它们构成了结构基因的侧翼序列(flankingsequence),是人类基因组的一些特殊序列,称为调控序列,对基因的有效表达是必不可缺少的。第45页/共75页转录产物的加工和修饰:由RNA聚合酶Ⅱ催化所形成的初始转录产物,仅仅是mRNA的前体,必须经过加工和修饰,才能形成有功能的mRNA。主要包括“加帽”(capping)--5′端加“7-甲基鸟嘌吟核苷酸”;

“加尾”(tailing)--3′端加“多聚腺苷酸”(polyA)和剪接--按GT-AG法则将内含子切除,再将外显子由连接酶逐段连接起来,形成成熟的mRNA分子。第46页/共75页第47页/共75页第48页/共75页翻译(translation):是以mRNA为模板指导蛋白质合成的过程。蛋白质合成是在细胞质内的核糖体上进行的。蛋白质翻译时mRNA携带遗传信息,作为合成蛋白质的模板;tRNA转运活化的氨基酸和识别mRNA分子上的遗传密码;核糖体是蛋白质合成的场所,把各种特定的氨基酸分子连接成多肽链。蛋白质分子最终的空间结构是由翻译后修饰所决定的。第49页/共75页第50页/共75页第51页/共75页第52页/共75页RNA编辑(RNAediting)是导致形成的mRNA分子在编码区的核苷酸序列不同于它的DNA模板相应序列的过程,属遗传信息加工。1.尿嘧啶核苷酸的加入或删除2.C→U、A→G或G→A的RNA碱基转换3.C→G、G→C或U→A的RNA碱基颠换生物学意义主要表现在:①通过编辑的mRNA具有翻译活性;②使该mRNA能被通读;③在一些转录物5′末端可创造生成起始密码子AUG,以调节翻译活性;④RNA编辑可能与生物进化有关;⑤RNA编辑不偏离中心法则,因为提供编辑的信息源仍然来源于DNA贮藏的遗传信息。

第53页/共75页基因表达的控制基因表达控制的特点是能在特定时间和特定细胞中激活特定的基因,从而实现“预订”的有序的分化发育过程。真核生物基因表达调控是通过多阶段水平实现的,即转录前、转录水平、转录后、翻译和翻译后等五个水平。第54页/共75页人类基因组(genome)通常是指核基因组,是人的所有遗传信息的总和。人类基因组第55页/共75页人类基因组计划“人类基因组计划(humangenomeproject,HGP)”是20世纪90年代初开始的全球范围的全面研究人类基因组的重大科学项目。HGP是美国科学家在1985年率先提出的,旨在阐明人类基因组DNA3.2×109核苷酸的序列,发现所有人类基因并阐明其在染色体上的位置,破译人类全部遗传信息,使得人类第一次在分子水平上全面地认识自我。第56页/共75页HGP的整体目标是阐明人类遗传信息的组成和表达,为人类遗传多样性的研究提供基本数据,揭示人类单基因异常和严重危害人类健康的多基因病的致病基因或者疾病易感基因,建立对各种基因病新的诊治方法,从而推动整个生命科学和医学领域发展。其基本任务是建立人类基因组的结构图谱,即遗传图、物理图、转录图与序列图,并在“制图-测序”的基础上鉴定人类的基因,绘出人类的基因图。第57页/共75页一、人类结构基因组学(humanstructuralgenomics)集中建立遗传图、物理图、转录图、序列图基因图(一)遗传图(geneticmap)—连锁图(linkagemap)——是以具有遗传多态性的遗传标记作为“位标”,以遗传学距离作为“图距”的基因组图。遗传多态性—指在一个遗传座位上具有一个以上的等位基因(群体频率>1%),该座位称为多态性座位,可作为遗传图的“位标”。遗传学距离是经典遗传学中特有的重要概念。第58页/共75页具有遗传多态性的标记是建立遗传图的要素:第一代DNA遗传标记—RFLPBotstein于1980年最早应用的标记;RFLP局限性:1、提供的“多态性”的信息有限;2、现有的限制酶不可能检出所有的核苷酸改变;3、需要用同位素标记与Southern杂交技术,不安全又不宜自动化。第二代DNA遗传标记—STR:1、小卫星DNA-重复单位6-12个bp的VNTR2、微卫星或短串联重复(STR)—重复单位2-6个bp的VNTR第59页/共75页STR有两个最突出优点:1、作为遗传标记的“多态性”与“高频率”。2、采用重复序列两侧的特异性单拷贝序列作为其在基因组中定“点”标记,以PCR技术操作,可以实现机器化、自动化、电脑化以至完全机器人化。已建立6000多个STR为主体的遗传标记组成的“连锁图”,平均分辨率已达0.7cM。第60页/共75页第三代DNA遗传标记—SNP:1996年美国MIT的Lander所提出。1、与RFLP和STR等主要不同:不再以“长度”的差异作为检测手段,而直接以序列的变异作为标记。2、SNP在核苷酸水平上把“序列图”、“物理图”和“遗传图”有机统一起来。3、可能摒弃遗传标记分析技术“瓶颈”—凝胶电泳,用DNA测序技术构建基因组图。第61页/共75页(二)物理图:第一技术重要内容:是以一段已知核苷酸序列的DNA片段—称为序列标记部位(STS)为“位标”,以Mb或kb作为图距的基因组图。STS的要求:1:在基因组中有明确的位置,位于重复序列两侧的单拷贝特异性序列,而忽略其重复序列。2、一段已知的序列。至1996年10月已建立22000个STS的物理图,X染色体物理图平均分辨率已达75kb。第62页/共75页第二重要内容:是建立以DNA克隆片段相互重叠的“邻接克隆群—conting”。“邻接克隆群”的实验标准:用PCR证明这些片段含有STS的序列—呈现阳性,并确定这些片段在基因组中的位置。借助于酵母人工YAC片段巨大(0.5~2Mb)的优点,构建总体覆盖率几乎100%的“YAC邻接克隆群”;细菌人工染色体(BAC)构建总体覆盖率为100%的、精度更高的“邻接克隆群”。第63页/共75页第64页/共75页“物理图”的建立应该归功于DNA克隆技术70年代重大突破—DNA克隆技术(遗传工程技术之一):1、质粒—装载能力,即插入片段<10kb2、噬菌体—装载能力达20kb。3、兼有病毒与质粒优点的粘粒—装载能力可达30~40kb。4、YAC—是人类认识真核生物染色体的重大飞跃。其独特优点是装载能力可达0.5~2Mb,是大片段DNA载体;其次其“人工染色体”性质具有准确复制并随着宿主细胞分裂而分离。第65页/共75页总结:1、以STS为位标的“序列标记”将遗传图、细胞遗传学图以及分子水平的物理图—序列图统一成整体的人类基因组图。2、真核生物的染色体是遗传物质最客观、最可靠、最方便的“物理标记”,细胞遗传图可以说是人类基因组的最基本层次的基因组图。3、人类拥有的完整的、多层次的、全方位的“基因组全图”包括细胞遗传学图—以区、带为标记或以人为的等分图即染色体长度的百分率为标记、大规模的限制图—以稀有酶切点为标记与精细限制图—以常规限制性内切酶的位点为标记、基因组特异序列—如CpG序列、Alu序列等图,DNA克隆图以及分子水平的核苷酸序列图,自发的染色体断裂点图与重组部位图。第66页/共75页(三)转录图:以“表达序列标记”(EST)绘制转录图(也称cDNA图或表达图——人类“基因图”的雏形。1990年提出“cDNA策略”,并作为“基因组全图策略的补充”。1996年,至少已来自300个组织的60多万个EST,总长度至少在200Mb以上。现已有53000个各不相同的转录本片段,可能代表30%~50%的基因的大部分信息。第67页/共75页转录图与EST的现实意义:1、为估计人类基因的数目提供较为可靠的依据。2、提供不同组织、不同发育阶段的基因表达的数目、种类及结构,特别是序列的信息。3、提供了鉴定基因的探针,以EST可从“全长cDNA文库”筛到全长cDNA。4、本身就有直接的经济价值。作为“基因组”的一种物理标记,EST尚缺少定位的信息。现在可用FISH及比较基因组杂交(CGH)来基因定位。第68页/共75页(四)序列图以DNA测序绘制序列图,是分子水平的最高层次的、最详尽的物理图。测序总长度约为1m,由30亿核苷酸组成的序列图是人类基因组计划中最为明确、最为艰巨的定量、定质、定时的任务。目前,测定技术的限制:由于一次测序反应尚不能超过1Kb,效率低而不被大规模采用。目前测序中心的主要策略:以大片段克隆建立插入片段约10Kb左右的质粒亚文库,再随机挑选质粒单克隆分别测序,再以电脑程序进行装配。第69页/共75页使用Sequation自动化测序仪:一天能进行2万个测序反应。技术核心主要为Sanger等“酶促末端终止法”+聚丙烯酰胺电泳+扫描隧道电镜。最有前途:DNA芯片(DNA距阵)——思路类似于“寡核苷酸反向杂交法”;目前在晶体上以“光刻法”直接合成高密度的可控制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论