基因结构和基因组_第1页
基因结构和基因组_第2页
基因结构和基因组_第3页
基因结构和基因组_第4页
基因结构和基因组_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1基因结构和基因组基因结构和基因组第1页/共93页2一、基因结构一、基因结构1. 基因概念:基因概念:基因是一段具有特定功能和结构的连基因是一段具有特定功能和结构的连续的续的DNA片断,是编码蛋白质或片断,是编码蛋白质或RNA分子遗传信息的基本遗传单位。分子遗传信息的基本遗传单位。 第1页/共93页第2页/共93页3第2页/共93页第3页/共93页4第3页/共93页第4页/共93页5第4页/共93页第5页/共93页6第5页/共93页第6页/共93页7第6页/共93页第7页/共93页8第7页/共93页第8页/共93页9第8页/共93页第9页/共93页10第9页/共93页第10页/共93页1

2、1第10页/共93页第11页/共93页12基因概念的更新和不断发展基因概念的更新和不断发展 重叠基因(重叠基因(overlapping gene): : 一个基因的核苷酸与另一个基因的核苷酸之间存一个基因的核苷酸与另一个基因的核苷酸之间存 在这一定的重叠现象。在这一定的重叠现象。 1977年,维纳(年,维纳(Weiner)在研究)在研究Q0病毒的基因结构时,首先发现了基因的重叠现病毒的基因结构时,首先发现了基因的重叠现象。象。1978年,费尔(年,费尔(Feir)和桑戈尔()和桑戈尔(Sangor)在研究分析)在研究分析X174噬菌体的核苷酸噬菌体的核苷酸序列时,也发现由序列时,也发现由537

3、5个核苷酸组成的单链个核苷酸组成的单链DNA所包含的所包含的10个基因中有几个基因具个基因中有几个基因具有不同程度的重叠,但是这些重叠的基因具有不同的读码框架。以后在噬菌体有不同程度的重叠,但是这些重叠的基因具有不同的读码框架。以后在噬菌体G4、MS2和和SV40中都发现了重叠基因。中都发现了重叠基因。基因的重叠性使有限的基因的重叠性使有限的DNA序列包含了更多的遗序列包含了更多的遗传信息,是生物对它的遗传物质经济而合理的利用,参与对基因的调控。传信息,是生物对它的遗传物质经济而合理的利用,参与对基因的调控。 第11页/共93页第12页/共93页13第12页/共93页第13页/共93页14第1

4、3页/共93页第14页/共93页15第14页/共93页第15页/共93页16第15页/共93页第16页/共93页17第16页/共93页第17页/共93页18非编码区非编码区非编码区非编码区编码区编码区上游编码区上游 编码区下游编码区下游 与与RNA聚酶聚酶结合位点结合位点RNA聚合酶能够识别调控序列中的结合位点,并与其结合。转录开始后,RNA聚合酶沿DNA分子移动,并与DNA分子的一条链为模板合成RNA。转录完毕后,RNA链释放出来,紧接着RNA聚合酶也从DNA模板链上脱落下来。第17页/共93页第18页/共93页19能够转录为相应的信使RNA,进而指导蛋白质的合成,也就是说能够编码蛋白质的区

5、域。 位于编码区上游和编码区下游的DNA序列,虽不能转录为信使RNA,不能编码蛋白质但有调控遗传信息表达的核苷酸序列,如启动子、终止子等。非编码区(调控序列)编码区(编码序列) 原核基因的结构原核基因的结构第18页/共93页第19页/共93页20是位于基因是位于基因5 末端上游外测的一段长度为末端上游外测的一段长度为20200bp的非编码的非编码核苷酸序列,其功能是与核苷酸序列,其功能是与RNA聚合酶结合形成转录起始复合物聚合酶结合形成转录起始复合物。 启动子(启动子(promoter)终止子(终止子(terminatorterminator) 是位于一个基因或者操纵子的末端,提供转录终止信号

6、的区段是位于一个基因或者操纵子的末端,提供转录终止信号的区段 是指由启动子、结构基因和终止子组成的一段是指由启动子、结构基因和终止子组成的一段DNA序列。序列。转录单元(转录单元(operonoperon)第19页/共93页第20页/共93页21在原核生物中只有一种在原核生物中只有一种RNARNA聚合酶聚合酶。所有的原核基因都是在同一种。所有的原核基因都是在同一种RNARNA聚合酶的作用下进行转录的。聚合酶的作用下进行转录的。 操纵子(操纵子(operator)功能上相关的几个结构基因前后相连,利用功能上相关的几个结构基因前后相连,利用一个共同的启动子和终止子,这种转录单元一个共同的启动子和终

7、止子,这种转录单元被称为操纵子。被称为操纵子。通常是先被转录成一条大的通常是先被转录成一条大的mRNAmRNA,再由同一,再由同一条条mRNAmRNA翻译出几个结构蛋白。翻译出几个结构蛋白。第20页/共93页第21页/共93页22第21页/共93页第22页/共93页235 3 -35TTGAC-10TATAAT结构基因结构基因2. 原核生物的基因结构原核生物的基因结构 Pribnow盒;细菌转录单位起点上游约10bp处的保守区域,它可 能参与结合RNA聚合酶;共有序列=TATAAT细菌转录单位起点上游约35bp处的保守六聚体;共有序列=TTGAC 或TGTTGACA ORF的识别是证明一个新的

8、DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。 第22页/共93页第23页/共93页24RNARNA转录起始转录起始-35-35区区-10-10区区TTGACATTGACATTAACTTTAACTTTTACATTTACATATGATTATGATTTTACATTTACATATGTTTATGTTTTGATATTGATATATAATTATAATCTGACGCTGACGTACTGTTACTGTN N1717N N1616N N1717N N1616N N1616N N7 7N N7 7N N6 6N N7 7N N6 6A AA AA AA AA Atrptrp tRNA tRNATyrTy

9、rlaclacrecrecA AAra Ara BADBAD TTGACA TTGACA TATAAT TATAAT共有序列共有序列第23页/共93页第24页/共93页25对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。例如,序列ATTCGATCGCAA这三种阅读顺序称为阅读框(reading frames)CAA A ATTCGATCGATTCGATCGCAAATTCGATCGCA(1)(3)(2)第24页/共93页第25页/共93页26一个开放阅读框(一个开放阅读框(ORF,open reading frame)是一个没有终止编码的密码子序)

10、是一个没有终止编码的密码子序列。列。原核基因识别任务的重点是识别开放阅读原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。框,或者说识别长的编码区域。第25页/共93页第26页/共93页273.真核生物的基因结构真核生物的基因结构Pol:转录:转录rRNArRNA(5S rRNA5S rRNA除外)除外)Pol:转录蛋白质编码基因:转录蛋白质编码基因Pol :转录编码众多小:转录编码众多小rRNArRNA(包括(包括tRNAtRNA和和 5S rRNA5S rRNA)的基因。)的基因。与原核生物基因的主要区别与原核生物基因的主要区别内含子(内含子(intron)(非编码序列)(非

11、编码序列)在基因表达过程中,内含子被从初级mRNA分子剪切掉,形成成熟的功能功能mRNA真核生物中有三种不同的真核生物中有三种不同的RNA聚合酶聚合酶第26页/共93页第27页/共93页28编码区非编码区非编码区非编码区非编码区与与RNA聚酶聚酶结合位点结合位点内含子内含子 外显子外显子 编码区上游编码区上游 编码区下游编码区下游 真核基因的结构真核基因的结构第27页/共93页第28页/共93页29第28页/共93页第29页/共93页30上游上游增强子增强子-80CAAT-35TATA下游下游增强子增强子外显子外显子内含子内含子5 3 真核生物的基因结构真核生物的基因结构第29页/共93页第3

12、0页/共93页31第30页/共93页第31页/共93页32第31页/共93页第32页/共93页33第32页/共93页第33页/共93页34第33页/共93页第34页/共93页35第34页/共93页第35页/共93页36第35页/共93页第36页/共93页37第36页/共93页第37页/共93页38增强子(增强子(enhancerenhancer) 能使和它连锁的基因转录频率明显增强的能使和它连锁的基因转录频率明显增强的DNADNA序列序列 增强效应十分明显。增强效应十分明显。增强效应与其位置无关,不论增强子以什么方增强效应与其位置无关,不论增强子以什么方 向排列(向排列(5 533或或3 35

13、5),还是在基因的上游),还是在基因的上游 或者下游,均表现出增强效应。或者下游,均表现出增强效应。增强子可远离转录起始点,通常在增强子可远离转录起始点,通常在1 14kb4kb起作用。起作用。增强子没有基因专一性,对同源或者异源基因都有效增强子没有基因专一性,对同源或者异源基因都有效许多增强子具有组织或者细胞特异性,说明只有许多增强子具有组织或者细胞特异性,说明只有 特定的蛋白质参与才能发挥作用。特定的蛋白质参与才能发挥作用。许多增强子还受到外部信号的调控。许多增强子还受到外部信号的调控。第37页/共93页第38页/共93页39沉默子(沉默子(silencersilencer) 在酵母交配型

14、座位中首次发现,动物、人中也发现。在酵母交配型座位中首次发现,动物、人中也发现。属于负调控元件,可不受距离和方向的限制。属于负调控元件,可不受距离和方向的限制。在真核生物细胞中对成簇基因的表达起重要作用。如在真核生物细胞中对成簇基因的表达起重要作用。如酵母菌酵母菌HMR的的E沉默子。沉默子。第38页/共93页第39页/共93页40第39页/共93页第40页/共93页41第40页/共93页第41页/共93页42第41页/共93页第42页/共93页43c cDNADNAa aDNADNA反式调节反式调节C C顺式调节顺式调节 mRNA mRNA C C蛋白质蛋白质C CB BA A mRNAmRN

15、A蛋白质蛋白质A AA A第42页/共93页第43页/共93页44原核细胞原核细胞 真核细胞真核细胞不同点不同点相同点相同点原核细胞原核细胞真核细胞真核细胞不同点不同点编码区是连续的编码区是连续的编码区是间隔的、编码区是间隔的、不连续的不连续的相同点相同点都由能够编码蛋白质的编码区和具都由能够编码蛋白质的编码区和具有调控作用的非编码区组成的有调控作用的非编码区组成的原核细胞与真核细胞的基因结构比较:第43页/共93页第44页/共93页45第44页/共93页第45页/共93页46启动子与起始密码有何不同启动子与起始密码有何不同启动子是基因结构中位于编码区上游的核苷酸序列,是RNA聚合酶结合位点,

16、能够准确地识别转录的起始点并开始转录,有调控遗传信息表达的作用。而起始密码则是mRNA上的三个相邻碱基(AUG,GUG)。启动子不止三个碱基。 第45页/共93页第46页/共93页47终止子和终止密码终止子和终止密码有何不同有何不同终止子是在非编码区内紧靠转录终点,调控遗传信息表达的DNA序列。它特殊的碱基排列顺序能够阻碍RNA聚合酶的移动,并使其从DNA模板链上脱离下来,从而使转录工作结束。终止密码位于mRNA上,共有三种:UAA、UAG、UGA。第46页/共93页第47页/共93页48二、基因组学二、基因组学 Genomics1.1.基因组(基因组(genomegenome) 是指单倍体细

17、胞中所含有的全套遗传物质是指单倍体细胞中所含有的全套遗传物质 病毒:病毒:103 bp 如如X174X174噬菌体是单链环状噬菌体是单链环状DNADNA,5 5 10 103 3 bpbp 细菌:细菌:106 bp 大肠杆菌染色体大肠杆菌染色体DNADNA,4.7 4.7 10 106 6 bpbp 真核生物真核生物:109 bp 人的染色体人的染色体DNADNA, 3.2 3.2 10 109 9 bpbp 第47页/共93页第48页/共93页49一)、基因组及表达的概念一)、基因组及表达的概念* * 基因组基因组(genome)(genome)一个细胞或病毒所携带的全部遗传信息或一个细胞或

18、病毒所携带的全部遗传信息或整套基因。整套基因。基因经过转录、翻译,产生具有特异生物学基因经过转录、翻译,产生具有特异生物学功能的蛋白质分子的过程。功能的蛋白质分子的过程。* * 基因表达基因表达(gene expression)(gene expression)基因表达是受调控的基因表达是受调控的第48页/共93页第49页/共93页50基因组学概念基因组学概念基因组学基因组学(genomics)(genomics)就是发展和应用就是发展和应用DNADNA制图、测序新技术以及计制图、测序新技术以及计算机程序,分析生命体(包括人类)全部基因组算机程序,分析生命体(包括人类)全部基因组结构及功能。结

19、构及功能。第49页/共93页第50页/共93页51基因组学包括:基因组学包括:结构基因组学结构基因组学(structural genomics) (structural genomics) 功能基因组学功能基因组学(functional genomics)(functional genomics)比较基因组学比较基因组学(comparative genomics) (comparative genomics) 第50页/共93页第51页/共93页52* *结构基因组学结构基因组学结构基因组学结构基因组学(structural genomics)(structural genomics)是通过是

20、通过HGPHGP的实的实施来完成的。施来完成的。Human Genome Project,HGPHGP的内容就是制作高分辨率的人类遗传图和物理图的内容就是制作高分辨率的人类遗传图和物理图,最终完成人类和其它重要模式生物全部基因组,最终完成人类和其它重要模式生物全部基因组DNADNA序列测定,因此序列测定,因此HGPHGP属于结构基因组学范畴。属于结构基因组学范畴。第51页/共93页第52页/共93页53第52页/共93页第53页/共93页54(一)物理制图(一)物理制图 (二)遗传制图(二)遗传制图 (三)基因组(三)基因组DNADNA序列测定序列测定 (四)创建计算机分析管理系统(四)创建计

21、算机分析管理系统 HGPHGP包括:包括:第53页/共93页第54页/共93页55HGPHGP主要任务及内容主要任务及内容第54页/共93页第55页/共93页56通过通过HGPHGP获得的广泛基因组信息组成了结构基因获得的广泛基因组信息组成了结构基因组学的基本内容,是开展功能基因组学的研究的组学的基本内容,是开展功能基因组学的研究的基础;同时为详尽研究每一个单基因遗传病提供基础;同时为详尽研究每一个单基因遗传病提供“平台平台”,并将成为复杂的多基因遗传病研究的,并将成为复杂的多基因遗传病研究的发端发端第55页/共93页第56页/共93页57完成一个生物体全部基因组测序后即进入后基因组完成一个生

22、物体全部基因组测序后即进入后基因组测序阶段测序阶段详尽分析序列,描述基因组所有基因详尽分析序列,描述基因组所有基因的功能,包括研究基因的表达及其调控模式,这就的功能,包括研究基因的表达及其调控模式,这就是功能基因组学(是功能基因组学(functional genomicsfunctional genomics)第56页/共93页第57页/共93页58(一)鉴定(一)鉴定DNADNA序列中的基因序列中的基因(二)同源搜索设计基因功能(二)同源搜索设计基因功能 (三)实验性设计基因功能(三)实验性设计基因功能 (四)描述基因表达模式(四)描述基因表达模式 主要具体内容包括以下方面主要具体内容包括以

23、下方面 第57页/共93页第58页/共93页59功能基因组学研究策略及主要内容功能基因组学研究策略及主要内容第58页/共93页第59页/共93页60第59页/共93页第60页/共93页61The Relation between Genomics and Medicine第60页/共93页第61页/共93页62* *基因病的概念基因病的概念以基因组学为基础,从疾病和健康的角以基因组学为基础,从疾病和健康的角度考虑,人类疾病大多直接或间接地与基因度考虑,人类疾病大多直接或间接地与基因相关,故有相关,故有“基因病基因病”概念产生。根据这一概念产生。根据这一概念,人类疾病大致分为三类:概念,人类疾病

24、大致分为三类:(一)单基因病(一)单基因病 (二)多基因病(二)多基因病 (三)获得性基因病(三)获得性基因病 第61页/共93页第62页/共93页63第62页/共93页第63页/共93页64第63页/共93页第64页/共93页65第64页/共93页第65页/共93页66第65页/共93页第66页/共93页67第66页/共93页第67页/共93页68第67页/共93页第68页/共93页69第68页/共93页第69页/共93页70第69页/共93页第70页/共93页71寡核苷酸杂交分析寡核苷酸杂交分析SNPSNP和等位基因特异和等位基因特异寡核苷酸杂交寡核苷酸杂交 第70页/共93页第71页/共

25、93页72DNADNA芯片检测的差异表达谱芯片检测的差异表达谱第71页/共93页第72页/共93页73第72页/共93页第73页/共93页74第73页/共93页第74页/共93页75第74页/共93页第75页/共93页76第75页/共93页第76页/共93页77第76页/共93页第77页/共93页78第77页/共93页第78页/共93页79三、真核生物基因组及特点三、真核生物基因组及特点 1. 真核生物基因组的结构特点真核生物基因组的结构特点 基因组的分子量大基因组的分子量大 真核生物往往有很多条染色体,一般呈线性。每个染色体的真核生物往往有很多条染色体,一般呈线性。每个染色体的DNA又有又有

26、很多个复制起始位点。细胞核很多个复制起始位点。细胞核DNA与蛋白质稳定地结合成染色质的复制与蛋白质稳定地结合成染色质的复制结构。结构。 核基因组核基因组DNA分子存在于细胞核内,由于核膜将细胞分隔成细胞质和分子存在于细胞核内,由于核膜将细胞分隔成细胞质和细胞核,在基因表达中转录和翻译的空间位置是分隔的,不偶联。原核细胞核,在基因表达中转录和翻译的空间位置是分隔的,不偶联。原核生物的染色体外没有核膜。生物的染色体外没有核膜。基因组有大量不编码蛋白质的序列基因组有大量不编码蛋白质的序列 真核生物的蛋白质编码基因往往单拷贝形式存在。真核生物的蛋白质编码基因往往单拷贝形式存在。 第78页/共93页第7

27、9页/共93页802. 2. 真核生物基因组中的真核生物基因组中的DNADNA序列特征序列特征 非重复序列(单一序列)非重复序列(单一序列) 是指在一个基因组中,这些序列一般只有一个或者几个拷贝,它占是指在一个基因组中,这些序列一般只有一个或者几个拷贝,它占DNA总量的总量的4080。750-2000bp750-2000bp 中度重复序列中度重复序列 指在一个基因组中有几十到几百个拷贝,占总指在一个基因组中有几十到几百个拷贝,占总DNA的的1040。 高度重复序列高度重复序列卫星卫星DNA 只在真核生物中发现,占基因组的只在真核生物中发现,占基因组的1060,由,由6100个碱基组个碱基组成,在成,在DNA链上串连重复几百万次链上串连重复几百万次 第79页/共93页第80页/共93页813.3.基因家族与基因簇基因家族与基因簇 基因家族(基因家族(gene family) 真核生物的基因组中有许多来源相同、结构相似、功能相关的基因真核生物的基因组中有许多来源相同、结构相似、功能相关的基因,这样一组基因称为基因家族,这样一组基因称为基因家族 。基因簇(基因簇(gene cluster) 基因家族的成员紧密成簇排列成大段的串连重复单位,定位于基因家族的成员紧密成簇排列成大段的串连重复单位,定位于染色体特殊区域上形成基因簇染色体特殊区

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论