医学分子生物学-4 基因组、基因组学与转录组学_第1页
医学分子生物学-4 基因组、基因组学与转录组学_第2页
医学分子生物学-4 基因组、基因组学与转录组学_第3页
医学分子生物学-4 基因组、基因组学与转录组学_第4页
医学分子生物学-4 基因组、基因组学与转录组学_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三部分基因组、基因组学与转录组学基因 (Gene) 是编码RNA和蛋白质序列信息及表达这些信息所必需的的全部核苷酸序列。基因组(Genome) 是一个细胞或一个生物体所载的全部遗传信息,这些遗传信息决定了生物体的发生,发展和各种生命现象的产生。基因组学(genomics) 是阐明整个基因组的结构与功能以及基因之间的相互作用。转录组学(transcriptomics) 全面了解基因组的整体转录情况及调控规律。20世纪人类科技发展史上的三大创举1940年代第一颗原子弹爆炸;1960年代人类首次登上月球;1990年代提出并基本完成的人类基因组计划(Human Genome Project,HGP)

2、 第一节 基 因基因的概念 侧翼序列: 含有调控序列 核酸分子中贮存遗传信息的基本单位 RNA和蛋白质相关遗传信息的基本存在形式 编码RNA和蛋白质多肽链序列信息以及表达这些 信息所必需的全部核苷酸序列编码序列: 外显子(exon)插入序列: 内含子(intron)1.结构基因编码RNA(rRNA、tRNA、MicroRNA)或通过mRNA编码蛋白质的DNA序列。2.调控序列 为表达结构基因所需要的启动子、增强子等调控序列。 基因的结构原核生物的结构基因是连续的真核生物结构基因由外显子(编码序列)和内含子(非编码序列)两部分组成,编码序列不连续,称为断裂基因(interrupted gene)

3、。结构基因编码RNA和多肽链 调控序列保证结构基因的表达 前导序列尾部序列编码区侧翼序列侧翼序列结构基因编码区两侧的一段不被翻译的DNA片段(侧翼序列),参与转录调控。 原核生物的mRNA是多顺反子mRNAPromoterGene 1Gene 2Gene 3TerminatorDNATranscriptionmRNA31235TranslationProteins123TranslationTranscriptionmRNADNAProteinPromoterGene35 单顺反子mRNA(monocistronic mRNA) 真核生物的一个编码基因转录生成一个mRNAtayz opstru

4、ctural gene 原核生物基因的调控序列promoter启动子 promoterterminator终止子 terminatoroperator操纵元件 operator启动子 (Promoter):与RNA 聚合酶结合并起始转录的一段DNA序列。RNA poI识别位点和mRNA转录起始位点有方向性,位于转录起始上游,有一定保守性。启动子本不出现于RNA产物中,仅提供转录起始信号。原核生物启动子区域特点1. RNA合成起始点,+1位碱基;2. 位于-10bp区的RNA pol结合部位,6-8bp组成,富含A,T,称为TATA盒(TATA box);3. 转录起始识别部位,位于-35bp区

5、,共有序列TGACA。 启动子序列越接近共有序列,起始转录作用越强,称为强启动子,反之称为弱启动子。终止子:提供转录终止信号 分两类:一类为在Rho因子作用下终止;另一类在靠近终止区转录后一段mRNA形成茎环二级结构,可终止转录。操纵元件被阻遏蛋白质别与结合 正调控蛋白 阻遏蛋白 结合位点 结合位点正调控蛋白结合位点可加强下游结构基因的转录 CAAT boxTATA box Enhancer promoter 真核生物基因的结构exonexon非翻译区:untranslated regions ,UTR UTRUTR5 3 intronintronexon开放阅读框:open reading

6、frame ,ORFresponse element真核生物结构基因外显子(exon) 在结构基因中,与成熟mRNA分子相对应的序列。内含子(intron) 位于外显子之间,在mRNA剪接过程中被删除部分相对应的序列。20 DNAmRNA前体RNA剪接 intron exon 成熟mRNA真核基因中RNA剪接的识别信号内含子的 5端以GT开始 3端以AG结束intron2intron1 真核生物基因的调控序列反式作用因子:能识别和结合特定的顺式作用元件,并影响基因转录的一类蛋白质或RNA。顺式作用元件:能影响基因表达,但不编码RNA和蛋白质的DNA序列。TATAAAATATTT 533 5 -

7、顺式作用元件顺式调节(cis-regulation):一个基因的调控区和结构基因位于同一染色体中相邻部位,该调节方式称为顺式调节。 相应的DNA序列称为顺式调控元件或顺式作用元件(cis-acting element)。 真核生物顺式作用元件启动子调控元件(增强子,沉默子)加尾信号53- GCGC- CAAT-TATA-TATA 盒CAAT 盒GC 盒增强子内含子外显子转录终止子结构基因调控序列真核生物启动子:位于转录起始上游,由转录因子识别并决定RNA聚合酶结合和起始转录的核苷酸序列。三类启动子:分别结合三种RNA聚合酶启动子:富含GC,主要编码rRNA的基因启动子:具有TATA盒或CAAT

8、盒GC盒结构,主要编码mRNA和小RNA基因。启动子:包括A盒、B盒和C盒,编码5SrRNA、tRNA基因等。 TATA盒(TATA Box) 位于-25-30bp,TATAAAA/TATATAT 与TFII结合,启动基因转录。启动子和上游启动子元件-25+1-30-30-25+1-80-70 CAAT盒(CAAT Box) 位于-70-80bp,GG C/ T CAATCT, 与CTF结合,决定启动子转录效率。 GC盒(GC Box) 位于-35bp ,GGCGG,与转录因子SP1结 合,促进转录的过程。-35+1 增强子(enhancer) CAAT box 与转录因子特异性结合,增强转录

9、活性,在基因任意位置都有效、无方向性。TATA box enhancer promoter 5 3 exon intron 增强子增强临近基因转录增强子(enhancer) 是指一段短的DNA序列,可特异性结合转录因子,增强基因转录活性。 与启动子不同的是增强子可位于基因的任何位置,也无方向性,可以是5 3 ,也可以是3 5 。不同增强子结合不同的调节蛋白。沉默子是负性调节元件沉默子(silencer) 是真核生物的一种负性调控序列,与反式作用因子结合阻断增强子及反式激活因子的作用,阻遏基因转录活性,使基因沉默。335-AATAAA - GT- 3 DNA mRNA 前体5-AAUAAA -

10、GU- 3Poly(A)加尾信号 含有II类启动子的基因,基因末端保守的AATAAA顺序及下游GT或T富含区,被多聚腺苷酸化特异因子识别,在mRNA 3端加约200个A。第二节 基因组 是一个细胞或一个生物体的完整单倍体遗传物质总和。人类基因组包含细胞核染色质及线粒体DNA。原核生物细菌基因组包含拟核和质粒DNA。病毒基因组由DNA或RNA组成。 基因组 (bp)基因数 (个)人 (Homo sapiens) 3 X 10930,000小鼠 (M. musculus)2.6 X 10930,000线虫 (C. elegans)9.7 X 10719,000果蝇 (D. melanogaster

11、) 1.37 X 10813,000酵母 (S. cerevisiae) 1.2 X 1076,000拟南芥(A. thaliana) 1.0 X 10825,000大肠杆菌 (E. coli)4.6 X 1063,200艾滋病毒 (HIV) 97009不同物种的基因组 原核生物基因组细菌染色体DNA质粒DNA以大肠杆菌(Escherichia coli)为例拟核:细菌染色体在细胞内形成的一个致密区域大肠杆菌细胞结构质粒plasmid原核生物基因组结构特点结构基因大多是连续的重复序列很少编码蛋白质的结构基因多为单拷贝基因,编码rRNA的基因为多拷贝基因结构基因所占的比例(50%)大于真核生物基

12、因组,小于病毒基因组许多结构基因以操纵子为单位排列原核生物基因组以操纵子模型为其特征 多个功能相关的结构基因成簇串联排列,与上游共同的调控区和下游转录终止信号组成的基因表达单位。 由一条环状双链DNA分子组成 通常只有一个DNA复制起点4.6106bp大肠杆菌染色体DNA OriCTerC乳糖操纵子 lac operontayz opstructural genepromoterterminatoroperator-galactosidase半乳糖苷酶 z-galactoside permease透酶 y -galactoside transacetylase半乳糖苷乙酰转移酶 a 原核生物的

13、mRNA是多顺反子mRNAPromoterGene 1Gene 2Gene 3TerminatorDNATranscriptionmRNA31235TranslationProteins123质粒也是原核生物的遗传物质质粒是存在于细菌染色体外的,具有自主复制能力的环状双链DNA分子,大小为1.5-15 kb。质粒的特性 在宿主细胞内可自主复制; 所携带的遗传信息能赋予宿主特定的 遗传性状; 细胞分裂时恒定地传给子代; 质粒可以转移。病毒基因组特点病毒基因组由DNA或RNA构成,可以是单链或双链结构。可以是闭环分子,也可以是线性分子与真核生物和细菌基因组相比,病毒基因组很小病毒基因组只含一种类型

14、的核酸RNA病毒基因组可以由数条不相连的RNA连组成病毒基因组存在基因重叠 病毒基因组的特点 可以是单链,也可以是双链结构 可以是闭环分子,也可以是线性分子 基因组大部分序列编码蛋白质,基因之 间间隔序列短 病毒基因组基因重叠 同一DNA片段可以是两种或三种蛋白质 分子的部分编码区。 重叠编码机制提高了病毒基因组的编码 能力。 真核生物基因组的特点 基因组庞大 结构基因是断裂基因 结构基因的转录产物为单顺反子mRNA 大量重复序列 染色体末端具有端粒结构人类基因组90%的序列可以转录-编码序列编码序列概念:凡是可以转录出RNA(mRNA及所 有其他RNA)的序列。 只有2%编码mRNA并翻译成

15、蛋白质,其他大部分编码序列转录出的RNA不编码蛋白质的信息,称为非编码RNA(non-coding RNA,ncRNA)。ncRNA直接或间接参与蛋白质表达调控。 染色体DNA的组成 核小体人类基因组中存在许多重复序列高度重复序列中度重复序列单拷贝序列/低度重复序列 高度重复序列DNA (highly repetitive DNA)卫星DNA(satellite DNA)反向重复序列 (inverted repeats)重复次数105次高度重复序列 占基因组长度的20%。反向重复序列:两个序列相同的拷贝在DNA链上呈反向排列,常见于基因的调控区。与基因复制、 转录调控有关。卫星DNA:在非编码

16、区中的串联重复。与染色体减数分裂时染色体配对有关。反向重复序列5AAACCACCGCTGGTAGCGGTGGTTT33TTTGGTGGCGACCATCGCCACCAAA55AAACCACCGCTAGCGGTGGTTT33TTTGGTGGCGATCGCCACCAAA5回文结构中度重复序列 重复次数为103-105,散在分布基因组中,占基因组35%。短分散重复片段:长度300-500bp,如Alu家族长分散重复片段:3500-5000bp,如rRNA基因 功能与高度重复序列类似 Alu家族:重复单位约300bp,由两个130bp重复序列及31bp间隔序列组成;重复30-50万次,散在分布;有Alu

17、酶切位点(AG/CT),灵长类特有。单拷贝序列/低度重复序列在一个基因组中只出现一次或数次,大多数编码的蛋白质基因属于这一类。在基因组中,单拷贝序列的两侧为散在分布的重复序列。单拷贝序列编码的蛋白质维系细胞的功能,如酶、激素、受体、结构蛋白和调节蛋白等。对这些序列研究尤为重要。人类基因组中存在多基因家族和假基因多基因家族:是指核苷酸序列相同或相似,或其 编码产物具有相似功能的一类基因。假基因:与有功能的基因相似,不表达基因产物的基因。1.核酸序列相同:多拷贝基因形成的基因簇, rRNA、tRNA、组蛋白基因家族。多基因家族(multigene family)2.核酸序列高度同源生长激素(GH)

18、与绒毛膜生长催乳激素(CS) 氨基酸序列比对多基因家族(multigene family)3.编码产物的功能或功能区同源多基因家族(multigene family) 基因超家族(supergene family) 是指DNA序列有一定的相似性,但功能不一定相同的若干个多基因家族的集合。 如免疫球蛋白基因超家族,编码免疫球蛋白、 多种细胞表面蛋白及一些黏附分子等。 它们在氨基酸组成上具有较高的同源性,含有一个或几个免疫球蛋白样结构域。假基因(pseudogene, ) 是指与某些有功能的基因结构相似,但不能表达基因产物的基因。 假基因的产生:功能基因突变或cDNA插入 G A 21Alu10

19、kb珠蛋白基因簇中的假基因 人类线粒体基因组包含37个基因线粒体DNA(mitochondrial,mtDNA)是核外遗传物质,环状分子,结构特点与原核生物基因组相似。全长16,569bp,共编码37个基因,其中13个构成呼吸链多酶体系多肽基因,22个编码mt-tRNA基因,2个编码mt-rRNA基因。第三节 基因组学 基因组是一个细胞(或病毒)所载的全部遗传信息。 基因组学是阐明整个基因组的结构与功能以及基因之间的相互作用。基因组学结构基因组学(Structural Genomics) 着重遗传图、物理图、测序等研究比较基因组学(Comparative Genomics) 以转录图为基础的功

20、能制图(基因组表达图)功能基因组学(Functional Genomics) 对不同进化阶段生物基因组的比较研究,不同人种、族群和群体基因组的比较研究一、结构基因组学的主要任务是基因测序 通过人类基因组计划(human genome project, HGP)的实施,解析人类自身DNA序列和结构。研究内容:通过基因作图,构建连续克隆系及大规模测序等方法,结合模式生物已知基因组DNA序列,辅以生物信息学和计算机技术,解密人类基因组DNA序列和结构。人类基因组计划遗传连锁图(genetic map)物理图谱(physical map)序列图谱(sequence map)转录本图谱(transcri

21、ption map)二、功能基因组学探讨基因的活动规律 研究内容:从整体上研究一种组织或细胞在同一时间或同一条件下所表达基因的种类、数量、功能及在基因组中的定位,或同一细胞在不同状态下基因表达的差异。同时对多个表达基因或蛋白质进行研究。三、比较基因组学鉴别生物基因组间相似性与差异性种间比较基因组学阐明物种间基因组结构的差异种内比较基因组学阐明群体内基因组结构的变异和多态性四、HGP实现了人类基因组的破译和解读 HGP最早由美国提出并启动。随后,英国、日本、法国、德国和中国相继加入。该计划于1990年10月正式启动,至2003年4月完成,历时13年。 现今,生命科学已进入到“后基因组时代”。 五

22、、ENCODE的目标是识别人类基因组所有功能元件 HGP完成后,对人类基因组庞大序列信息的解读,如何应用这些信息应对人类重点疾病。 美国于2003年9月启动了DNA元件百科全书(encyclopedia of DNA elements, ENCODE)计划。 旨在解析人类基因组中所有功能元件。ENCODE已取得重要阶段性成果 2012年9月6日Nature发表了 “人类基因组的整合ENCODE”的报告大部分序列(80.4%)具有各种功能399124个区域有增强子样特征,70292个区域有启动子样特征。RNA产生和加工与转录因子活性相关第四节 转录组学转录组(transcriptome)是指生命

23、单元所能转录出来的全部转录本。包括mRNA、rRNA、tRNA和其他非编码RNA。转录组学(transcriptomics)是在整体水平上研究细胞编码基因(RNA和蛋白质)转录情况及转录调控规律的科学。中心法则(the central dogma)转录组特点受到内外多种因素调节,是动态可变的。揭示不同物种、 不同个体、 不同细胞、 不同发育阶段和不同生理病理状态下的基因差异表达信息。上承基因组,下接蛋白质组。是基因组功能研究的一部分,主要内容为大规模基因表达谱分析和功能注释。转录组学大规模分析基因表达谱 利用基因表达微阵列(microarray)或基因芯片(DNA chip)技术同时检测成千上万个基因在不同状态(发育不同时期,诱导刺激等)下的表达变化。从而推断基因间的相互作用,揭示基因与疾病发生发展的内在关系。推断未知基因功能 转录组学分析可以提供特定条件(生理、病理、诱导刺激等)基因表达的信息。 通过使用基因碱基序列数据以及比较已知和未知功能的基因,推断相应未知基因的功能,揭示特定调节基因的作用机制。转录组学研究的主要手段微阵列(microarray)基因表达系列分析(serial analysis of gene expression, SAGE) 大规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论