




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
作者:汤立军单位:中南大学湘雅医学院第十一章
真核基因与基因组1/36第一节真核基因结构与功效第二节真核基因组结构与功效2/36重点难点熟悉了解掌握1.基因、基因组概念2.真核基因基本结构、真核基因组结构特点3.顺式作用元件类型及特点1.人基因组中重复序列类型及特点2.多基因家族与假基因概念1.线粒体DNA结构2.人基因在染色体上分布特征3/36真核基因结构与功能StructureandFunctionofEukaryoticGenes第一节4/361.真核基因包含编码蛋白质或RNA编码序列及其与之相关非编码序列。2.真核基因结构最突出特点是其不连续性。3.高等真核生物绝大部分编码蛋白质基因都有内含子,但组蛋白编码基因例外。编码rRNA和一些tRNA基因也都有内含子。4.外显子与内含子接头处有一段高度保守序列,即内含子5′末端大多数以GT开始,3′末端大多数以AG结束,这一共有序列是真核基因中RNA剪接识别信号。5.人们约定将一个基因5′端称为上游,3′端称为下游;将基因序列中开始RNA链合成第一个核苷酸所对应碱基记为+1,向5′端依次为-1、-2等,向3′端依次为+2、+3等。一、真核基因基本结构5/36真核生物断裂基因及两侧序列基因结构6/361.基因编码区中DNA碱基序列决定一个特定成熟RNA分子序列。2.有基因仅编码一些有特定功效RNA,如rRNA、tRNA及其它小分子RNA等;大多数基因经过mRNA深入编码蛋白质多肽链。3.编码序列中一个碱基改变或突变,可能使基因丧失原有功效或取得新功效。4.有些相同DNA序列因为其起始位点改变或mRNA不一样剪接产物能够编码不一样蛋白质多肽链。二、基因编码区编码多肽链和特定RNA分子7/36位于基因转录区前后并与其紧邻DNA序列通常是基因调控区,又称为旁侧序列(flankingsequence)。这些调控序列又被称为顺式作用元件(cis-actingelement),包含开启子、上游调控元件、增强子、绝缘子、加尾信号和一些细胞信号反应元件等。三、调控序列参加真核基因表示调控8/36真核基因及调控序列普通结构9/361.开启子提供转录起始信号
开启子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体序列。大部分真核细胞基因开启子位于基因转录起点上游,开启子本身通常不被转录;但有一些开启子(如编码tRNA基因开启子)位于转录起始点下游,这些DNA序列能够被转录。真核生物主要有3类开启子(1)Ⅰ类开启子富含GC碱基对:含有Ⅰ类开启子基因主要是编码rRNA基因。Ⅰ类开启子包含关键开启子(corepromoter)和上游开启子元件(upstreampromoterelement,UPE)两部分。(2)Ⅱ类开启子含有TATA盒特征结构:含有Ⅱ类开启子基因主要是能转录出mRNA且编码蛋白质基因和一些snRNA基因。Ⅱ类开启子通常是由TATA盒、上游调控元件组成。有Ⅱ类开启子在TATA盒上游还可存在CAAT盒、GC盒等特征序列。(3)Ⅲ类开启子包含A盒、B盒和C盒:含有Ⅲ类开启子基因包含5SrRNA、tRNA、U6snRNA等RNA分子编码基因。10/36真核基因三类开启子11/362.增强子增强邻近基因转录增强子是能够增强真核基因开启子工作效率顺式作用元件,是真核基因中最主要调控序列。(1)其能够在相对于开启子任何方向和任何位置(上游或者下游)上发挥增强作用。(2)增强子序列距离所调控基因距离近者几十个碱基对,远可达几千个碱基对。(3)通常数个增强子序列形成一簇,(4)有时增强子序列也可位于内含子之中。(5)不一样增强子序列结合不一样调整蛋白。12/363.缄默子是负调整元件缄默子(silencer)是可抑制基因转录特定DNA序列,当其结合一些反式作用因子时对基因转录起阻遏作用,使基因缄默。4.绝缘子妨碍增强子作用绝缘子(insulator)是基因组上对转录调控起主要作用一个元件,能够妨碍增强子对开启子作用,或者保护基因不受附近染色质环境(如异染色质)影响。绝缘子妨碍增强子对开启子作用可能经过影响染色质三维结构如DNA发生弯曲或形成环状结构。13/36真核基因组结构与功能StructureandFunctionofEukaryoticGenome第二节14/36细胞或生物体一套完整单倍体遗传物质总和称为基因组。病毒、原核生物以及真核生物所贮存遗传信息量有着巨大差异,其基因组结构与组织形式上也各有特点,包含基因组中基因组织排列方式以及基因种类、数目和分布等。人类基因组包含了细胞核染色体DNA(常染色体和性染色体)及线粒体DNA所携带全部遗传物质。15/36人基因组组成16/361.真核基因组中基因编码序列所占百分比远小于非编码序列。2.高等真核生物基因组含有大量重复序列。3.真核基因组中存在多基因家族和假基因。4.大多基因转录后发生可变剪接,80%可变剪接会使蛋白质序列发生改变。5.真核基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞基因组为二倍体(diploid)。一、真核基因组含有独特结构17/36
物种基因组大小(Mb)
基因数染色体数*支原体M.genitalium0.58487无流感嗜血杆菌H.influenzae1.851726无枯草芽孢杆菌B.subtilis4.134049无大肠杆菌E.coli5.144996无酿酒酵母S.cerevisiae12.12540916裂殖酵母S.pombe12.59513216燕麦O.sativa374.423637621果蝇D.melanogaster143.92147004秀丽隐杆线虫C.elegans101.17200006小鼠mouse2671.822200020人H.sapiens2996.432000023不一样生物体基因组比较*指单倍体细胞内染色体数目18/36人染色体上基因分布特征基因在染色体上并不是均匀分布。基因密度最大是第19号染色体,密度最小是第13号和Y染色体。染色体上存在着无基因“沙漠区”,即在500kb区域内,没有任何基因编码序列。19/36人染色体大小示意图20/36真核细胞基因组存在着大量重复序列。人基因组中,重复序列占基因组长度50%以上。重复序列长度不等,短仅含两个碱基,长多达数百、乃至上千个碱基。重复序列重复频率也不尽相同。1.高度重复序列(highlyrepetitivesequence)2.中度重复序列(moderatelyrepetitivesequence)3.单拷贝序列(singlecopysequence)或(低度重复序列)二、真核基因组中存在大量重复序列21/361.高度重复序列高度重复序列是真核基因组中存在、重复频率可达106次以上短核苷酸重复序列,不编码蛋白质或RNA。(1)高度重复序列按其结构特点分为2类。
①反向重复序列(invertedrepeatsequence):由两个相同次序互补拷贝在同一DNA链上反向排列而成,反向重复单位长度约为300bp或略短,其总长度约占人基因组5%,多数是散在,而非群集于基因组中。②卫星DNA(satelliteDNA):卫星DNA重复单位普通由2~10bp组成,成串排列,主要存在于染色体着丝粒区域,在人基因组中约占5%~6%。22/361.高度重复序列(2)主要功效①参加复制水平调整。反向重复序列常存在于DNA复制起点区附近,是一些蛋白质(包含酶)结合位点。②参加基因表示调控。高度重复序列能够转录到核内不均一RNA分子中,而有些反向重复序列能够形成发夹结构,有利于稳定RNA分子;③参加染色体配对。如α卫星DNA成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对相关。23/362.中度重复序列中度重复序列指在真核基因组中重复数十至数千次核苷酸序列,通常占整个单倍体基因组1%~30%。少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。依据重复序列长度,中度重复序列分为两种类型。(1)短分散重复片段(shortinterspersedrepeatsegment,SINES):平均长度约为300~500bp,与平均长度约为1000bp单拷贝序列间隔排列。拷贝数可达数十万。如Alu家族,KpnⅠ家族和Hinf家族等属于这种类型中度重复序列。(2)长分散重复片段(longinterspersedrepeatsegment,LINES):平均长度为3500bp~5000bp,与平均长度为13000bp(个别可到达数万个碱基)单拷贝序列间隔排列。24/36①Alu家族哺乳类动物包含人基因组中含量最丰富一个短分散片段,平均每6kbDNA有一个Alu序列在单倍体人基因组中重复达30~50万次,约占人基因组3%~6%每个单位长度中有一个限制性内切酶Alu切点(AG↓CT),将其切成长130bp和170bp两段②
KpnⅠ家族中度重复序列中仅次于Alu家族第二大家族重复序列中含有限制性内切酶KpnⅠ位点呈散在分布,拷贝数约为3000~4800个③Hinf家族以319bp长度串联重复存在于人基因组中重复序列中含有限制性内切酶HinfⅠ位点25/36真核生物基因组中rRNA基因也属于中度重复序列各重复单位中rRNA基因都是相同rRNA基因通常集中成簇存在,而不是分散于基因组中,这么区域称为rDNA区人类rRNA基因位于13、14、15、21和22号染色体核仁组织区,每个核仁组织区平均含有50个rRNA基因重复单位5SrRNA基因似乎全部位于1号染色体,每个单倍体基因组约有1000个5SrRNA基因。26/363.单拷贝序列(低度重复序列)单拷贝序列在单倍体基因组中只出现一次或数次,大多数编码蛋白质基因属于这一类。在基因组中,单拷贝序列两侧往往为散在分布重复序列。单拷贝序列编码蛋白质在很大程度上表达了生物各种功效。27/361.多基因家族(multigenefamily)指由某一祖先基因经过重复和变异所产生一组在结构上相同、功效相关基因。(1)基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成一些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内。(2)一个基因家族不一样组员成簇地分布于不一样染色体上,编码一组功效上紧密相关蛋白质,如人类珠蛋白基因家族分为α珠蛋白和β珠蛋白两个基因簇,分别位于第16号和第11号染色体。三、真核基因组中存在大量多基因家族和假基因28/36基因超家族(superfamilygene)一些DNA序列相同,但功效不一定相关若干个单拷贝基因或若干组基因家族总称,比如免疫球蛋白基因超家族、ras基因超家族。亚家族(subfamily)一个多基因家族中可有多个基因,依据结构与功效不一样又能够分为亚家族。比如G蛋白中属ras超家族约有50多个组员,依据其序列同源性程度又可深入分为Ras、Rho和Rab三个主要亚家族。29/364.假基因(pseudogene)基因组中存在一段与正常基因非常相同但普通不能表示DNA序列,以ψ来表示。假基因依据其起源分为经过加工假基因和未经过加工假基因2种类型(1)经过加工假基因:这类基因可能曾经有过功效,但在进化中取得一个或几个突变,造成了序列上细微改变妨碍了正常转录和翻译功效,使它们不能再编码RNA和蛋白质产物;经过加工假基因通常缺乏正常基因表示所需调整序列、没有内含子、可能有poly(A)尾。(2)未经过加工假基因:起源于多拷贝或单拷贝基因突变或者基因不完全复制。人基因组中大约有2万个假基因,其中约个为核糖体蛋白假基因。近些年发觉,假基因也表示有功效ncRNAs。30/361.线粒体DNA(mitochondrialDNA,mtDNA)是细胞内一个主要细胞器,是生物氧化场所,一个细胞可拥有数百至上千个线粒体。2.能够独立编码线粒体中一些蛋白质,是核外遗传物质。3.mtDNA结构与原核生物DNA类似,是环状分子。人线粒体基因组全长16569bp,共编码37个基因,包含13个编码组成呼吸链多酶体系一些多肽基因、22个编码mt-tRNA基因、2个编码mt-rRNA(16S和12S)基因。四、线粒体DNA结构31/36人线粒体基因组32/36经过基因组测序,人们对数种生物基因组大小和所含有基因数量有所了解。1.总体上来讲,在进化过程中伴随生物个体复杂性增加,基因组总趋势是由小变大、基因数也是由少变多。
2.决定生物复杂性原因:基因组大小、基因数、基因密度(genedensity)等。人基因组最大,复杂程度也最高
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 常用降压药的用药护理
- 健身销售培训
- 中国无机固废处理行业运营状况及前景发展规划分析报告2025-2030年
- 护理中药浴足操作规范
- 员工责任心与执行力培训
- 小学陶瓷美术课件
- 工器具消毒培训
- 2025年4月自考00465心理卫生与辅导押题及答案
- 危险废物知识培训课件
- 《GBT 40338-2021金属和合金的腐蚀 铝合金剥落腐蚀试验》全新解读
- 前列腺穿刺技术
- 2022年中国矿业权评估新准则
- 矿体井下开采基建工程及采矿投标文件
- 人工挖孔桩施工危险源辨识与评价及应对措施
- 领慧书院-中国古典礼仪和汉服文化浅析
- 抓住四个环节上好科学实验课
- 小学语文人教课标版(部编)三年级下册口语交际:趣味故事会
- 交通事故上报、处理流程图
- 酸碱盐的通性
- 不锈钢板厚度偏差
- 防坍塌安全常识上课讲义
评论
0/150
提交评论