版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因与基因组
GeneandGenome除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或基因组的一段DNA序列。基因(gene):编码蛋白质或RNA等具有特定功能产物的、负载遗传信息的基本单位。基因组(genome):一个生物体内所有遗传信息的总和。人类基因组包含了细胞核染色体DNA(常染色体和性染色体)及线粒体DNA所携带的所有遗传物质。真核基因的结构与功能
第一节TheStructureandFunctionofGene利用碱基的不同排列荷载遗传信息。通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变。作为基因表达(geneexpression)的模板,使其所携带的遗传信息通过各种RNA和蛋白质在细胞内有序合成而表现出来。
基因的功能单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为基因组构(geneorganization)。
与基因功能相关的结构编码区序列(codingregionsequence
)非编码序列(non-codingsequence)基因表达需要的调控区(regulatoryregion)序列,包括启动子(promoter)、增强子(enhancer)等。在细胞内表达为蛋白质或功能RNA的DNA序列一、真核基因的基本结构编码蛋白质或RNA的编码序列。非编码序列,包括编码区两侧的调控序列和编码序列间的间隔序列。真核基因结构不连续,为断裂基因(splitgene)。真核基因结构外显子(exon);在基因序列中,出现在成熟mRNA分子上的序列。内含子(intron):外显子之间、与mRNA剪接过程中被删除部分相对应的间隔序列。鸡卵清蛋白基因DNA与其mRNA杂交图断裂基因真核生物绝大部分编码蛋白质的基因都有内含子。编码rRNA和一些tRNA的基因也都有内含子。内含子的数量和大小决定了真核基因的大小。不同种属中,外显子序列通常比较保守,而内含子序列则变异较大。外显子与内含子接头处有一段高度保守的序列,这一共有序列是真核基因中RNA剪接的识别信号。基因的5
端称之为上游,3
端称为下游基因序列中开始RNA链合成的第一个核苷酸所对应的碱基记为+1,此碱基上游的序列记为负数,下游的序列记为正数。真核细胞的基因结构编码区含有外显子(exon):
内含子(intron):真核生物的结构基因是断裂基因非编码区非编码区编码区与RNA聚合酶结合位点外显子内含子12345真核细胞编码蛋白质基因的典型结构在真核生物中,转录单位由单个基因组成。成熟的转录物编码单个多肽链,单顺反子结构。NC5’3’转录5’UTR3’UTRintronintronexon1exon3exon2前体RNADNA翻译protein编码区域5’3’mRNARNA加工(剪接、转运)7meGAAAAAAAAAAAA不同基因所含的外显子和内含子数量不同如人血红蛋白的-珠蛋白基因有1700个碱基对,含有3个外显子和2个内含子,编码146个氨基酸。一种凝血因子基因有186000碱基对,含有26个外显子和25个内含子,编码2552个氨基酸。请计算人的-珠蛋白和凝血因子基因中外显子的碱基对在整个基因碱基对中所占的比例?(146×3)÷1700×100%=26%(2552×3)÷186000×100%=4%从这个比例中你能得出什么结论?在真核细胞中,不同基因的编码序列,在各自基因中所占的比例是不同的。在真核细胞中,编码序列在整个基因中所占的比例是较少的,而非编码序列所占的比例则是较大的,从某种意义上体现了真核细胞基因结构与功能的复杂性。2024/6/1116原核细胞的基因结构编码区非编码区非编码区与RNA聚合酶结合位点
RNA聚合酶能够识别调控序列中的结合位点,并与其结合。转录开始后,RNA聚合酶沿DNA分子移动,并与DNA分子的一条链为模板合成RNA。转录完毕后,RNA链释放出来,紧接着RNA聚合酶也从DNA模板链上脱落下来。NCNCNC5’5’3’3’转录
翻译5’UTR3’UTRUTRUTRgene1gene3gene2原核细胞编码蛋白质基因的典型结构在细菌中,同一转录单位包含多个基因,每一个基因编码一条独立的多肽链。多顺反子结构RNADNA翻译翻译protein2024/6/1118原核细胞基因真核细胞基因相同点不同点原核细胞基因与真核细胞基因的比较
都是由能够编码蛋白质的编码区和具有调控作用的非编码区组成。编码区是连续的编码区是间隔的,是不连续的二、基因编码区编码多肽链和特定的RNA分子基因的编码序列决定其编码产物的序列和功能。编码序列中一个碱基的改变或突变,可能使基因功能发生重要的变化。相同的DNA序列因起始位点的变化或不同的剪接方式而编码不同的蛋白质多肽链。基因编码区中的DNA碱基序列决定特定的成熟RNA分子的序列,即DNA的一级结构决定着其转录产物RNA分子的一级结构。转录起始点TATA盒CAAT盒GC盒增强子AATAAA剪接加尾转录终止点修饰点外显子翻译起始点内含子OCT-1OCT-1:ATTTGCAT八聚体+1结构基因启动子上游启动子元件基因的调控区(顺式作用元件)启动子上游调控元件增强子加尾信号细胞信号反应元件顺式作用元件1.启动子提供转录起始信号启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体的序列。多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。少数启动子(如编码tRNA基因的启动子)位于转录起始点的下游,这些DNA序列可以被转录。真核生物有3类启动子,分别对应于细胞内存在的三种不同的RNA聚合酶和相关蛋白质。能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。通常数个增强子序列形成一簇。有时增强子序列也可位于内含子之中。不同的增强子序列结合不同的调节蛋白。2.增强子增强邻近基因的转录增强子是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。沉默子(silencer)是抑制基因转录的特定DNA序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。3.沉默子是负调节元件
基因组第二节Genome基因组:细胞或生物体的一套完整单倍体遗传物质的总和。
细菌(大肠杆菌、质粒)蓝绿藻原核生物立克氏体支原体
原生动物真核生物真菌(酵母)动、植物(人类基因组)
病毒亚细胞生物病原体(类病毒、拟病毒、侵染性蛋白)一、真核基因组具有独特的结构基因的编码序列所占比例远小于非编码序列。高等真核生物基因组含有大量的重复序列,真核基因组中存在多基因家族和假基因。大多基因具有可变剪接,80%的可变剪接会使蛋白质的序列发生改变。基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体。结构特点:二、真核基因组中存在大量重复序列高度重复序列(highlyrepetitivesequence)中度重复序列(moderatelyrepetitivesequence)单拷贝序列(singlecopysequence)或低度重复序列(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般由2~10bp组成,成串排列,在人基因组中约占5%~6%。重复频率可达106以上,不编码蛋白质或RNA。反向重复序列(invertedrepeatsequence)卫星DNA(satelliteDNA)两个相同顺序的互补拷贝在同一DNA链上反向排列而成,重复单位长度约300bp,多数散在于基因组中,总长度约占人基因组的5%。分类:人类基因组中可分离出三类卫星DNA,共占人类基因组的5~6%:大卫星DNA(macrosatelliteDNA):其重复单位为5~171bp,主要分布于染色体的着丝粒区。小卫星DNA(minisatelliteDNA):其重复单位为15~70bp,存在于常染色。微卫星DNA(microsatelliteDNA):遗传标记其重复单位为2~5bp,存在于常染色体。2024/6/1133参与复制水平的调节
存在于DNA复制起点区的附近,是一些蛋白质(包括酶)的结合位点。参与基因表达的调控
可以转录到核内不均一RNA分子中,有些反向重复序列可以形成发夹结构,有助于稳定RNA分子。参与染色体配对
如
卫星DNA成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。功能:(二)中度重复序列重复数十至数千次,大多数与单拷贝基因间隔排列。短分散重复片段长分散重复片段平均长度约300bp~500bp,与长度约为1000bp的单拷贝序列间隔排列。拷贝数可达数十万。如Alu家族、KpnI家族、Hinf家族。平均长度为3500bp~5000bp,与长度约为13000bp的单拷贝序列间隔排列。重复达30~50万次,每个成员的长度约300bp。每个单位长度中一个限制性内切酶Alu的切点(AG↓CT),将其切成长130bp和170bp的两段。Alu家族仅次于Alu家族的第二大家族,重复序列中含有限制性内切酶KpnⅠ的位点呈散在分布,拷贝数约为3000~4800个KpnI家族以319bp长度的串联重复存在于人基因组中重复序列中含有限制性内切酶HinfI的位点。Hinf家族rRNA基因重复序列属于中度重复序列各重复单位中的rRNA基因都是相同的。rRNA基因集中成簇存在,这样的区域称为rDNA区。人类的rRNA基因位于13、14、15、21和22号染色体的核仁组织区,每个核仁组织区平均含有50个rRNA基因的重复单位。5SrRNA基因似乎全部位于1号染色体,每个单倍体基因组约有1000个5SrRNA基因。在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。(三)单拷贝序列(低度重复序列)三、真核基因组中存在大量的多基因家族与假基因多基因家族是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质。如组蛋白基因家族。基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质。如球蛋白基因家族。DNA序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称。超家族基因(superfamilygene)基因组中存在的一段与正常基因非常相似但不能表达的DNA序列。以
来表示。假基因(psuedogene)珠蛋白多基因家族的组织结构
-类珠蛋白基因家族
-类珠蛋白基因家族chromosome11chromosome162024/6/1142免疫球蛋白超家族四、线粒体DNA结构有别于染色体DNA线粒体DNA(mitochondrialDNA,mtDNA)是核外遗传物质,能独立编码线粒体中的一些蛋白质。mtDNA的结构为环状分子,与原核生物的DNA类似,结构特点也与原核生物相似。人的线粒体基因组线粒体基因组编码37个基因,包括13个编码呼吸链多酶体系的一些多肽的基因、22个编码mt-tRNA的基因、2个编码mt-rRNA(16S和12S)的基因。物种基因组大小(Mb)基因数染色体数*支原体M.genitalium0.58470无流感嗜血杆菌H.influrnzae1.831743无枯草芽孢桿菌B.subtilis4.204100无大肠杆菌E.coli4.604288无酿酒酵母S.cerevisiae13.50603416裂殖酵母
S.pombe12.50492916燕麦O.sativa4663000021果蝇D.melanogaster165136014秀丽隐杆线虫
C.elegans97184246小鼠mouse27003000020人H.sapiens30002500023不同生物体基因组的比较五、人基因组中有两万多个基因2024/6/1146基因组大小(Genomesize) haploidgenome
C值(C-value):sizeofthehaploidgenome
一种生物单倍体基因组DNA的总量C值大小与生物遗传复杂性是否成正相关?2024/6/1147C值在低等真核生物中与遗传复杂性有一定的正相关,但在高等真核生物中却并非如此,它们的C值变化不定。2024/6/1148C值矛盾(悖论)是指真核生物的基因组大小并非都与其进化程度呈正相关C值矛盾的主要表现为:高等真核生物具有比用于编码蛋白质所需的DNA量高得多的C值亲缘关系密切的生物C值相差甚大;进化程度高的生物C值未必大;C值大的生物基因未必多基因组大小和基因数量在生物进化中可能并不具有特别重要的意义,人类的基因较其他生物体可能更为“有效”,其发挥功能的方式与其他生物不同。六、人的基因在染色体上的分布特征人类基因组的染色体DNA基因在染色体上并不是均匀分布。基因密度最大的是第19号染色体,密度最小的是第13号和Y染色体。染色体上存在着无基因的“沙漠区”,即在500kb区域内,没有任何基因的编码序列。基因在染色体上的分布特征2024/6/11521.基因组由一条环状双链DNA组成;2.只有一个复制起始点;3.大多数结构基因组成操纵子结构;5.无内含子,转录后不需要剪接;4.结构基因无重叠现象;原核生物基因组的结构特点6.基因组中编码区大于非编码区7.重复基因少,结构基因一般为单拷贝;9.基因组中存在可移动的DNA序列;10.非编码区主要是调控序列。8.有编码同工酶的等基因;原核生物基因组2024/6/1153细菌染色体DNA质粒DNA以大肠杆菌(Escherichiacoli)为例2024/6/1154类核(nucleoid):细菌染色体在
细胞内形成的一个致密区域大肠杆菌细胞结构nucleoid2024/6/1155(一)由一条环状双链DNA分子组成,
通常只有一个DNA复制起始点。大肠杆菌染色体DNA大肠杆菌4000K3000K2000K1000K0OriCTerCC-Value:4.6×106bp2024/6/1156(二)结构基因大多组成操纵子乳糖操纵子(lacoperon)tayz
opstructuralgenespromoterterminatoroperator半乳糖苷酶z透酶y
半乳糖苷乙酰转移酶a
操纵子(operon):多个功能相关的结构基因
成簇串联排列,与上游共同的调控区和
下游转录终止信号组成的基因表达单位。2024/6/1157其它结构特点C值:4,639,221bp基因数:4288基因大小:950bp/gene基因间隔:118bp/2gene1.基因密度非常高,基因组中编
码区大于非编码区;2.结构基因没有内含子,多为
单拷贝,结构基因无重叠现象;3.重复序列很少,重复片段为
转座子;
4.有编码同工酶的等基因(isogene)2024/6/1158(六)质粒(plasmid)
质粒是存在于细菌染色体外的,具有自主复制能力的环状双链DNA分子。2024/6/1159质粒的特性
在宿主细胞内可自主复制;
所携带的遗传信息能赋予宿主特
定的遗传性状;
细胞分裂时恒定地传给子代;
质粒可以转移。2024/6/1160病毒基因组的结构特点2.除逆转录病毒外,为单倍体基因组;1.不同病毒基因组可以是不同结构的核酸;3.病毒基因组有的是连续的,有的分节段;4.有的基因有内含子;5.病毒基因组大部分为编码序列;90%7.功能相关基因转录为多顺反子mRNA。6.有基因重叠现象;病毒基因组病毒是由一个或几个核酸分子组成的基因组,有一层蛋白或脂蛋白保护性外壳,且可在一定宿主细胞中自我复制的感染性因子。第2节病毒基因组2024/6/1162130~375kb痘病毒(Poxvirus)1.不同病毒基因组大小相
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年水电站发电权承包经营协议3篇
- 2025年度选矿厂矿产资源开采承包合同示例3篇
- 2025年新婚姻法离婚协议书婚姻法律专家团队服务合同2篇
- 2025年绿色能源开发项目投资合作协议范本3篇
- 二零二五版海洋工程设备采购预付款担保服务协议3篇
- 2025年旺铺门面租赁合同(含节假日临时摊位租赁及物业费减免优惠)11篇
- 二零二五版电子商务平台合作授权分销合同3篇
- 2025年特种航空器买卖合同模板及国际法规2篇
- 二零二五年户外运动装备分期付款合同下载3篇
- 2025年度旅行社旅游线路设计合同4篇
- 我国无菌包装行业消费量已超千亿包-下游需求仍存扩容潜力
- 大数据管理与考核制度大全
- 大学面试后感谢信
- 2022届上海高考语文调研试测卷详解(有《畏斋记》“《江表传》曰…”译文)
- SBT11229-2021互联网旧货交易平台建设和管理规范
- 如何打造顶尖理财顾问团队
- 土壤农化分析课件
- 小区大型团购活动策划
- NEC(新生儿坏死性小肠结肠炎)92273
- 2023年租赁风控主管年度总结及下一年展望
- 开关插座必看的七个安全隐患范文
评论
0/150
提交评论