医学生物化学与分子生物学12遗传信息的表达单元-基因_第1页
医学生物化学与分子生物学12遗传信息的表达单元-基因_第2页
医学生物化学与分子生物学12遗传信息的表达单元-基因_第3页
医学生物化学与分子生物学12遗传信息的表达单元-基因_第4页
医学生物化学与分子生物学12遗传信息的表达单元-基因_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

~12~

遗传信息的表达单元

——基因

目录12.1

遗传信息目录1.遗传信息的物质基础129.tif图12-1肺炎双球菌实验(Avery,1944)图12-2噬菌体侵染细菌实验(Hershey,1952)目录

现代分子生物学认为亲代与子代之间传递遗传信息的物质,除RNA病毒的遗传物质是RNA、朊病毒(prion)的遗传物质是蛋白质外,所有细胞生物以及DNA病毒的遗传物质都是DNA。目录染色体2.遗传信息的传递规律遗传信息的传递规律,即遗传信息主要是从DNA流向RNA,再流向蛋白质,这种遗传信息的流动方式被称为中心法则(centraldogma)。目录r12.2

基因目录1.基因概念的发展19世纪60年代,孟德尔提出生物的性状是由遗传因子(hereditaryfactor)决定的。1908年,加洛特提出人类的尿黑酸症是一种遗传性疾病,病因是患者缺乏某种相关的酶。

1909年,约翰逊首次以基因(gene)一词替代孟德尔提出的“遗传因子”。1926年,摩尔根指出基因是在染色体上呈直线排列的遗传颗粒。

目录1941年,比德尔和泰特姆等证实了基因与酶的关系,提出了“一个基因决定一种酶(蛋白质)”。20世纪50年代,本泽尔提出了“顺反子”概念,认为一个顺反子即为一个基因。1953年,沃森和克里克提出DNA分子双螺旋结构模型,为现代分子生物学的发展奠定了重要基础。

目录2.基因的定义现代分子生物学认为:基因(gene)是核酸分子中储存遗传信息的遗传单位,是RNA或有功能的蛋白质多肽链等遗传信息的基本存在形式,包括储存蛋白质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序列。目录C:\DocumentsandSettings\Administrator\桌面\986.tif目录染色体细胞基因生命的分子——DNA3.基因的功能基因主要具有以下三种功能:①利用A、G、C、T四种碱基的不同排列组合方式携带生物体所有的遗传信息;②通过DNA复制将其荷载的遗传信息高保真地传递给子代,确保遗传信息的稳定性;③作为基因表达的模板。目录4.基因的结构原核生物、真核生物和病毒的基因各有特色,但它们都具有一个共同的结构特征,即几乎所有基因的DNA片段都包含有两部分序列,分别为结构基因(structuralgene)和调控序列(regulatoryregion)。目录为便于清晰阐述某一基因的调控序列和结构基因的位置关系,一般将基因的5′末端称为上游(upstream),3′末端称为下游(downstream)。对一个基因的完整描述不仅包括它的编码区,同时也包括它的调控序列。目录结构基因指可以在细胞内被表达为蛋白质或功能RNA的那段核酸序列。有的结构基因仅为一些有特定功能的RNA编码,如核糖体RNA(ribosomalRNA,rRNA)、转运RNA(transferRNA,tRNA)及其他小分子RNA等。而大多数结构基因则通过信使RNA(messengerRNA,mRNA)进一步为蛋白质编码。

目录调控序列指在结构基因编码序列的两侧,未携带编码信息,但与结构基因的表达调控密切相关的那段核酸序列,如启动子、增强子等序列。

在遗传信息由结构基因转录至RNA的过程中,调控序列可以通过与RNA聚合酶或其他调控蛋白的识别和结合干预转录的起始、延长和终止过程,调控基因的表达。目录为标定遗传信息的具体位置,一般将结构基因上对应于RNA链转录合成的第一个核苷酸标记为“+1”,远离此核苷酸的上游(朝向5′末端)序列皆标记为负数(如-1,-2,-3…);远离此核苷酸的下游(朝向3′末端)序列皆标记为正数(如+2,+3…)。※“0”不用于标记任何碱基位置。目录(1)原核生物的基因在原核生物中,功能上相关联的几个结构基因常常串联在一起,共用一套转录调控序列。这些串联在一起的结构基因及其两侧的调控序列共同构成了一套基本表达单位,原核生物特有的这种组合单位称为操纵子(operon)。目录bbb原核生物的结构基因:无内含子,其遗传信息是连续排列的,属于连续基因。原核生物转录后产生的RNA通常无须经过剪接加工等修饰,结构基因的遗传信息被连续保留于成熟的RNA分子中。目录原核生物的调控序列:原核生物基因的转录调控序列中,最重要的是与转录起始相关的启动子和与转录终止相关的终止子,此外尚有一些与转录开关及转录强弱相关的调控序列(如操纵序列、正调控蛋白结合位点等)。

目录启动子(promoter,P):提供转录起始信号,是能够被RNA聚合酶特异性识别和结合的位点。

目录终止子(terminator,T):提供RNA合成终止信号,多富含GC的反向重复回文序列,转录出RNA分子后,其RNA产物可形成鼓槌状茎环(stem-loop)或称发夹(hairpin)状特殊的二级结构以终止RNA链的延伸。操纵序列(operator,O):又称操纵元件,是启动子邻近的具有回文结构的小段特定序列,可以被阻遏蛋白(repressors)识别与结合,抑制基因转录。正调控蛋白结合位点:可加强下游的结构基因的转录。

目录(2)真核生物的基因

在真核生物中,大部分基因(除rDNA外)都是由一个结构基因及其上、下游相关的单独一套转录调控序列构成。由于通常情况下这些结构基因的转录产物mRNA都只能翻译成一条多肽链,因此称之为单顺反子(monocistron)RNA。

目录4真核生物的结构基因:大多数真核生物的结构基因只携带一种编码信息,但是这种编码信息在DNA序列上是不连续的,称之为断裂基因(splitgene)。经转录后加工修饰,能够被保留在成熟RNA分子的结构基因序列称为外显子(exon)。在RNA剪接(splicing)过程中被删除掉,最终没有出现在成熟RNA分子的序列则称为内含子(intron)。

目录卵清蛋白基因及其转录、转录后修饰目录真核生物的调控序列对于某一真核生物的基因而言,其调控序列所对应的DNA区段被称为顺式调控元件或称顺式作用元件。反式作用因子是由位于同一DNA分子上的其他基因或分布于其他DNA分子上的基因编码的各类蛋白质因子,如转录因子、上游因子和诱导因子等。反式作用因子能够通过直接或间接地与顺式作用元件相结合,对某一基因的表达实现不同的调控作用(激活或抑制)。目录转录起始点TATA盒CAAT盒GC盒增强子顺式作用元件(cis-actingelement)AATAAA切离加尾转录终止点修饰点外显子翻译起始点内含子OCT-1OCT-1:ATTTGCAT八聚体目录启动子:真核生物主要有三类启动子。

I类启动子富含GC碱基对,是RNA聚合酶Ⅰ和转录因子Ⅰ识别和结合的位点。

Ⅱ类启动子具有典型的TATA盒特征结构,是RNA聚合酶Ⅱ和转录因子Ⅱ识别和结合的位点。Ⅲ类启动子是RNA聚合酶Ⅲ和转录因子Ⅲ识别和结合的位点。

目录目录上游启动子元件(upstreampromoterelement,UPE):是位于启动子TATA盒上游的一些特定的DNA序列。CAAT盒:核心序列为5′GGNCAATCT3′。GC盒:含有5′CCGCC3′核心序列。CACA盒:含有5′GCCACACCC3′核心序列。目录增强子(enhancer):是由较短DNA序列组成的、成簇排列的顺式作用元件,决定着每一个基因在细胞内的表达水平。沉默子(silencer):亦称为负增强子(negativeenhancer),是可抑制基因转录的负性调节元件。当沉默子结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。反应元件(responseelements):介导基因对细胞外的信号产生应答,如热休克反应元件(heatshockresponseelement,HSE)。加尾信号:具有保守的AATAAA序列,对于mRNA转录终止和加poly(A)尾必不可少。

目录(3)病毒的基因病毒的基因很小,其基因结构特征往往取决于所侵染的宿主细胞。目录12.3

基因组

目录1.基因组的概念

细胞或生物体中,一套完整单倍体的遗传物质的总和称为基因组(genome),如人类基因组包含细胞核内22条常染色体和X、Y两条性染色体DNA以及胞浆内线粒体DNA。如果不特别注明,人类基因组通常是指核基因组而言。

目录2.原核生物基因组

(1)原核生物染色体基因组

基因组通常仅由一条环状双链闭环的超螺旋DNA分子组成。基因组中只有1个复制起点,具有操纵子结构。编码顺序一般不会重叠。基因是连续的,无内含子,因此转录后不需要剪接修饰。编码区在基因组中所占的比例(约占50%)远远大于真核基因组,但又远远小于病毒基因组。非编码区主要是一些调控序列。目录基因组中重复序列很少。编码蛋白质的结构基因多为单拷贝,但编码rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。具有编码同工酶的基因,还存在着可移动的DNA序列,包括插入序列和转座子。在DNA分子中具有多种功能的识别区域,如复制起始区、复制终止区、转录启动区和终止区等。这些区域往往具有特殊的序列,并且含有反向重复序列。目录(2)质粒质粒(plasmid)是存在于细菌细胞内,游离于染色体外,具有独立自主复制能力的共价闭合环状DNA分子(covalentclosedcircularDNA,cccDNA),长约1.5kb~15kb,相对分子质量一般在106~108范围内。目录质粒的遗传控制:①质粒具有一个能够控制质粒拷贝数的自身复制调控系统;②质粒具有能够在细菌分裂过程中使自身精确分配到子细胞中的分配区;③质粒具有能够抑制细胞分裂,使细胞分裂与质粒复制协调的控制系统;④质粒具有不可相容性。目录质粒的类型:接合型质粒、可移动型质粒和自传递型质粒。严紧型和松弛型质粒。窄宿主谱及广宿主谱质粒。

目录(3)转位因子

指能够在一个DNA分子内部或两个DNA分子之间移动的DNA片段,在细菌中则指可在质粒和染色体之间或在质粒和质粒之间移动的DNA片段。主要包括插入序列转座子可转座的噬菌体目录插入序列:插入序列(insertionsequence,IS)是一类较小的没有任何表型效应的转位因子,不含有任何宿主基因,是细菌染色体或质粒DNA的正常组成部分,长度约700bp~2000bp,由一个转位酶基因及两侧的反向重复序列(invertedrepeatsequence,IR)组成。

目录转座子(transposon,Tn)是细菌细胞里发现的一类较大的复合型转位因子,除有关转座的基因外,Tn至少带有一个与转座作用无关但决定宿主菌遗传性状的基因,如抗药性基因。可转座的噬菌体:可转座的噬菌体(transposablephage)是一类具有转座功能的溶源性噬菌体,包括Mu和D108等。

目录3.真核生物基因组

(1)真核生物基因组结构与功能特点

真核基因组远远大于原核生物的基因组,结构复杂。每一种真核生物都有一定的染色体数目。真核基因都由一个结构基因与相关的调控区组成,转录产物为单顺反子(monocistron),即一分子mRNA对应翻译成一种蛋白质多肽。绝大多数真核基因是断裂基因(splitgene),即编码序列被非编码序列分隔开来,基因与基因间的非编码序列为间隔DNA(spacerDNA),基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。目录真核生物基因组内非编码的顺序(non-codingsequence,NCS)占90%以上。真核生物中含有大量重复顺序,重复次数可达几百万以上。功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很远,但即使串联在一起的成簇的基因也是分别转录的。真核生物基因组中也存在一些可移动的遗传元件(mobilegeneticelements),其移动既可由RNA介导,也可由DNA介导。目录(2)重复序列重复序列的长度可长可短,短的仅2个碱基,长的多达数百乃至上千个碱基。重复序列的重复频率也不尽相同,可以分为高度重复序列(highlyrepetitivesequences)、中度重复序列(moderatelyrepetitivesequences)和单拷贝或低度重复序列(singlecopysequences)等三种。目录高度重复序列:在基因组中的重复频率可达数百万次(>106)的DNA序列称为高度重复序列,这种序列可以集中在某一区域串联排列。在基因组中所占比例随种属而异,从10%~60%不等。在人基因组中,高度重复序列约占基因组长度的20%。典型的高度重复序列有卫星DNA和反向重复序列两类。目录中度重复序列:中度重复序列在基因组中重复频率为10~105,散在分布于整个基因组的不同部位,常与单拷贝基因间隔排列。根据重复序列的长度,可将中度重复序列分为两个主要类型:①短分散核元件(shortinterspersednuclearelements,SINEs)。②长分散核元件(longinterspersednuclearelements,LINEs)。目录Alu家族(Alufamily)是SINEs的典型代表,因序列中含有限制性核酸内切酶AluⅠ的酶切位点而得名,为灵长类动物基因组所特有,也是人类基因组中含量最为丰富的中度重复序列,占基因组DNA总含量的3%~6%。其重复单位长度约为300bp,5′端核苷酸序列相对保守,3′端序列变化较大。Alu序列在一个单倍体基因组中重复30万~50万次,散在分布于整个基因组中。目录KpnⅠ家族(KpnⅠfamily)是LINEs的典型代表,因序列中含有限制性核酸内切酶KpnⅠ的酶切位点而得名,是中度重复序列中仅次于Alu家族的第二大家族,KpnⅠ家族成员的序列比Alu家族长,约6kb~7kb,而且不均一,有些成员片段远大于6kb~7kb,散在分布,约占人类基因组的3%~6%,功能尚不清楚。

目录单拷贝序列:在整个单倍体基因组中仅出现一次或数次,长度在800bp~1000bp之间,储存着巨大的遗传信息,大多数编码蛋白质的结构基因都属于这一类,约占人类基因组的60%~70%。

目录(3)基因家族

基因家族(genefamily)指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因。同一个家族的基因成员往往都是由同一祖先基因进化演变而来,同源性最高的可达100%(即多拷贝基因)。同源性也可以很低,只有一小段序列相同。

目录(4)假基因

在多基因家族中,某些成员并不能表达出有功能的产物,这些基因称为假基因(pseudogene),用φ表示。假基因与有功能的基因同源,原来也可能是有功能的基因,由于缺失、倒位或点突变等原因失去活性,称为无功能基因,它们或者不能转录,或者转录后生成无功能的异常多肽。假基因在哺乳动物中是一种普遍现象,可能为进化的痕迹。

目录4.病毒基因组

(1)病毒基因组结构与功能的特点

病毒基因组的组成和形式多样。病毒基因组可以是一条核酸链,也可以由多条核酸链组成:DNA病毒基因组均由连续的DNA分子组成,多数RNA病毒基因组也由连续的核糖核酸链组成,但有些则以不连续的核糖核酸链组成。病毒基因组的编码序列大于90%,远远高于原核和真核生物。基因重叠:病毒在进化过程中形成了重叠基因,即同一段核酸序列能够编码2种或2种以上蛋白质。目录HBV基因组的结构和转录图谱目录12.4

线粒体DNA目录1.

线粒体DNA的特征

人类线粒体基因组仅为一条长度约为16569bp的环状双链DNA分子,称为线粒体DNA(mitochondrialDNA,mtDNA)。根据mtDNA在CsCl中密度的不同,可将mtDNA的双链区分为重链(H)和轻链(L)两条链。目录2.线粒体基因的编码特点

mtDNA是裸露的,不与组蛋白结合。人类线粒体基因组携带的遗传信息非常有限,只编码2种mt-rRNA分子、22种mt-tRNA分子和13种参与呼吸链多酶体系组成的蛋白质。线粒体翻译系统与原核生物类似,起始氨基酸亦为甲酰甲硫氨酸。线粒体的遗传密码与核基因不完全相同。线粒体DNA初级转录产物内不含内含子,也很少有非翻译区,并且多为多顺反子(polycistron)RNA。AUG(或AUA)为线粒体mRNA的翻译起始密码子,UAA和UAG为终止密码子。成熟的线粒体mRNA的5′末端并没有帽子结构,3′端可带有poly(A)尾(但长度只有50bp左右)。目录目录12.5

人类基因组计划与基因组学

目录人类基因组织计划药学农业法医学生物整治工业过程生物燃料人类学1.

人类基因组计划

人类基因组计划(h

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论