分子生物学-基因和基因组的结构与功能课件_第1页
分子生物学-基因和基因组的结构与功能课件_第2页
分子生物学-基因和基因组的结构与功能课件_第3页
分子生物学-基因和基因组的结构与功能课件_第4页
分子生物学-基因和基因组的结构与功能课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因和基因组的结构与功能

一、基因的生物学概念1866

Mendel发表《植物杂交实验》,“遗传因子”通过豌豆实验,提出经典遗传定律:分离定律和独立分配定律

1909W.Johannse提出gene这一名词,但还只是遗传性状的符号,未涉及基因的物质概念1910Morgan发现果蝇的白眼性状的伴性遗传,首次把一个特定的基因和一个特定的染色体联系起来1919教材中开始出现gene一词ThePhysicalBasisofHeredite

1926

Morgan发表TheTheoryofGene,认为:基因依孟德尔第一定律(分离定律)而彼此分离,于是每个生殖细胞只含一组基因;不同连锁群里的基因依孟德尔第二定律(自由组合定律)而自由组合;两个相对连锁群的基因之间有时候也发生有秩序的交换,交换率证明了每个连锁群里诸要素的直线排列,也证明了诸要素的相对位置。

20世纪40年代

Bendle和Tatum提出“一个基因,一个酶”学说首次在分子水平上给基因如下定义:基因位于染色体上的一定区域,在有丝分裂中作为1个遗传单位存在,并决定一定的表型。

20世纪50年代

Benzer提出“顺反子”、“一个顺反子,一条多肽链”二、基因的现代概念

生物学概念:基因是世代相传的,基因决定了遗传性状的表达,基因的颗粒性主要表现在世代相传的行为和功能表达上具有相对的独立性,基因呈直线排列在染色体上。分子生物学概念:合成有功能的蛋白质或RNA所必需的全部DNA(除部分病毒RNA),即一个基因不仅包括编码蛋白质或RNA的核酸序列,还应包括为保证转录所必需的调控序列。三、基因组的概念

细胞或生物体中,一套完整单体的遗传物质的总和,即某物种单倍体的总DNA。对于二倍体高等生物来说,其配子的DNA总和即一组基因组,二倍体有两份同源基因组。四、原核生物基因组的特点

3.相关基因丛集。DNA序列中功能相关的RNA和蛋白质基因,丛集在基因组的一个或几个特定部位,形成一个功能单位或转录单位,可被一起转录成为多顺反子mRNA。

4.常见重叠基因现象。

5.非编码区少,重复顺序少。蛋白D蛋白E细菌基因组

1.一条双链DNA,具有类核结构。2.具有操纵子结构。几个功能相关的结构基因串联在一起受同一个调控区调节。E.coli基因组含3500个基因,有260个已查明具有操纵子结构,定位于75个操纵子中。E.coli

3.蛋白质基因单拷贝,rRNA基因多拷贝,这可能有利于核糖体的组装。

E.coli中rRNA基因(rDNA)具有多拷贝,而且都以转录单位的形式组织在一起。1个转录单位通常含3个rDNA,以16S-23S-5S的顺序串联排列,有的转录单位中间还插有tRNA基因,每个转录单位的长度大于5Kb。转录后先得到rRNA前体,再剪切成16S、23S和5SrRNA4.结构基因中无内含子,边转录边翻译。

5.无基因重叠结构。6.DNA分子中有多种功能区。这些区域往往具有特殊的结构,并且含有反向重复序列。

质粒DNA存在于细菌与真核细胞中的一种亚细胞结构。绝大多数质粒都是双链DNA分子。没有蛋白外壳,只能在寄主细胞中独立地增殖,并随着宿主细胞的分裂而被遗传下去。对于宿主细胞的生存不是必需的,但质粒所携带的某些基因,可以对宿主细胞的生物学特征产生影响。质粒是一个完整、独立的复制子,并且能够转化细胞(把它的一个复本从供体细胞转移给受体细胞),因此可以作为一种载体,把目的DNA带入宿主细胞中进行增殖。而且通常能给细胞带来特殊的标记,顾而可以利用这些标记来筛选阳性克隆。质粒DNA的复制类型严紧型:每个宿主细胞中仅含有1-3个拷贝,其复制要受到宿主细胞的严格控制。松弛型:每个宿主细胞可含有10-60个拷贝,其复制不受宿主细胞的严格控制,即当宿主细胞蛋白合成受到抑制时,质粒可以继续复制,拷贝数可以增至1000-3000之多。细菌基因组学研究的意义1、能够更好地了解病原微生物的致病机制。2、对致病菌基因组的研究,可以加快重要致病基因的发现速度。3、寻找病原菌所特有的DNA序列,提高临床诊断的效率和准确性。4、为筛选有效药物及发展疫苗提供参考。细菌基因组学研究的意义总之,细菌基因组研究将使人类从更高层次上掌握病原微生物的致病机制及规律,从而得以发展新的诊断、治疗、预防微生物感染的制剂、药物及疫苗。此外,新发现的微生物酶及蛋白还可能在工农业生产上有应用价值。五、真核生物基因组的特点

真核生物基因组结构与功能特点

1、真核生物基因组的化学本质为DNA,大多与蛋白质结合形成染色质,基本结构单位为核小体。每一种真核生物都有一定的染色体数目,除配子为单倍体外,体细胞一般为双倍体,即含两份同源基因组,而原核生物的基因组则是单拷贝的。真核生物基因组结构与功能特点2、基因组远大于原核生物,结构复杂,基因数庞大,具有许多复制起始点,每个复制子大小不一。3、基因不存在操纵子结构,功能相关基因分散在不同的染色体上。基因都由一个结构基因与相关的调控区组成,转录产物为单顺反子,即一分子mRNA只能翻译成一种蛋白质。真核生物基因组结构与功能特点4、基因组中有大量低度(重复频率<103)、中度(重复频率<105)和高度重复序列。5、基因是不连续的(断裂基因),由外显子和内含子镶嵌排列而成。基因转录的初级产物需经一定的加工,切除内含子使外显子拼接,才能形成成熟的mRNA。6、非编码区(占90%以上)远大于编码区。重复序列C0t1/2高度重复序列中度重复序列单一序列真核生物DNA的复性动力学曲线将真核生物基因组的DNA进行复性动力学测定,显示3个不同的时相。重复序列的作用1、编码某些重要的功能性蛋白质及产物等,如组蛋白、rRNA、tRNA等。2、与染色体的构象、着丝点的形成有关。3、参与基因表达调控。卫星DNA与微卫星DNA的比较卫星DNA微卫星DNA存在部位染色体近端粒和着丝粒区染色体任何部位重复单位长度6-70bp,常富含GC1-6bp重复次数几次到几百次10-60次总序列长度0.5-30kb约200bp重复单位的差异重复单位组成稍有差异,重复单位的变异性低,如单个碱基置换存在数量有限,有些染色体尚未见到很多高度重复序列的功能1、参与复制水平的调节2、参与基因表达的调控3、参与转位作用4、与进化有关5、作为每一个体的特征6、可能与染色体减数分裂时染色体配对有关中度重复序列特征:一般是不编码的序列,在基因调控中起重要作用,包括开启或关闭基因的活性、DNA复制的起始、其转录产物参与hnRNA(不均一核RNA)的处理等;重复单位的序列相似,不完全一样,分散在基因组中,序列的长度和拷贝数不均一;具有种属特异性。(1)Alufamily哺乳动物中含量最丰富的中度重复序列家族。重复单位中带有限制性内切酶Alu的酶切位点:

AG↓CTTC↑GA主要集中在细胞分裂晚期的R带,大部分属于非编码DNA,但也有一部分位于mRNA的非翻译区,甚至位于编码区内。功能可能与hnRNAr的加工成熟、DNA复制及转录调节有关

(2)KpnIfamily(3)Hinffamily仅次于Alu家族的第二大家族。人KpnI顺序长6.4kb,散在分布,拷贝数约为3000-4800个,占人体基因组的1%。限制性内切酶HinfI约有50-100个拷贝分散在基因组的不同区域。多基因家族(multigenefamily)亦称基因家族,是真核生物基因组中一组来源相同、结构相似、功能相关的基因,有的编码蛋白质,有的编码RNA。根据分布不同,可分为两大类:(1)基因成簇地分布在一条染色体上,呈串联排列,产生多个拷贝,具有几乎相同的序列,同时发挥作用,如rRNA、tRNA、组蛋白等。(2)各家族成员分布在不同的染色体上,序列虽然不相同,但编码的是一组紧密相关的蛋白,如干扰素、生长激素、珠蛋白等。假基因(pseudogene)在基因家族中,有些成员的序列与相关功能基因的序列相似,但不能被转录或转录后生成无功能的基因产物。一个假基因常常有多个有害的突变,可能因为作为一种活性基因一旦停止,就再没有适当机制阻止进一步突变的聚积。假基因数目一般较少,往往只占基因总数的一小部分。假基因主要有两种类型(1)由于一种基因的加倍而失活。这种类型假基因保留原来亲本基因的外显子及内含子组织并常与亲本基因密切联系,如α、β球蛋白基因簇的假基因。它们可能是由于失去起始转录信号,或外显子—内含子连接处不能剪接或翻译不能终止。(2)第二种假基因仅含有亲本基因的外显子,常常拥有3’端polyA尾,并随机分布于基因组中。这些假基因是源于mRNA,并通过逆转录而重新整合进基因组。人β-珠蛋白基因簇及各个功能β-类珠蛋白基因的结构列举几个基因家族:1典型的前rRNA基因(转录单位)结构示意图列举几个基因家族:2组蛋白基因簇三种动物中的组蛋白基因簇黑色方框:组蛋白基因空心方框:基因间的间隔区箭头:基因的转录方向列举几个基因家族:3超基因家族指一组由多基因家族及单基因组成的更大的基因家族。结构上有不同程度的同源性,可能起源于相同的祖先基因,但功能不相同。例如,免疫球蛋白超基因家族。单一序列也称为单拷贝序列。真核生物一般为二倍体细胞,因此不重复的单一序列存在2个拷贝。大多数结构基因都是单一序列。80%左右的mRNA来自单一序列DNA。结构基因的突变容易引起遗传性状的改变或产生遗传性疾病。断裂基因即不连续基因。绝大多数真核生物的基因都是断裂基因。编码蛋白质的基因称为外显子(exon),其间由不编码的序列即内含子(intron)隔开。转录时一起被转录出来,然后再经过加工剪切内含子后,外显子拼接起来后成为成熟的mRNA。不连续基因的发现时是通过mRNA和DNA杂交实验而发现的。电镜照片解释图鸡卵清蛋白基因中外显子和内含子的排列顺序及大小鸡卵清蛋白mRNA与DNA杂交实验图移动基因

(转座子或转位子,transposon)

可从染色体基因组的一个位置转移到另一个位置的基因,也可在不同的染色体之间跳跃。

20世纪40、50年代,美国遗传学家McClintock(1983年获得诺贝尔生物医学奖)在研究玉米籽粒颜色的高频变异时提出这一概念,当时称为“控制因子”。这些基因能在玉米不同的染色体上从一个位点转移到另一个位点,有时象一个新奇的生物学开关一样,开动或关闭基因。

跳跃基因的概念,使人们认识到功能上相关的各个基因,并不一定以紧密连锁的形式存在,它们可以分散在不同染色体或者同一染色体的不同部位上,因此极大地丰富和发展了现代基因概念。

人类基因组计划

(HGP,humangenomeproject)人类基因组结构特点1、前述的真核基因组的结构特点基本上都适用于人类基因组。2、基因组DNA有30亿个碱基对(3×109bp),5-10万个基因,目前已定位的有2000个3、编码序列只占基因组总DNA量的5%以下,非编码区占95%以上,大量为重复序列人类基因组中的DNA多态性每个人之间基因组并不完全相同,也叫基因组的多态性,这个多态性表现在DNA的序列上。统计表明,任意两个人之间的DNA核苷酸差异约占基因组的0.01%,就是这基因组中0.01%的差异,决定了人类的遗传多样性,如有的人容易生病,而有的人却对疾病的免疫能力特别高,有些药物,有的人用了就灵验,有的人就不灵验。只有从不同个体DNA序列的差异上阐明人类基因组的多态性,才能真正了解与疾病特别是多基因疾病有关的遗传机制,同时深入准确地了解人类起源、进化和迁徙过程中的DNA序列变化。1、位点多态性

(DNAsitepolymorphism)是由于等位基因间在特定位点上DNA序列存在差异造成的。例如人血液中的许多蛋白质和红细胞、白细胞的表面抗原在不同个体之间的生化特征、抗原特性都存在着由遗传造成的变异。在各种DNA位点多态性系统中,人类白细胞抗原(HLA)是最复杂的一种,仅其中的HLA-DR抗原的编码位点就有DRA、DRB1。「DRB2、DRB3、DRB4、DRB5六个座位,共有60多个等位基因。2、限制性片段长度多态性

(restrictionfragmentlcngthpolymorphism,RFLP)DNA位点多态性可影响限制酶的切割位点,造成限制性片段长度多态性,即用同一种限制酶消化不同个体的DNA时,会得到长度各不相同的限制性片段类型。不同个体基因组在同一段DNA是否有同样的酶切位点,决定了酶切后是否会产生同样大小的片段。当碱基组成的变化改变了限制酶识别位点(位点消失、产生新的位点、位点移位等)时,就会得到不同的限制性片段类型,这样的位点称为多态性位点。通过限制酶酶切片段的长度多态性来揭示DNA碱基组成不同的技术称为限制性片段长度多态性技术,简称RFLP技术。高度重复序列中的无间隔反向重复序列很容易形成限制酶识别位点,也很容易由于突变产生或失去一个酶切位点。所以,RFLP的基础是高度重复序列(数量大)和点突变。3、串联重复顺序多态性

(tandemrepeatspo13rmor-phism)有一些重复序列,其重复单位很小,比如(CC)n、(ATT)n,但串联重复次数有较大的变化,形成串联重复顺序多态性,也称为可变数目的串联重复序列(variablcnumberoftandcmrepeats,VNTRs),这是另一种DNA序列长度多态性,这种多态性在人群中有极高的频率。串联重复顺序长度多态性主要发生在小卫星DNA和微卫星DNA中。研究背景1985年,美国能源部(DOE)率先提出,旨在阐明人类基因组DNA长达3×109碱基对(basepair,bp)的序列。发现所有人类基因并阐明其在染色体上的位置,从而在整体上破译人类遗传信息。1986年美国宣布启动“人类基因组启动计划”。1989年,美国国家卫生研究院(NIH)建立国家人类基因组研究中心(NCHGR)。1990年,NIH和DOE联合提出美国人类基因组计划,正式启动HGP,计划于15年内提供30亿美元的资助,在2005年完成人类基因组全部序列的测定。研究进程HGP启动以后进展顺利,计划进度一再修改。1998年,最后一个五年计划指定出来,HGP提前2年于2003年完成。最后一个五年计划的主要目标是:

①得到标记间距为1厘摩(1厘摩=重组频率为1%的两个基因间的遗传距离)的遗传图谱;②得到至少有30万个序列标记位点(STS)的物理图谱,1998年10月实际已经有5.2万个STS被作图;③2001年得到人类基因组序列的“草稿”,2003年得到最后“定稿”;④测序能力要达到每年500Mb(1Mb=1000kb),每个碱基对的分析费用要少于25美分,支持毛细管阵列电泳、DNA芯片等的测序技术的发展;

⑤增加测定人类基因组变异的内容,得到10万个作图定位了的单核苷酸多态性(SNP);⑥得到所有基因的全长cDNA;⑦发展在基因组尺度上分析生物功能的技术;⑧在模式生物基因组研究方面,大肠杆菌、酵母菌、短小丽杆线虫的全基因组序列已经全部完成并发表公布,到2002年完成果蝇的全基因组序列,2005年完成小鼠的全基因组序列。基因组研究大事记1990年10月被誉为生命科学“阿波罗登月计划”的国际人类基因组计划启动。1998年一批科学家在美国罗克威尔组建塞莱拉遗传公司,与国际人类基因组计划展开竞争。12月一种小线虫完整基因组序列的测定工作宣告完成,这是科学家第一次绘出多细胞动物的基因组图谱。1999年9月中国获准加入人类基因组计划,负责测定人类基因组全部序列的1%。中国是继美、英、日、德、法之后第6个国际人类基因组计划参与国,也是参与这一计划的唯一发展中国家。12月1日国际人类基因组计划联合研究小组宣布,完整破译出人体第22对染色体的遗传密码,这是人类首次成功地完成人体染色体完整基因序列的测定。2000年4月6日美国塞莱拉公司宣布破译出一名实验者的完整遗传密码,但遭到不少科学家的质疑。4月底中国科学家按照国际人类基因组计划的部署,完成了1%人类基因组的工作框架图。5月8日德、日等国科学家宣布,已基本完成了人体第21对染色体的测序工作。6月26日科学家公布人类基因组工作草图,标志着人类在解读自身“生命之书”的路上迈出了重要一步。12月14日美英等国科学家宣布绘出拟南芥基因组的完整图谱,这是人类首次全部破译出一种植物的基因序列。2001年2月12日中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。2002年六国科学家公布人类基因组细节研究成果1.遗传图谱遗传图的绘制是人类基因组研究的第一步,是以染色体上某一点为遗传标记,以与之相伴遗传的特征为对象,经连锁分析,将编码该特征的基因定位于染色体特定位置。即通过计算连锁的遗传标志之间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论