《分子生物学》研究生课件基因组_第1页
《分子生物学》研究生课件基因组_第2页
《分子生物学》研究生课件基因组_第3页
《分子生物学》研究生课件基因组_第4页
《分子生物学》研究生课件基因组_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目录目录基因组、基因组学与基因组、基因组学与转录组学转录组学目录目录第一节 基因目录目录n19581958年提出年提出“中心法则中心法则”,通过通过DNADNA复制,生物体复制,生物体的遗传信息传给子代,通过转录和翻译,遗传信息的遗传信息传给子代,通过转录和翻译,遗传信息传给传给RNARNA和蛋白质,从而决定生物的表现。和蛋白质,从而决定生物的表现。n中心法则中心法则目录目录中心法则中心法则 (The Central Dogma)转转 录录翻翻 译译逆转录逆转录复复 制制目录目录基因是遗传的基本单位n一个基因一种酶一个基因一种酶n顺反子理论顺反子理论n操纵子学说操纵子学说n现代基因概念现代基因

2、概念 基因基因是核酸分子中贮存遗传信息的基本单位,是是核酸分子中贮存遗传信息的基本单位,是RNA和蛋白质相关遗传信息的基本存在形式,是指编和蛋白质相关遗传信息的基本存在形式,是指编码码RNA和蛋白质多肽链序列信息以及表达这些信息所和蛋白质多肽链序列信息以及表达这些信息所需的全部核苷酸序列,大部分生物中构成基因的核酸需的全部核苷酸序列,大部分生物中构成基因的核酸物质是物质是DNA,少数生物(如少数生物(如RNA病毒等)是病毒等)是RNA。目录目录除了某些以除了某些以RNA为基因组的为基因组的RNA病毒外,基因病毒外,基因通常是指染色体或基因组的一段通常是指染色体或基因组的一段DNA序列。序列。基

3、因(基因(genegene):):编码蛋白质或编码蛋白质或RNA等具有特等具有特定功能产物的、负载遗传信息的基本单位。定功能产物的、负载遗传信息的基本单位。目录目录基因组(基因组(genome):):一个细胞或一个生物体一个细胞或一个生物体内所有遗传信息的总和。内所有遗传信息的总和。人类基因组包含了细胞人类基因组包含了细胞核染色体核染色体DNA(常(常染色体和性染色体)及染色体和性染色体)及线粒体线粒体DNA所携带的所所携带的所有遗传物质。有遗传物质。 目录目录 利用碱基的不同排列荷载遗传信息。利用碱基的不同排列荷载遗传信息。 通过复制将遗传信息稳定、忠实地遗传给子代通过复制将遗传信息稳定、忠

4、实地遗传给子代细胞,在这一过程中为适应环境变化,可能会细胞,在这一过程中为适应环境变化,可能会发生基因突变。发生基因突变。 作为基因表达(作为基因表达(gene expression)的模板,使)的模板,使其所携带的遗传信息通过各种其所携带的遗传信息通过各种RNA和蛋白质在和蛋白质在细胞内有序合成而表现出来。细胞内有序合成而表现出来。 n 基因的功能基因的功能目录目录单个基因的组成结构及一个完整的生物体内基因的组织单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为排列方式统称为基因组构基因组构(gene organization)。)。n 与基因功能相关的结构与基因功能相关的结构编

5、码区序列(编码区序列(coding region sequence )非编码序列(非编码序列(non-coding sequence)基因表达需要的调控区(基因表达需要的调控区(regulatory region)序列,)序列,包括启动子(包括启动子(promoter)、增强子()、增强子(enhancer)等。)等。在细胞内表达为蛋白质或功能在细胞内表达为蛋白质或功能RNA的的DNA序列序列目录目录一、真核基因的基本结构一、真核基因的基本结构编码蛋白质或编码蛋白质或RNA的的编码序列编码序列。非编码序列非编码序列,包括编码区两侧的调控序列和,包括编码区两侧的调控序列和编码序列间的间隔序列。编

6、码序列间的间隔序列。目录目录真核基因结构不连续,为断裂基因(真核基因结构不连续,为断裂基因(split gene)。)。真核基因结构真核基因结构外显子外显子(exon);在基因序列中,出现在成熟);在基因序列中,出现在成熟mRNA分子分子上的序列。上的序列。内含子内含子(intron):外显子之间、与):外显子之间、与mRNA剪接过程中被剪接过程中被删除部分相对应的间隔序列。删除部分相对应的间隔序列。目录目录真核生物绝大部分编码蛋白质的基因都有内含子。真核生物绝大部分编码蛋白质的基因都有内含子。编码编码rRNA和一些和一些tRNA的基因也都有内含子。的基因也都有内含子。内含子的数量和大小决定了

7、真核基因的大小。不内含子的数量和大小决定了真核基因的大小。不同种属中,外显子序列通常比较保守,而内含子同种属中,外显子序列通常比较保守,而内含子序列则变异较大。序列则变异较大。外显子与内含子接头处有一段高度保守的序列,外显子与内含子接头处有一段高度保守的序列,这一共有序列是真核基因中这一共有序列是真核基因中RNA剪接的识别信剪接的识别信号。号。目录目录基因的基因的5 端称之为上游,端称之为上游,3 端称为下游端称为下游基因序列中开始基因序列中开始RNA链合成的第一个核苷酸所链合成的第一个核苷酸所对应的碱基记为对应的碱基记为+1,此碱基上游的序列记为负,此碱基上游的序列记为负数,下游的序列记为正

8、数。数,下游的序列记为正数。目录目录二、调控序列参与真核基因表达调控二、调控序列参与真核基因表达调控 位于基因转录区前后,对基因表达起调控作用的区位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的域,因其是紧邻的DNA序列,又称旁侧序列。序列,又称旁侧序列。基因的调控区(顺式作用元件)基因的调控区(顺式作用元件)目录目录转录起始点转录起始点TATA盒盒CAAT盒盒GC盒盒增强子增强子AATAAA剪接加尾剪接加尾转录终止点转录终止点修饰点修饰点外显子外显子翻译起始点翻译起始点内内含含子子 OCT-1 OCT-1:ATTTGCAT八聚体八聚体+1结构基因结构基因启动子启动子上游启动子元件

9、上游启动子元件目录目录启动子启动子上游调控元件上游调控元件增强子增强子加尾信号加尾信号细胞信号反应元件细胞信号反应元件顺式作用元件顺式作用元件反式作用因子反式作用因子:顺式作用元件的作用需要通过结合相顺式作用元件的作用需要通过结合相应的蛋白因子(多为转录因子)方可实现,而这些蛋应的蛋白因子(多为转录因子)方可实现,而这些蛋白质一般由位于另外的染色体或同一染色体远距离部白质一般由位于另外的染色体或同一染色体远距离部位的基因编码,因而被称为反式作用因子。位的基因编码,因而被称为反式作用因子。目录目录1. 1. 启动子提供转录起始信号启动子提供转录起始信号 启动子启动子是是DNA分子上能够介导分子上

10、能够介导RNA聚合酶聚合酶结合并形成转录起始复合体的序列。结合并形成转录起始复合体的序列。多数启动子位于真核细胞基因转录起点的上游,多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。启动子本身通常不被转录。少数启动子(如编码少数启动子(如编码tRNA基因的启动子)位于基因的启动子)位于转录起始点的下游,这些转录起始点的下游,这些DNA序列可以被转录。序列可以被转录。目录目录能够在相对于启动子的任何方向和位置(上游或者下游)能够在相对于启动子的任何方向和位置(上游或者下游)上发挥这种增强作用,大部分位于上游。上发挥这种增强作用,大部分位于上游。增强子序列距离所调控基因距离近者几十

11、个碱基对,远增强子序列距离所调控基因距离近者几十个碱基对,远的可达几千个碱基对。的可达几千个碱基对。通常数个增强子序列形成一簇。通常数个增强子序列形成一簇。有时增强子序列也可位于内含子之中。有时增强子序列也可位于内含子之中。不同的增强子序列结合不同的调节蛋白。不同的增强子序列结合不同的调节蛋白。2. 增强子增强邻近基因的转录增强子增强邻近基因的转录增强子增强子是增强真核基因启动子工作效率的顺是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。决定着每一个基因在细胞内的表达水平。目录目录沉默子沉默

12、子(silencer)是抑制基因转录的特定)是抑制基因转录的特定DNA序列,当其结合一些反式作用因子时对基序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默。因的转录起阻遏作用,使基因沉默。3. 沉默子是负调节元件沉默子是负调节元件目录目录基因组基因组第二节第二节目录目录基因组基因组:细胞或生物体的一套完整单倍体:细胞或生物体的一套完整单倍体遗传物质的总和。遗传物质的总和。目录目录一、真核基因组具有独特的结构一、真核基因组具有独特的结构 基因的编码序列所占比例远小于非编码序列。基因的编码序列所占比例远小于非编码序列。 高等真核生物基因组含有大量的重复序列,高等真核生物基因组含有

13、大量的重复序列, 真核基因组中存在多基因家族和假基因。真核基因组中存在多基因家族和假基因。 大多基因具有可变剪接,大多基因具有可变剪接,80%的可变剪接会的可变剪接会使蛋白质的序列发生改变。使蛋白质的序列发生改变。 基因组基因组DNA与蛋白质结合形成染色体,储存与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因于细胞核内,除配子细胞外,体细胞的基因组为二倍体。组为二倍体。结构特点:结构特点:目录目录二、真核基因组中存在大量重复序列二、真核基因组中存在大量重复序列 高度重复序列高度重复序列(highly repetitive sequence)中度重复序列中度重复序列(moder

14、ately repetitive sequence)单拷贝序列单拷贝序列(single copy sequence)或低度重复序列或低度重复序列目录目录(一)高度重复序列(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般由主要存在于染色体的着丝粒区域,重复单位一般由210 bp组成,成串排列,在人基因组中约占组成,成串排列,在人基因组中约占5%6%。重复频率可达重复频率可达105以上,不编码蛋白质或以上,不编码蛋白质或RNA。反向重复序列反向重复序列(inverted repeat sequence)卫星卫星DNA(satellite DNA)两个相同顺序的互补拷贝在同一两个相同顺序

15、的互补拷贝在同一DNA链上反向排列而链上反向排列而成,重复单位长度约成,重复单位长度约300 bp,多数散在于基因组中,总,多数散在于基因组中,总长度约占人基因组的长度约占人基因组的20 。分类:分类:目录目录l参与复制水平的调节参与复制水平的调节 存在于存在于DNA复制起点区的附近,是一些蛋白质(包复制起点区的附近,是一些蛋白质(包括酶)的结合位点。括酶)的结合位点。l参与基因表达的调控参与基因表达的调控 可以转录到核内不均一可以转录到核内不均一RNA分子中,有些反向重复分子中,有些反向重复序列可以形成发夹结构,有助于稳定序列可以形成发夹结构,有助于稳定RNA分子。分子。l参与染色体配对参与

16、染色体配对 如如 卫星卫星DNA成簇样分布在染色体着丝粒附近,可能成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。与染色体减数分裂时染色体配对有关。功能:功能:目录目录(二)中度重复序列(二)中度重复序列重复数十至数千次重复数十至数千次,大多数与单拷贝基因大多数与单拷贝基因间隔排列。间隔排列。短分散重复片段短分散重复片段长分散重复片段长分散重复片段平均长度约平均长度约300 bp500 bp,与长度约为,与长度约为1000 bp的单的单拷贝序列间隔排列。拷贝数可达数十万。如拷贝序列间隔排列。拷贝数可达数十万。如Alu家族、家族、KpnI家族、家族、Hinf家族。家族。平均长

17、度为平均长度为3500 bp5000bpbp,与长度约为,与长度约为13000bp的单拷贝序列间隔排列。的单拷贝序列间隔排列。目录目录rRNA基因重复序列属于中度重复序列基因重复序列属于中度重复序列l各重复单位中的各重复单位中的rRNA基因都是相同的。基因都是相同的。lrRNA基因集中成簇存在,这样的区域称为基因集中成簇存在,这样的区域称为rDNA区。区。l人类的人类的rRNA基因位于基因位于13、14、15、21和和22号染色号染色体的核仁组织区,每个核仁组织区平均含有体的核仁组织区,每个核仁组织区平均含有50个个rRNA基因的重复单位。基因的重复单位。l5SrRNA基因似乎全部位于基因似乎

18、全部位于1号染色体,每个单倍体号染色体,每个单倍体基因组约有基因组约有1000个个5SrRNA基因。基因。目录目录在单倍体基因组中只出现一次或数次,在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。大多数为蛋白质编码的基因。(三)单拷贝序列(低度重复序列)(三)单拷贝序列(低度重复序列)目录目录三、真核基因组中存在大量的多基因家三、真核基因组中存在大量的多基因家族与假基因族与假基因多基因家族多基因家族是指由某一祖先基因经过重复是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关和变异所产生的一组在结构上相似、功能相关的基因。的基因。基因家族成簇地分布在某一条染色体上,同

19、时发挥作基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质。如组蛋白基因家族。用,合成某些蛋白质。如组蛋白基因家族。基因家族的不同成员成簇地分布于不同染色体上,编基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质。如球蛋白基因家族。码一组功能上紧密相关的蛋白质。如球蛋白基因家族。 目录目录DNA序列相似,但功能不一定相关的若序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称。干个单拷贝基因或若干组基因家族总称。基因超家族基因超家族 ( gene superfamily )基因组中存在的一段与正常基因非常相基因组中存在的一段与正常基因非常相似但

20、不能表达的似但不能表达的DNA序列。以序列。以 来表示。来表示。假基因(假基因(psuedogene)目录目录四、线粒体四、线粒体DNA结构有别于染色体结构有别于染色体DNA线粒体线粒体DNA(mitochondrial DNA,mtDNA)是核外遗传物质,能独立编码线粒体中的一些是核外遗传物质,能独立编码线粒体中的一些蛋白质。蛋白质。mtDNA的结构为环状分子,与原核生物的的结构为环状分子,与原核生物的DNA类似,结构特点也与原核生物相似。类似,结构特点也与原核生物相似。目录目录人的线粒体基因组人的线粒体基因组线粒体基因组编码线粒体基因组编码3737个基因,包括个基因,包括1313个编个编码

21、呼吸链多酶体系的一码呼吸链多酶体系的一些多肽的基因、些多肽的基因、2222个编个编码码mt-tRNAmt-tRNA的基因、的基因、2 2个编码个编码mt-rRNAmt-rRNA(16S16S和和12S12S)的基因。)的基因。目录目录第三节第三节基因组学基因组学 Genomics目录目录基因组基因组( (genome) )一个细胞(或病毒)所载的全部遗传信息,一个细胞(或病毒)所载的全部遗传信息,它代表了一种生物所具有的全部遗传信息。对它代表了一种生物所具有的全部遗传信息。对真核生物体而言,基因组是指一套完整单倍体真核生物体而言,基因组是指一套完整单倍体DNA(染色体(染色体DNA)及线粒体或

22、叶绿体)及线粒体或叶绿体DNA的全部序列,既有编码序列,也有大量存在的的全部序列,既有编码序列,也有大量存在的非编码序列。非编码序列。 目录目录基因组学基因组学(genomics)是阐明整个基因组的结构、结构与功能关是阐明整个基因组的结构、结构与功能关系以及基因之间相互作用的科学。系以及基因之间相互作用的科学。 一、基因组学包含结构基因组学、功能一、基因组学包含结构基因组学、功能基因组学和比较基因组学基因组学和比较基因组学 目录目录基因组学包括基因组学包括3个不同的亚领域个不同的亚领域结构基因组学结构基因组学(structural genomics) 功能基因组学功能基因组学(function

23、al genomics)比较基因组学比较基因组学(comparative genomics) 基因组学概念基因组学概念目录目录二、结构基因组学的主要任务是基因二、结构基因组学的主要任务是基因组作图和大规模测序组作图和大规模测序 结构基因组学结构基因组学(structural genomics)是通过是通过HGP(human genome project)的实施来完的实施来完成的。成的。 HGP的内容就是制作高分辨率的人类遗传图的内容就是制作高分辨率的人类遗传图和物理图,最终完成人类和其它重要模式生和物理图,最终完成人类和其它重要模式生物全部基因组物全部基因组DNA序列测定,因此序列测定,因此H

24、GP属于属于结构基因组学范畴。结构基因组学范畴。目录目录(一)遗传作图和物理作图是绘制人类基(一)遗传作图和物理作图是绘制人类基因组草图的重要策略因组草图的重要策略 1遗传作图就是绘制连锁图遗传作图就是绘制连锁图 遗传图遗传图(genetic map)又称连锁图()又称连锁图(linkage map)。)。遗传作图(遗传作图(genetic mapping)就是确定连锁的遗传标志位)就是确定连锁的遗传标志位点在一条染色体上的排列顺序以及它们之间的相对遗传距点在一条染色体上的排列顺序以及它们之间的相对遗传距离,用厘摩尔根(离,用厘摩尔根(centi-Morgan,cM)表示,当两个遗传)表示,当

25、两个遗传标记之间的重组值为标记之间的重组值为1%时,图距即为时,图距即为1 cM。 (1)限制性片段长度多态性()限制性片段长度多态性(RFLP) (2) 可变数目串联重复序列(可变数目串联重复序列(VNTR) (3)单核苷酸多态性()单核苷酸多态性(SNP) 目录目录2物理作图就是描绘杂交图、限制性酶切图物理作图就是描绘杂交图、限制性酶切图及克隆系图及克隆系图 物理作图物理作图包括:包括: 荧光原位杂交图(荧光原位杂交图(fluorescent in situ hybridization map,FISH map):将荧光标记的探针与染色体杂):将荧光标记的探针与染色体杂交确定分子标记所在的

26、位置;交确定分子标记所在的位置; 限制性酶切图(限制性酶切图(restriction map);将限制性酶切位);将限制性酶切位点标定在点标定在DNA分子的相对位置;分子的相对位置; 克隆相连重叠群图(克隆相连重叠群图(clone contig map)酵母人工染色体酵母人工染色体(yeast artificial chromosome,YAC)细菌人工染色体细菌人工染色体(bacterial artificial chromosome,BAC) 目录目录(二)通过(二)通过BAC克隆系、鸟枪法等完成大规克隆系、鸟枪法等完成大规模模DNA测序测序 1BAC克隆系的构建是大规模克隆系的构建是大规

27、模DNA测序的基础测序的基础 BAC是一种装载是一种装载DNA大片段的克隆载体系大片段的克隆载体系统,用于人、动物和植物基因组文库构建。统,用于人、动物和植物基因组文库构建。BAC具有插入片段较大(数具有插入片段较大(数kb 数百数百 kb)、嵌合率低、)、嵌合率低、遗传稳定性好、易于操作等优点。遗传稳定性好、易于操作等优点。 目录目录2鸟枪法是大规模鸟枪法是大规模DNA测序的重要方法测序的重要方法 步骤:步骤: 建立高度随机、插入片段大小为建立高度随机、插入片段大小为1.6 kb到到4 kb左右的左右的基因组文库;基因组文库; 高效、大规模的克隆双向测序;高效、大规模的克隆双向测序; 序列组

28、装(序列组装(sequence assembly):借助软件将所测得):借助软件将所测得的序列进行组装,产生一定数量的相连重叠群;的序列进行组装,产生一定数量的相连重叠群; 缺口填补:利用引物延伸或其他方法对缺口填补:利用引物延伸或其他方法对BAC克隆中还克隆中还存在的缺口进行填补。存在的缺口进行填补。 3高通量测序技术大大加快了基因组高通量测序技术大大加快了基因组DNA测序进度测序进度 目录目录鸟枪法测序的原理与策略鸟枪法测序的原理与策略 目录目录(三)生物信息学是预测基因组结构和功能的(三)生物信息学是预测基因组结构和功能的重要手段重要手段 三大生物信息中心:三大生物信息中心: 美国国家生

29、物技术信息中心(美国国家生物技术信息中心(NCBI,)欧洲生物信息研究所(欧洲生物信息研究所(EBI,http:/ebi.ac.uk)日本日本DNA数据库(数据库(DDBJ,http:/www.ddbj.nig.ac.jp) GenBank(/Genbank)是)是NIH的基因序列数据库,包含所有已知的核苷酸及蛋白质序列、的基因序列数据库,包含所有已知的核苷酸及蛋白质序列、以及与之相关的生物学信息和参考文献,是世界上的权威序以及与之相关的生物学信息和参考文献,是世界上的权威序列数据库。列数据库。 目录目录三

30、、功能基因组学系统探讨基因三、功能基因组学系统探讨基因的活动规律的活动规律 功能基因组学的主要研究内容包括基因组的功能基因组学的主要研究内容包括基因组的表达、基因组功能注释、基因组表达调控网络及表达、基因组功能注释、基因组表达调控网络及机制的研究等。它从整体水平上研究一种组织或机制的研究等。它从整体水平上研究一种组织或细胞在同一时间或同一条件下所表达基因的种类、细胞在同一时间或同一条件下所表达基因的种类、数量、功能及在基因组中的定位,或同一细胞在数量、功能及在基因组中的定位,或同一细胞在不同状态下基因表达的差异。不同状态下基因表达的差异。 目录目录(一)通过全基因组扫描鉴定(一)通过全基因组扫

31、描鉴定DNA序列中的基因序列中的基因 (二)通过(二)通过BLAST等程序搜索同源基因等程序搜索同源基因 (三)通过实验设计验证基因功能(三)通过实验设计验证基因功能 (四)通过转录组和蛋白质组描述基因表达模式(四)通过转录组和蛋白质组描述基因表达模式 目录目录四、比较基因组学鉴别生物基因组间四、比较基因组学鉴别生物基因组间的相似性与差异性的相似性与差异性n在基因图谱和测序的基础上,通过与已知生物在基因图谱和测序的基础上,通过与已知生物基因组的比较,鉴别同源基因的相似性和差异基因组的比较,鉴别同源基因的相似性和差异性,为性,为预测新基因的功能预测新基因的功能和和阐明物种进化关系阐明物种进化关系提供依据。在医学上,比较基因组学可利用模提供依据。在医学上,比较基因组学可利用模式生物与人类基因组之间编码序列和结构的同式生物与人类基因组之间编码序列和结构的同源性,揭示基因功能,阐明疾病发生、发展的源性,揭示基因功能,阐明疾病发生、发展的分子机制。分子机制。目录目录五、ENCODE计划nHGP计划完成后,计划完成后,2003年年9月,美国启月,美

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论