基因组学11课件_第1页
基因组学11课件_第2页
基因组学11课件_第3页
基因组学11课件_第4页
基因组学11课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11 基因组与比较基因组学第一节 基因组概述一、定义基因组(genome),又称染色体组一个物种单倍体的染色体数目,物种全部遗传信息的总和物种遗传信息的“总词典”控制发育的“总程序”生物进化历史的“总档案”原核生物基因组:原核生物DNA分布在整个细胞之中,有时相对集中在类核体上。类核体上的DNA是一条共价、闭合双链分子,类核体通常也称为染色体。这条染色体的DNA就是原核细胞的基因组。真核生物基因组:一个物种的单倍体的各条染色体中的全部DNA为该物种的基因组(genome)。例如,人有23对染色体,配子单倍体是23条染色体,这23条染色体中的全部DNA就是人体基因组。相关定义:转录组(trans

2、criptome ):一个细胞、组织或生物体的全部RNA的集合,转录组包括编码RNA和非编码RNA.蛋白组(proteome ):指由整个基因组编码的一组完整的蛋白质。有时候也用于描述特定的细胞或组织产生的一组蛋白质.结构基因组学(structural genomics):研究基因组的结构并构建高分辨的遗传图、物理图、序列图和转录图以及研究蛋白质组成与结构的学科。功能基因组学(functional genomics):即后基因组学,指利用结构基因组学研究所得到的各种遗传信息在基因组水平上研究编码序列及非编码序列生物学功能的学科。蛋白质组学(proteomics)鉴定蛋白质的产生过程、结构、功能

3、和相互作用方式CREDIT: JOE SUTLIFF Science, Vol 291: 1221.Fishing in a More Effective Way!C值:一个物种单倍体基因组的DNA含量。 一个物种DNA的C值是相对恒定的。从原核生物到真核生物,其基因组大小和DNA含量是随生物进化复杂程度的增加而稳步上升。二、基因组的大小物种C值范围显花植物鸟类哺乳类爬行类两栖类骨鱼类软骨鱼类棘皮类甲壳类昆虫类软体类蠕虫类霉菌类藻类真菌类革兰氏阳性菌革兰氏阴性菌枝原体碱基对数10610710810910101011不同类生物的C值分布三、基因组中基因的归类1、从进化的角度:人类基因组中原核生物

4、和真核生物共有的基因约为21,与生命基本功能相关真核生物特有的基因约为32,编码的蛋白质参与真核细胞中原核细胞不存在的功能,如和细胞器或细胞骨架相关动物特有的基因为24,这些基因对多细胞分化和不同组织类型发育是必需的脊椎动物特有的基因占22,通常编码免疫系统和神经系统的蛋白质2、根据真核生物共有蛋白质组的功能转录和翻译相关,约占35代谢相关,约占22转运相关,约占12DNA复制和修饰相关,约占10蛋白质折叠和降解相关,约占8细胞周期相关,约占64、根据基因的表达量:高丰度mRNA(abundant mRNA ), 由少于100种的不同mRNA组成,每个细胞中有1 00010 000个拷贝,通常

5、占mRNA总量的大部分,达到50稀有mRNA(scarce mRNA ),或称为复杂mRNA(complex mRNA ),组成了大部分不同的mRNA,约为上万种,每种mRNA分子的量通常少于10个四、基因组中其它序列的分布desert:长度超过500kb不含基因的序列区约20的人类基因组区域由没有基因的“沙漠”序列组成。重复序列:重复序列占人类基因组的50以上转座子占基因组的45,所有的转座子都是多拷贝的。加工后假基因(mRNA序列的一个拷贝插入到基因组形成的),总共约3000条,占总DNA序列的的0.1简单重复序列约占基因组的3简单重复序列:(Simple sequence repeats

6、 )又称微卫星DNA(Micro-satelliteDNA)或短串联重复(ShortTandemRepeats)串联重复序列:主要位于端粒和着丝粒区域片段复制序列约占基因组的5片段重复序列(Segmental duplications ):长10300kb的DNA片段复制一个拷贝到新的区域不同物种中不同类别序列所占的比例单拷贝序列中度重复序列高度重复序列1、单拷贝序列在一个基因组中只有1个拷贝或23个拷贝;不同生物基因组中单拷贝序列所占的比例是不同的;原核生物中只含有单拷贝序列。人类基因组中的单拷贝序列小于50%随着基因组大小的增加,单拷贝序列的长度也增加;两栖类和植物基因组C值的增加并非是单

7、拷贝序列的增加,而是重复序列DNA比例的增加; 由此可见,非重复DNA含量与生物的进化程度是一致的2、中度重复序列重复单位平均长度约300bp,重复次数10-105次;不同种属之间比例差异很大,一般约占10-40;在人约为12,大多不编码蛋白质;依据重复顺序的长度,中度重复顺序可分为两种类型: (1)短分散组分 (2)长分散组分(1)短分散组分(short interspersed nucleotide elements, SINES)平均长度约为300bp,拷贝数可达10万左右;与平均长度约为1000bp的单拷贝顺序间隔排列; 例如: 人珠蛋白基因含有8个功能基因和3个假基因 Alu家族、H

8、inf家族3、高度重复序列重复单位平均长度约6-200bp,重复次数为106以上 (1) 卫星DNA:真核细胞染色体具有的高度重复核苷酸序列的DNA。总量可占全部DNA的10%以上,主要存在于染色体的着丝粒区域,通常不被转录。因其碱基组成中GC含量少,具有不同的浮力密度,在氯化铯密度梯度离心后呈现与大多数DNA有差别的“卫星”带而得名。 注意:并非所有的高度重复DNA都能形成卫星DNA哺乳动物卫星序列一般由许多分级的重复序列单位形成如小鼠卫星DNA用Eco R II酶切,产生一个234 bp的单体片段,该片段几乎无变异重复,占卫星序列总长度的6070 234 bp片段的1/2重复序列单位:前1

9、17bp和后117bp对应排列,非常相似,只有22个位点不同卫星DNA的分布:着丝粒、端粒和Y染色体长臂的异染色质区。 与基因表达调控,同源染色体之间的配对与重组,染色体结构稳定性的维持,RNA前体的加工等过程有关。 (2) 可变数目串联重复序列(variable number tandem repeat, VNTR)或短串联重复序列(short tandem repeat, STR): 小卫星( minisatellite):重复单位为10-100 bp 微卫星 (microsatellite):重复单位小于10 bp,通常 重复10-60次CTAGCTTATATATATATATATATAT

10、ATATAAGCTTGC小卫星DNA可用于遗传作图小卫星序列中发生遗传交换的频率很高,为10-4每kb DNA, 是减数分裂中同源重组频率,即卫星序列间重组频率的10倍亲子鉴定:父母含不同长度的小卫星等位片段每一个子代都以常规方式从亲本一方得到一条等位片段小卫星DNA序列的高度变异性,使每个个体都形成独特的带型,而子代有50的条带一方来自于特定的亲本Nothing would be more specific and reliable than DNA for individual identification.Individual Identification 基因家族(gene famil

11、y): 真核生物基因组中有许多来源相同、结构相似、功能相关的基因,这样的一组基因称为基因家族。五、基因家族 例如:组蛋白基因家族、珠蛋白基因家族、免疫 球蛋白基因家族等Alu家族是哺乳动物基因组中含量最丰富的一种中度重复序列家族,在人基因组中重复达30万-50万次,约3-6;Alu家族每个成员的长度约300bp,由于每个单位长度中有一个限制性内切酶AluI的切点(AGCT),从而将其切成长130和170bp的两段,因而定名为Alu家族;Alu序列分散在整个基因组中;少数成簇分布Alu序列具有种属的特异性(一)、Alu家族1. Alu序列特征正向重复序列170bp130bp+31bp130bp正

12、向重复序列正向重复序列正向重复序列6-20 bp6-20 bp130bp由两个约130bp的正向重复构成的二聚体;第二个单体中有一个31bp的插入序列,不同成员之间核苷酸顺序相似但不相同;两侧为6-20bp的正向重复顺序,不同成员的侧翼重复顺序各不相同;人类Alu序列特征:AluI可能参与hnRNA的加工与成熟;可能与遗传重组及染色体稳定性有关;Alu序列中的某些区段有形成Z-DNA的能力;可能具有转录调节作用;某些Alu序列可能具有癌基因的转化抑制作用;2.Alu家族的功能:(二)、Kpn家族 Kpn家族是中度重复序列中仅次于Alu家族的第二大家族。用限制性内切酶Kpn消化人类及其它灵长类动

13、物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2、1.5、1.8和1.9kb,这就是所谓的Kpn家族 Kpn家族的拷贝数约为3000-4800个,占人体基因组的1 以319bp长度的串联重复存在于人体基因组中; 用内切酶Hinf消化人体DNA,可以分离到这一片段; 约有50-100个拷贝,分散在不同的区域; 319bp单位可以再分成两个亚单位,分别为172bp和 147bp,它们之间有70%的同源性;(三)、Hinf家族 基本单位是dd双核苷酸,多个dd双核苷酸串联 重复在一起,分散于人体基因组中; 人基因组中dd交替顺序平均长度40bp,达105拷贝; (四)、多聚dd家族六、

14、细胞器基因组细胞器基因组的基本特征:绝大多数细胞器基因组是单链环状DNA分子,在线粒体在被称为线粒体DNA(mtDNA),叶绿体中被称为叶绿体DNA(ctDNA)在低等真核生物中,线粒体DNA是线性的叶绿体基因组相对较大,高等植物中通常为140kb哺乳动物线粒体基因组约为16.5kb;植物线粒体基因组大小差异较大,但最小也有100kb线粒体基因组含编码蛋白质.rRNA和tRNA的基因2、线粒体DNA的结构:人类线粒体DNA含22条tRNA基因、2条rRNA基因和13条蛋白质编码基因14条基因顺时针方向表达,8条逆时针方向表达哺乳动物线粒体基因的排列非常紧凑,没有内含子,并且部分基因重叠D环,一

15、个和DNA复制起始有关的区域七、基因簇和假基因 基因簇(gene cluster):具有某种相似特征并且紧密连锁成簇状分布在染色体某一区域的基因群;假基因(pseudogene):在多基因家族中,某些成员并不产生有功能的基因产物,但在结构和DNA序列上与有功能的基因具有相似性; 16pterp1211p15假基因特征:1. 缺少转录识别位点(非洲爪蟾5SrRNA基因)2. 缺少内含子(珠蛋白家族假基因)3. 发生突变人类基因组特征:约含有30亿个碱基对,有功能的占10%;各种重复序列的比例高达50%以上;编码序列只占2%,约编码3万个基因。但60%的基因在表达时发生可变剪接,蛋白质组的组成可达

16、5-6万个;每条染色体含碱基8千万至3亿不等。第二节 人类基因组计划20世纪人类科技发展史上的三大创举 90年代人类基因组计划40年代第一颗原子弹爆炸60年代人类首次登上月球人类基因组计划的启动1986 年诺贝尔奖获得者R.Dulbecco(杜尔贝科)提出人类基因组计划美国政府决定于 1990年正式启动HGP,预计用 15 年时间,投入 30 亿美元,完成 HGP。 HGP逐渐扩展为多国协作计划。参与者包括:美、英、日、法、德和中国(1993年)1996,完成标记密度为0.6cM的人类基因组遗传图谱,100kb的物理图谱2000,完成草图2001年2月,公布人类基因组图谱的修订版2002,完成

17、测序工作二000年六月二十六日克林顿宣布人类基因组草图绘制完成美国国家人类基因组研究所所长弗朗西斯柯林斯在介绍情况。人类基因组草图基本信息由31.65亿bp组成含33.5万基因与蛋白质合成有关 的基因占2%人类基因组人类蛋白质61%与果蝇同源43%与线虫同源46%与酵母同源同时发表论文 美国 Science, Vol. 291, No. 5507 英国Nature , Vol.409, p.8602001 年2月16日,人类基因组“精细图”完成,(99%) 年月日,人类基因组序列图亦称“完成图”(99.99%),提前绘制成功。 DAN测序胶图人类基因组计划的科学意义(1)确定人类基因组中约3万个编码基因的序列及其在基因组中的物理位置,利于研究基因的产物及其功能。(2)了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。(4)研究空间结构对基因调节的作用。(3)从整体上了解染色体结构,包括各种重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论