人类基因组计划与生物信息学_第1页
人类基因组计划与生物信息学_第2页
人类基因组计划与生物信息学_第3页
人类基因组计划与生物信息学_第4页
人类基因组计划与生物信息学_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 基因组 (genome) 是指细胞或生物体的整套DNA,对于细菌和噬菌体及动植物病毒而言,它们的基因组是指单个染色体上所含的全部DNA,而二倍体及多倍体真核生物的基因组是指维持单倍体最基本的一套染色体DNA。 人的基因组分为细胞核内的人的基因组分为细胞核内的核基因组核基因组和线粒体的和线粒体的线线粒体基因组粒体基因组。人的线粒体基因组人的线粒体基因组DNADNA全长全长16569bp16569bp,为环形分子。,为环形分子。线粒体的变异与癫痫、感觉神经性耳聋、致死性新生儿线粒体的变异与癫痫、感觉神经性耳聋、致死性新生儿肌病、非胰岛素依赖性糖尿病等疾病有关。肌病、非胰岛素依赖性糖尿病等疾病有关

2、。 通常所说的基因组研究主要是指核基因组研究,人通常所说的基因组研究主要是指核基因组研究,人的基因组由的基因组由2222条常染色体加上条常染色体加上X X、Y Y性染色体的性染色体的DNADNA组成,组成,大小约为大小约为2.9-3.2Gb2.9-3.2Gb (Gb (Gb,gigabase pairgigabase pair,十亿碱基,十亿碱基对对) )。 * *人的体细胞除了成熟的红细胞以外,都具有一套完人的体细胞除了成熟的红细胞以外,都具有一套完整的基因组整的基因组DNADNA。 1985 1985年,年,Robert SinsheimerRobert Sinsheimer在在加利福利亚

3、大学加利福利亚大学Santa CruzSanta Cruz分校主分校主持会议,第一次系统讨论人类基因持会议,第一次系统讨论人类基因组的测序问题,同年美国能源部的组的测序问题,同年美国能源部的Charles DeLisiCharles DeLisi和和David A. SmithDavid A. Smith提出一项生物学研究中史无前例的提出一项生物学研究中史无前例的庞大计划庞大计划测定人类基因组的全测定人类基因组的全序列。序列。19861986年年Dulbecco Dulbecco 在在ScienceScience杂志上发表文章,提出要从整体上杂志上发表文章,提出要从整体上研究和分析人类基因组,

4、解读人类研究和分析人类基因组,解读人类基因组的全部序列。基因组的全部序列。 1987 1987年,美国能源部与美国国立卫生研究院开始为人类年,美国能源部与美国国立卫生研究院开始为人类基因组计划拨出部分经费,基因组计划拨出部分经费,19881988年年DNADNA双螺旋结构发现者之双螺旋结构发现者之一沃森任是年成立的一沃森任是年成立的“国家人类基因组研究办公室国家人类基因组研究办公室”的首任的首任主任,国家人类基因组办公室于主任,国家人类基因组办公室于19891989年升级成为国家人类基年升级成为国家人类基因组研究中心因组研究中心(NCHGR, National Center of Human

5、Genome (NCHGR, National Center of Human Genome Research)Research)。 美国于美国于19901990年年1010月月1 1日正式启日正式启动了美国的人类基因组计划,当动了美国的人类基因组计划,当时美国计划在未来的时美国计划在未来的1515年内由政年内由政府投资共府投资共3030亿美元支持该项目的亿美元支持该项目的研究,计划在随后的研究,计划在随后的1515年时间内年时间内完成。完成。 1998 1998年年4 4月杨焕明、于军落户中月杨焕明、于军落户中科院遗传所,提出开展大规模基因科院遗传所,提出开展大规模基因组测序的建议。组测序的

6、建议。 19981998年年8 8月中科院遗传所人类基月中科院遗传所人类基因组中心正式挂牌成立。宣布了开因组中心正式挂牌成立。宣布了开展大规模测序和建设相关技术平台展大规模测序和建设相关技术平台的中心发展计划。的中心发展计划。 19991999年年2 2月开始大规模基因组测月开始大规模基因组测序技术平台建设。序技术平台建设。7 7月,北京华大月,北京华大基因研究中心诞生。基因研究中心诞生。 20002000年年4 4月,月,1%1%基因组序列工作基因组序列工作框架图完成。框架图完成。 该中心拥有各类测序仪该中心拥有各类测序仪8080余台,余台,曙光曙光30003000超千亿次计算机超千亿次计算

7、机2 2台,具台,具有每日测定、分析有每日测定、分析50005000万碱基的能万碱基的能力,在国际人类基因组十六个测序力,在国际人类基因组十六个测序中心中排名第十。中心中排名第十。1、遗传图谱 ( Genetics map ) 2、物理图谱 ( Physical map ) 几种多态标记:(1)RFLPs(2)STR(3)SNPs 第一代遗传图谱标记是DNA限制性片段长度多态性标记 RFLP(restriction fragment length polymorphism)。 限制性内切酶可在特定的核苷酸位置切割DNA。DNA序列的改变甚至是一个碱基的改变,都可能改变限制性内切酶酶切片段的长度

8、,通过凝胶电泳可以方便地检测这种长度的“多态性”。RFLP在整个基因组中都存在,根据对RFLP片段的多态性分析,可对某些疾病进行诊断并将与疾病有关的基因进行定位,但RFLP提供的信息量相对较少。 物理图谱(physical map)是指一套经过排序的覆盖整个基因组的DNA克隆,这些克隆之间存在重叠,形成连续的排列,称作重叠群(contig),用来指示这些克隆之间的重叠及距离的参照物称作标记(marker), 如限制性内切酶的酶切位点、基因、STSs、ESTs等,标记间的距离以物理长度为单位(如染色体显带技术显示的区带、核苷酸的数目等)。2 2、物理图谱物理图谱(physical mapphys

9、ical map) STS的概念最早于1989年由Olson等提出,以寻找人类基因组中的标记,并提出以STSs作为不同物理图谱之间的通用语言。 简单地说,STS是长约200-300bp的单拷贝DNA片段,每个STS的序列在基因组中应该是唯一的,不能在其他地方存在重复,如果两个或两个以上的克隆含有同样的STSs,那么这些克隆必然重叠,而且重叠部分必然包含了这些STSs位点。 任何一个序列被测定的克隆,只要其中含有一个单拷贝序列,就可以作为STSs。 在含有大量重复片段的生物基因组中寻找足够数量的STSs工作量很大。Venter等于1991年建议采用ESTs作图方法, 它的原理是基于经过剪接的mR

10、NA很少含有重复序列这一现象。cDNA的部分序列ESTs就可以作为STSs,同时ESTs比常规的STSs更有优点,即其位点与人的表达基因直接相关,因而有利于基因克隆研究。 序列图是人类基因组在分子水平上最高层次、最为详尽的物理图。人基因组DNA连接起来总长度可达1米,测定基因组全序列是基因组计划中最明确、最艰巨的任务。 目前在测序工作中仍主要采用Sanger发明的“双脱氧核糖核酸链末端终止法”进行测定。 其基本原理是:测序时以一条链为模板,在一条测序引物的引导下,会产生新的DNA链并不断延伸。在体系中加入一定比例的双脱氧核糖核酸,一旦这些双脱氧核糖核酸被加在链的末端,则该链就停止延伸,最终随机

11、产生许多大小不等的末端为脱氧核糖核酸的DNA片段,这些片段在大小上相差一个碱基,可通过聚丙烯酰胺凝胶电泳加以分离并读取其序列。 1985 1985年年1212月,哈佛大学的月,哈佛大学的Maxam AMaxam A和和Smith LSmith L共同发共同发明了第一台明了第一台DNADNA自动测序仪。自动测序仪。19871987年年1010月,杜邦公司将荧光月,杜邦公司将荧光链终止双脱氧技术引入到链终止双脱氧技术引入到DNADNA快速测序中,同年,快速测序中,同年,Applied Applied BiosystemBiosystem公司在市场上推出了第一台自动测序仪。公司在市场上推出了第一台自

12、动测序仪。经过发经过发展,展,DNA测序分析方法已发展到采用荧光标记和自动化操测序分析方法已发展到采用荧光标记和自动化操作,如作,如ABI公司的公司的377型测序仪和型测序仪和Pharmacia LKB公司的全公司的全自动自动DNA分析仪,每小时可读序分析仪,每小时可读序500-600 bp,美国斯坦福,美国斯坦福DNA测序和技术开发中心使用的高效毛细管测序仪每天可测序和技术开发中心使用的高效毛细管测序仪每天可分析分析1Mb的序列,如果该仪器实现完全自动化,每天的测的序列,如果该仪器实现完全自动化,每天的测序速度将达到序速度将达到5 Mb,同时测序成本也大幅下降。到,同时测序成本也大幅下降。到

13、2000年年6月,各测序中心的总测序能力已使他们可在月,各测序中心的总测序能力已使他们可在6周内完成相周内完成相当于测一次人基因组序列那么大的任务。当于测一次人基因组序列那么大的任务。 尽管采用自动化测序方法可大大提高测序效率,但由于测序技术本身的局限性(每次反应只能测定数百bp的序列),因此必须在基因组测序中采用适当的测序策略。 目前进行全基因组测序主要有两种策略: 全基因组鸟枪法(whole genome shotgun) BAC连续克隆系的测序方法(hierarchical shotgun sequencing) 2001年年2月月12日,美国塞莱拉公司日,美国塞莱拉公司(Celera

14、Genomics)及国际人类基因组测序协作组及国际人类基因组测序协作组IHGSC联联合宣布覆盖人类基因组合宣布覆盖人类基因组90的工作框架图问世,并的工作框架图问世,并分别在分别在Science和和Nature杂志上公布了人类基因组杂志上公布了人类基因组精细的工作框架图及其初步的注解精细的工作框架图及其初步的注解(annotation)结结果,两个组织采用不同的测序策略;获得了较为一果,两个组织采用不同的测序策略;获得了较为一致的结果。致的结果。 2003年4月15日,为纪念DNA双螺旋结构发现50周年,美、英、日、法、德和中国等六国联合宣布人类基因组计划提前完成。 政府或非盈利机构支持参加人

15、类基因组测序的研究机构及测序的相对工作量 染色体 基因 碱基染色体 基因 碱基染色体 基因 碱基1 2968 2791 2968 2792 2288 2512 2288 2513 2032 2213 2032 2214 1297 1974 1297 1975 1643 1985 1643 1986 1963 1766 1963 1767 1443 1637 1443 1638 1127 1488 1127 148 9 1299 140 9 1299 140 10 1440 143 10 1440 143 11 2093 148 11 2093 148 12 1652 142 12 1652 1

16、42 13 748 118 13 748 118 14 1098 107 14 1098 107 15 1122 100 15 1122 100 16 1098 104 16 1098 10417 1576 88 17 1576 88 18 766 86 18 766 86 19 1454 72 19 1454 72 20 927 6620 927 6621 303 45 21 303 45 22 288 48 22 288 48 X 1184 163X 1184 163Y 231 51Y 231 51碱基数单位:Mb(Mb,megabasepair) 总计:约3.2万个 约3.2Gb 从从1

17、9991999年开始中国科学家在人类基因组测序中承担并完成了年开始中国科学家在人类基因组测序中承担并完成了3 3号染色体短臂端粒号染色体短臂端粒到到D3S3610D3S3610的测序任务的测序任务 人的人的26 383个基因编码蛋白的分类个基因编码蛋白的分类 人的26383个基因编码蛋白的分类。GO分类法是基因命名工作组采用的基因分类方法,Panther分类法是塞莱拉公司采用的基因分类方法。 信息与人类认识物质世界和自身成长的历史息息相关。 漫长的人类历史发展进化,不断积累的科学技术实践过程中,信息一开始都是表现为真伪难辨的消息群,物质世界的内部规律对于人类来说,需要借助五官和思维以及识别监测技术手段,并且这些技术要不断的与时俱进,动态发展才能获得; 人类社会之所以如此丰富多彩,都是因为信息和信息技术一直持续进步的必然结果。“现代信息技术”是研究信息的获取、传输和处理的技术,由计算机技术、通信技术、微电子技术结合而成。AUTHORSTIT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论