结构生物学10_第1页
结构生物学10_第2页
结构生物学10_第3页
结构生物学10_第4页
结构生物学10_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、l人类基因组计划l后基因组时期新的研究领域l结构基因组计划“人类基因组计划”是人类自然科学史上最伟大的创举之一,它的规模可以与“曼哈顿”原子弹计划、“阿波罗”登月计划娘美,而它的意义又远超出了这两个计划。lhgp的由来lhgp的目标lhgp的主要内容lhgp的参与国与资金投入lhgp的进展和成就l人类基因组研究的应用l人类基因组研究引发的社会和伦理问题 l上世纪70年代的“基因论”是人类基因组计划的科学背景n所有的疾病都与人类的基因相关,都是人类基因组与病原基因组中有关基因相互作用的结果。n不仅疾病与基因有关,人的出生、成长都与基因有关,都与dna的序列有关。n著名的诺贝尔奖获得者杜伯克在他发

2、表的一篇文章,后来被称为“人类基因组计划”的“标书”之中写道:人类的dna序列是人类的真谛。这个世界上的发生的一切,都与之息息相关。l在策略上说,“人类基因组计划”所采取的策略是“基因组学”的策略n杜伯克说:既然大家都知道基因的重要性,那我们就只有两种选择,一是“零敲碎打”,大家都去“个体作业”,去研究自己“喜欢”的、认为是重要的基因,而另一种选择呢?则是前所未有的大胆说法:从整体上来搞清楚人类的整个基因组,集中力量认识人类的所有基因。l人类基因组计划的孕育,经历了长达5年的时间,这五年里,在发达国家里,上至政府首要,下至平民百姓,都参与了这一场讨论与最后的决策。而各国,首先是美国的科学家,作

3、了大量的论证。n1984年, 在美国尤他大学召开的专业会议上,一些科学家已开始讨论对人类基因组dna进行全序列分析的前景。n1985 年5 月,在美国加州组织了一次专门会议,美国能源部提出了测定人基因组全顺序的动议。n1986年,美国生物学家、诺贝尔奖获得者renato dulbecco 在“science”上发表短文首次提出人类基因组计划的设想,并建议组织国家级和国际级的项目来进行这方面的研究。n1986年3月,美国能源部在召开的一次专门会议上, 正式提出实施测定人类基因组全顺序的计划。n1988年4月,国际人类基因组组织(hugo)成立。n1988年10月美国能源部和美国国立卫生研究院达成

4、协议,共同管理和实施这一计划。n1990年,历经5年辩论之后,美国国会批准美国的“人类基因组计划”于10月1日正式启动。n随后法国、英国、意大利、德国、日本等也相继宣布开始各自的 研究。中国的人类基因组计划于1993年开始,1999年9月,中国正式参与国际人类基因组计划,负责测定人类基因组全部序列的1%。l人类基因组计划的目标是通过以美国为主的全球性的国际合作,在大约15年的时间里完成人类24条染色体的基因组作图和dna全长序列分析,进行基因的鉴定和功能分析,最终目标是确定人类基因组所携带的全部遗传信息。l人类基因组计划的“科学产品”将是一个人类遗传信息数据库,将是一本指导人类进化的“说明书”

5、。 l有人将hgp比作一张20世纪的生命(生物学)周期表,因为它一改经典分子生物学零敲碎打地研究个别基因的习惯,而力求在细胞水平上解决基因组的问题,同时研究10万个基因及其产物,以建立对生命现象的整体认识。l基因组作图l基因组测序 l基因的鉴定和分析l基因组研究相关技术建立l有关模式生物研究l生物信息系统建立 人类染色体不能直接用来进行测序,故hgp的第一阶段是要将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程简称为作图。l遗传图谱l物理图谱l遗传图谱(genetic map),又称连锁图(linkage map),是通过计算连锁的遗传标志之间的重组频率,确定它们的

6、相对距离,一般用厘摩(cm,即每次减数分裂的重组频率为1)来表示。l遗传图绘制需要应用多态性标志。如限制性酶切片段长度多态性(rflp),短串联重复序列(str, 又称微卫星,ms)标志,单核苷酸多态性(snp)标志等。l通过遗传图谱,我们可以大致了解各个基因或dna片断之间的相对距离与方向,如哪个基因更靠近着丝粒,那个更靠近端粒等。遗传图谱不仅是定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段。l物理图包含了两层意义,一是获得分布于整个基因组的序列标签位点(sts,其定义为染色体定位明确,而且可用pcr扩增的单拷贝序列),使每隔一定距离就

7、有一个标志;二是在此基础上构建覆盖每条染色体的大片段dna连续克隆系(contig)。 酵母人工染色体(yac,插入片段达数百kb至2mb)、细菌人工染色体(bac,插人片段为80一300kb)、p1噬菌体(插入片段最大为125kb)、pi来源的人工染色体(pac,插人片段可达300kb)l物理图构建的成功,不仅为大规模测序奠定了基础,而且还绘制出了人类基因组转录图(或基因图)的雏形。l人类基因组计划最终将测定出人类基因组的全部序列。这种序列测定不同于以往那种只对某一个特定的感兴趣的区域进行dna序列分析的工作。它要求一种更高效的规模测序,并将测出的每一个dna片段按其染色体位置进行准确的排列

8、, 从而得到人类基因组dna序列碱基排列的全貌。这是一个很艰巨的任务,需要开发更新的序列分析技术和计算机信息处理系统。这些新技术和新系统的开发与研制也将成为人类基因组计划的一个重要组成部分。l大规模测序的策略n基于bac连续克隆系的测序n全基因组的“鸟枪法”测序l基于bac连续克隆系的测序 通过精细物理作图,排出对应于特定染色体区域的重叠度最小的bac连续克隆系后,就可以对其中的bac逐个进行测序。这是由各国政府及非赢利机构所支持的公共领域测序计划在20世纪90年代中期所确定的策略。其基本工作步骤是:n将待测bac克隆随机切成小片段(约1.52kb);n将小片段克隆入测序载体;n对小片段dna

9、进行810倍左右覆盖率的测序;n将相互重叠的读出序列组装成连续的重叠线;n从质量最高的读出序列中取得序列;n利用引物延伸或其他方法对bac克隆中还存在的缝隙进行填补。l全基因组的“鸟枪法”测序这是一个十分大胆的构思,即在获得一定的遗传和物理图信息的基础上,绕过bac克隆逐个排序的过程,直接将基因组dna分解成2kb左右的小片段进行随机测序,辅之以一定数量的10kb克隆和bac克隆的末端测序,利用超级计算机进行序列组装。由craig venter领导的私营研究所tigr于1995年首先将这一策略应用于微生物基因组的测序并获得成功。l序列的精度标准n工作框架图:45倍的覆盖率,错误率低于1%,90

10、%以上的序列n完成图:1012倍的覆盖率,错误率低于1/10000,没有缺口l基因组中间的某些部分,主要是着丝粒区域和端粒区,因存在大量高度重复序列而非常不稳定,是目前还难以克隆的部分。因此基因组的最后完成序列并不包括这部分的序列。genomic dna- 3 billion bp- 23 pairs of chromo., 30 - 300 m bp eacut into big pieces - 150-200k bp (bac) - 0.1-1.5 m bp (yac)clone pieces into bacteria or yeast:each is a bacterial arti

11、ficial chromosomeneed 20,000 bacs to represent human genomeisolate dna fromhuman tissuegrow indiv.clonesisolate plasmid dnacontaining human baccut into smaller pieces2,000 bpsub-clone each pieceinto sequencing vectorgrow upand isolate dnafor sequencingsequence each sub-clone(500-800 bp/ sequencing r

12、un)acttagtacgcagaggtcrepeat the process for each sub-clone, and each bac/yac clone, but cut in different places to generate overlapping pieces:intact bac/yac (human dna)cut & sequence 1cut & sequence 2assemble the parts, using overlap to create contigs53l确定每一个基因,研究它的结构、特性和功能是人类基因组计划的又一个重要内容。 通过对人类基因

13、组全部dna序列的测定, 可以利用计算机找出分布在dna两条互补链上所有可能编码蛋白质的基因。其中有一部分是人类已了解的基因,但更多的是我们尚不完全了解的“基因框架”,我们称这些结构为可译框(orf)。在dna结构特征上orf含有翻译的起始密码子、外显子及内含子的剪接信号、翻译终止信号和3poly(a)加尾信号。根据中心法则,人们可以预测某种orf编码的蛋白质的氨基酸序列,甚至这个蛋白质的空间结构及功能。应该指出的是,人类要真正破译所有的orf的功能及其生物学意义还需要相当长的时间。目前的人类基因组研究只是为实现这一最终目标提供最基本的素材-dna 序列以及基因的结构特征。 l人类基因组计划的

14、庞大规模需要建立与之相适应的大规模、高通量的相关技术,如高通量的自动测序技术,数据质量评估和组装的软件系统,为了将作图、测序和信息学技术形成高度自动化的大规模生产线并进行全过程的质量监控而研制的实验室信息管理系统等。lhgp除了人类基因组的作图、测序之外,还包括对一批模式生物体的基因组研究,如:大肠杆菌、面包酵母、线虫、果蝇、拟南芥菜、小鼠等。低等模式生物的基因组结构相对较简单,对其进行全基因组作图测序,可为人类基因组研究进行技术探索和积累经验。更重要的是,这些研究有助于在基因组水平认识进化规律,以及利用模式生物的转基因和基因敲除术来研究基因的功能,可谓一石多鸟。l随着遗传和物理图谱的进一步完

15、善,测序技术的进一步改进及成本下降,对其他各种模式生物体,尤其是基因组很大的哺乳类动物和植物基因组的测序将会不断展开。l作图和测序计划进行中会产生大量数据。这些数据只有被有效地收集、储存和分析,并对全世界的研究人员开放,才有价值。为此,需设立收集及分发作图和测序数据的信息中心,并建立信息的储存、检索和分析的计算机软件系统。l迄今,国际上3个大的生物信息中心即美国的国家生物技术信息中心(ncbi)、欧洲生物信息学研究所(ebi)利日本dna数据库(ddbj)已经建立和维持了源自数百种生物的dna序列的大型数据库。l目前已建立各种不同的序列信息分析系统,包括基因的识别,蛋白质模体的鉴定,调控元件的

16、分析,重复序列的鉴别,相似性的分析,核苷酸组成的分析以及物种间的比较等。lhgp是一个全球性的合作项目,共有6个国家直接参与了这一计划,包括美国、英国、法国、德国、日本和中国,其中美国承担了大部分的工作。lhgp是一项高投入的计划。美国预期投入的研究经费高达30亿美元。据报导,个美国出租车司机曾形象地说:“人类基因组计划就是一个美元测一个碱基对。”l到2003年4月完成人类基因组序列图时,hgp共耗资27亿美元,比原先预计的有明显节省。l2000年6月26日,中、美、日、德、法、英等6国科学家联合宣布,首次绘成人类基因组“工作框架图”。l2001年2月12日,六国科学家联合在学术期刊上发表人类

17、基因组“工作框架图”及初步分析结果。l2001年8月26日,人类基因组“中国卷”的绘制工作宣告完成。l2003年4月14日,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。已完成的序列图覆盖人类基因组所含基因区域的99,精确率达到99.99,这一进度比原计划提前两年多。l对大肠杆菌、酵母、线虫、果蝇的基因组计划都已经完成,小鼠的基因组计划也已接近完成。l初步分析发现鼠与人的基因组存在着很高的相似性。鼠基因组共有约27亿个碱基对,比人类少15,但其包含的基因数目约在3万个左右,与对人类基因数的最新估计非常接近。分析还显示,鼠基因组中可能也存在与人

18、类基因组中类似的由重复序列组成的“垃圾dna”。l根据2001年2月15日和l 6日在nature和science上发表的资料,人类基因组的大小将是3.2109 bp,人类基因数目大约为30000-40000个;发生转录的区域占28,在成熟mrna中的编码序列占1.4;重复序列占54;估计每个基因产生3种以上编码蛋白变异体的转录本,共识别了1278个蛋白家族其中仅94个(7.4)是脊椎动物所特有。l在医学领域的应用n对特殊疾病基因的确定n有利于优生和产前诊断n加强对癌症的认识和治疗 n有利于医学生物学的研究l确定人类基因组中的转座子(transposon)、逆座子(retroposon)和病毒

19、残余序列的分布,了解有关病毒基因组侵染人类基因组的情况, 可指导人类有效地利用病毒载体进行基因治疗.l对染色体和个体之间的多样性的研究结果可被广泛用于基因诊断、个别识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究中.l研究dna的突变、重排和染色体断裂等, 了解疾病的分子机制, 包括遗传性疾病、易感性疾病、放射性疾病和感染性疾病引发的分子病理学改变及其进程, 为这些疾病的预后以及分子水平上的诊断、预防和治疗提供依据。l在基础理论研究方面的应用 n确定人类基因组中基因的序列、组织和物理位置,有利于研究基因的功能以及它们相互之间在表达和调控机制方面的联系。n了解转录和剪接调控元件的

20、结构与位置,有助于从整个基因组结构的宏观水平上理解基因转录与转录后的调控。n从整体上了解染色体结构,包括各种重复序列以及非转录“框架序列”的大小。了解各种重复序列和非转录序列在染色体结构、dna复制、基因转录和表达调控中的影响和作用。n研究空间结构对基因调控的作用。有些基因表达的调控序列与被调控基因从直线距离上看,似乎相距较远,但若从整个染色体的空间结构上看则恰恰处于最佳的调控位置。因此有必要从三维空间的角度来研究真核基因的调控。n研究正常基因与突变基因的差别,会帮助阐明与正常的生理学和疾病发生都有关的新的生化和细胞学机制。尽快地确定出疾病基因,能使研究者对该基因的蛋白产物及其细胞生物学效应进

21、行深入的研究。n有利于确立有重要功能意义的基因组结构的特征。 人类染色体含有许多不是基因的片段, 一些特定片段对细胞分裂前染色体复制和确保染色体组正确地分配到两个子细胞中是不可缺少的。 这些片段的性质及行使功能的机制鲜为人知,人类基因组的物理图谱将为探讨这些特定片段性质及作用的实验打下基础。n发现新的基因和蛋白质。迄今仅有少数参与正常和疾病的人类基因被确定。对人类基因组作图和测序将会确定出大量新的人类基因及其编码的蛋白质。另外,物理图谱将有助于对那些已大体定位在染色体上,但尚未分离出的基因进行精确定位。l在生物学研究领域的应用n生物进化研究 人类基因组记载着人类的进化史。如果知道了人和其它生物基因组的全序列,就有可能追溯出人类基因的起源。 n分子考古研究真核生物基因组中,编码序列仅占一小部分,而绝大部分的序列是非编码序列。有人推测,若能识别出退化的重复系列,则有可能50的人基因组和50以上的鼠基因组是由重复序列组成的。由于重复序列出现和持续的年代可由种系之间的比较来确定,它们可作为一种很有价值的时间标志,用于分子考古学的有关复杂基因位点的研究。 l基因组计划的进行将迫使人类对许多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论