博士授课人类基因组计划_第1页
博士授课人类基因组计划_第2页
博士授课人类基因组计划_第3页
博士授课人类基因组计划_第4页
博士授课人类基因组计划_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博士授课人类基因组计划第1页/共75页人类基因组计划──

二十世纪三大技术之一《Science》2000年十大科技成就之首第2页/共75页现代遗传学家认为,基因是DNA(脱氧核糖核酸)分子上具有遗传效应的特定核苷酸序列的总称,是具有遗传效应的DNA分子片段。不同人种之间头发、肤色、眼睛、鼻子等不同,是基因差异所致。

基因位于染色体上,并在染色体上呈线性排列。基因不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达。第3页/共75页人体有100万个亿细胞每个细胞核内有23对染色体约31亿对核苷酸,编码约10万个蛋白质人类只有一个基因组,大约有2.9万个基因。第4页/共75页Genomeisthecompletesetofsequencesinthegenetic-materialofanorganism.ItincludesthesequenceofeachchromosomeplusanyDNAinorganelles.Proteomeisthetotalnumberofproteinsproducedbyanorganism.TranscriptomeisthecompletesetofmRNAspresentinacell,tissue,ororganism.第5页/共75页基因组,Genome,一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。可是基因组测序的结果发现基因编码序列只占整个基因组序列的很小一部分。因此,基因组应该指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。说的更确切些,核基因组是单倍体细胞核内的全部DNA分子;线粒体基因组则是一个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。第6页/共75页2009年诺奖获得者:端粒酶保护染色体:第7页/共75页一、Humangenomeproject,HGPGoal:characterizeallhumangeneticmaterialbydeterminingthecompletesequenceoftheDNAinthehumangenome.HGPisaccomplishedby

thejointeffortbetweenU.S.HumanGenomeProject(HGP),composedofthe

DOE(DepartmentofEnergy)and

NIH(NationalInstitutesofHealth),and

CeleraGenomics第8页/共75页CraigVenter(headofCeleraGenomics),AriPatrinos(directorofDOEHumanGenomeProgramandBiologicalandEnvironmentalResearchProgram),FrancisCollins(director,NIHNationalHumanGenomeResearchInstitute)第9页/共75页OnFeb16th2001…Whathappened?2001年2月中旬,《Nature》与《Science》分别发表了人类基因组工作框架图(thedraftgenome),这是人类基因组计划(humangenomeproject,HGP)实施以来所取得的最重大进展,也是生命科学领域中的一个里程碑。自HGP提出以来,到现在一共16年。这16年来科学家们所走过的是一条充满艰辛的路,同时也是一条谱写辉煌的路。回顾这段将在人类历史上永载史册的光辉历程,相信对每一位科学殿堂里的探索者都会大有启迪。我们应该记住他们,记住他们所作出的成就。第10页/共75页第11页/共75页J.CraigVenter是一位在人类基因组计划实施中贡献最大的科学家之一,他曾反对基因专利化,1998年,他和Perkin-Elmer公司联合组建了的CeleraGenomics公司,Celera的商业计划是快速完成人类基因组测序,以及将信息调入一个复杂的遗传及医用信息库,并以订阅的方式销售给制药及生物技术公司,本文正是他们公司的成果,发表在《Science》上。第12页/共75页JohnCraigVenter(bornOctober14,1946)isanAmerican

biologistandentrepreneur,mostfamousforhisroleinbeingoneofthefirsttosequencethehumangenome[1]andforhisroleincreatingthefirstcellwithasyntheticgenomein2010.[2][3]VenterfoundedCeleraGenomics,TheInstituteforGenomicResearchandtheJ.CraigVenterInstitute,nowworkingatthelattertocreatesyntheticbiologicalorganismsandtodocumentgeneticdiversityintheworld'soceans.HewaslistedonTimemagazine's2007and2008Time100listofthemostinfluentialpeopleintheworld.In2010,TheBritishMagazineNewStatesmanListedCraigVenterat14thinthelistof"TheWorld's50MostInfluentialFigures2010".第13页/共75页1953NewDiscovery(April)JamesWatsonandFrancisCrickdiscoverthedoublehelicalstructureofDNA(Nature).第14页/共75页1977MethodsforSequencingDNA1977,AllanMaxamandWalterGilbert(pictured)atHarvardUniversityandFrederickSangerattheU.K.MedicalResearchCouncil(MRC)independentlydevelopmethodsfor

sequencingDNA(PNAS,February;PNAS,December).

1972(October),PaulBergandcoworkerscreatethefirstrecombinantDNAmolecule(PNAS).第15页/共75页1985HGPfirstbediscussed

(May)Robertinsheimer(pictured)hostsameetingattheUniversityofCalifornia(UC),SantaCruz,todiscussthefeasibilityofsequencingthehumangenome(December)KaryMullisandcolleaguesatCetusCorp.developPCR,atechniquetoreplicatevastamountsofDNA(Science).第16页/共75页1987DevelopYACsforCloning

(May)DavidBurke,MaynardOlson,andGeorgeCarleofWashingtonUniversityinSt.LouisdevelopYACs(right)forcloning,increasinginsertsize10-fold(Science).AppliedBiosystemsInc.putsthefirstautomatedsequencingmachine,basedonHood'stechnology,onthemarket.第17页/共75页1990large-scalesequencing

onmodelorganisms(August)NIH(NationalInstitutesofHealth)beginslarge-scalesequencingtrialsonfourmodelorganisms:Mycoplasmacapricolum(支原体),Escherichiacoli(大肠杆菌)(up,pink),Caenorhabditiselegans(线虫)(up,rainbow),andSaccharomycescerevisiae(啤酒酵母)(up,ovals).第18页/共75页HGP是美国科学家于1985年率先提出的,旨在阐明人类基因组30亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。计划于1990年正式启动,这一价值30亿美元的计划的目标是,为30亿个碱基对构成的人类基因组精确测序,从而最终弄清楚每种基因制造的蛋白质及其作用。打个比方,这一过程就好像以步行的方式画出从北京到上海的路线图,并标明沿途的每一座山峰与山谷。虽然很慢,但非常精确。第19页/共75页随着人类基因组逐渐被破译,一张生命之图将被绘就,人们的生活也将发生巨大变化。基因药物已经走进人们的生活,利用基因治疗更多的疾病不再是一个奢望。因为随着我们对人类本身的了解迈上新的台阶,很多疾病的病因将被揭开,药物就会设计得更好些,治疗方案就能“对因下药”,生活起居、饮食习惯有可能根据基因情况进行调整,人类的整体健康状况将会提高,二十一世纪的医学基础将由此奠定。第20页/共75页参加绘制人类基因组图谱的美、英、日、法、德、中6国科学家2001年2月12日公布了更加准确、清晰、完整的人类基因组图谱。国际权威科学刊物《自然》也以60多页的篇幅刊登题为《人类基因组的初步测定和分析》的学术论文,这是首次全面介绍人类基因组工作框架图的“基本信息”。同一期杂志上还发表了多篇相关论文,涉及人类基因组图谱的绘制方法、Y染色体图谱、生殖细胞形成过程中染色体交换基因序列的方式、人体单核苷多态性数据等。第21页/共75页意义:20世纪80年代早期,对HGP就形成了两个重要共识:

(1)全面认识基因组可以极大地加速生物医学研究。

(2)可以使研究人员全面地、无偏差地解决问题。1990年美国能源部与国立卫生院启动这一计划。英国、法国、日本也建立基因组中心开展研究。90年代后期,HGP加速,德国和中国相继加入这一计划。中国是1999年9月加入这一国际协作组,负责测定人类基因组全部序列的1%,成为参与这一计划的唯一发展中国家。各国所承担工作比例约为美国54%,英国33%,日本7%,法国2.8%,德国2.2%,中国1%。此前,人类基因组“工作框架图”已于2000年6月完成,科学家发现人类基因数目约为2.5万个,远少于原先10万个基因的估计。

第22页/共75页二、人类基因组计划大事记1990年10月誉为生命科学“阿波罗登月计划”的国际人类基因组计划启动。1998年5月一批科学家在美国罗克威尔组建Celera遗传公司,目标是投入3亿美元,到2001年绘制出完整的人体基因图谱,与国际人类基因组计划展开竞争。1998年10月23日美国国家人类基因组研究所在《Science》上发表声明说,人类基因组计划的全部测序工作将比原计划提前两年,即在2003年完成。1999年3月15日英国韦尔科姆基金会宣布,由于科学家加快工作步伐,人类基因组工作草图将提前至2000年完成。第23页/共75页1999年9月中国获准加入HGP,负责测定人类基因组全部序列的1%,也就是3号染色体上的3000万个碱基对,使中国成为继美、英、日、德、法之后第6个国际HGP参与国,也是参与这一计划的唯一发展中国家。12月1日国际人类基因组计划联合研究小组宣布,他们完整地译出人体第22对染色体的遗传密码,这是人类首次成功地完成人体染色体基因完整序列的测定。2000年3月14日美国总统克林顿和英国首相布莱尔发表联合声明,呼吁将人类基因组研究成果公开,以便世界各国的科学家都能自由地使用这些成果。他们是针对一些私营生物技术公司为了商业利益而与国际人类基因组计划展开竞争,并试图将自己的研究成果申请专利而发出此声明的。第24页/共75页4月6日

Celera公司宣布已破译出一名实验者的完整遗传密码。但不少欧美科学家对Celera公司的成果表示质疑,认为该公司的研究“没有提供有关基因序列的长度和完整性的可靠参数”,因而是“有漏洞的”。4月末我国科学家按照国际人类基因组计划的部署,完成了1%人类基因组的工作框架图。5月国际人类基因组计划完成时间再度提前,预计从原定的2003年6月提前至2001年6月。5月8日由德国和日本等国科学家组成的国际科研小组宣布,他们已经基本完成了人体第21对染色体的测序工作。6月26日各国科学家公布了人类基因组工作草图。第25页/共75页2003年4月14日,美国联邦国家人类基因组研究项目负责人弗朗西斯.柯林斯博士在华盛顿隆重宣布,人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。由美、英、日、法、德和中国科学家经过13年努力共同绘制完成了人类基因组序列图,在人类揭示生命奥秘、认识自我的漫漫长路上又迈出了重要的一步。第26页/共75页Thehumangenomecontains3164.7millionchemicalnucleotide(A,C,T,andG).

1.1%ofthegenomeisspanedbyexonsequence,

24%ofthegenomeisinintron

75%ofthegenomeisintergenic(noncoding)DNA2.Theaveragegeneconsistsof3000bases,butsizesvarygreatly,withthelargestknownhumangenebeingdystrophinat2.4millionbases.

Avereage:8.1exon/gene.第27页/共75页Thetotalnumberofgenesisestimatedat30,000to40000,muchlowerthanpreviousestimatesof80000to140000thathadbeenbasedonextrapolationsfromgene-richareasasopposedtoacompositeofgene-richandgene-poorareas.Thefunctionsareunknownformorethan50%ofdiscoveredgenes.第28页/共75页AssemblygeneratedbyUCSCFreezeofsequencedatageneratedbyNCBIClonelayoutsgeneratedByWashingtonUniversityACCTTGGCCTGAATCTAGGCTTTGCATCCCTAGTCCTGATCGsequenceClonemapsWorkingdraftassemblyThe“WorkingDraft”ofthehumangenome第29页/共75页三、生物信息学在人类基因组计划中的应用大规模基因组测序中的信息分析新基因和新SNPs(单核苷酸多态性)的发现与鉴定完整基因组的比较研究大规模基因功能表达谱的分析生物大分子的结构模拟与药物设计

非编码区信息结构分析

遗传密码起源和生物进化的研究第30页/共75页1.大规模基因组测序中的信息分析大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。目前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的。特别是拼接和填补序列间隙更需要把实验设讨和信息分析时刻联系在一起.拼接与组装中的难点是处理重复序列,这在含有约30%重复序列的人类基因组中显得尤其突出。第31页/共75页第32页/共75页2.新基因和新SNPs的发现与鉴定

人类基因组的工作草图即将完成,因此发现新基因就成了当务之急。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方法预测出来的。比如啤酒酵母完整基因组(约1300万bp)所包含的6千多个基因,大约60%是通过信息分析得到的。当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和病人基因又有什么差别。”这就是通常所说的SNPs(单核苷酸多态性)。构建SNPs及其相关数据库是基因组研究走向应用的重要步骤。1998年国际已开展了以EST为主发现新SNPs的研究。在我国开展中华民族SNPs研究也是至关重要的。第33页/共75页3.完整基因组的比较研究现在,生物信息学家不仅有大量的序列和基因而且有越来越多的完整基因组。有了这些资料人们就能对若干重大生物学问题进行分析。比如:研究生命的起源、进化的,遗传密码是的起源,估计最小独立生活的生物至少需要多少基因,这些基因是如何使它们存活。比如:鼠和人的基因组大小相似,都含有约三十亿碱基对,基因的数目也类似,可是为什么鼠和人差异确如此之大?同样,有的科学家估计不同人种间基因组的差别仅为0.1%;人猿间差别约为1%。但他们表型间的差异十分显著。因此其表型差异不仅应从基因、DNA序列找原因,也应考虑到整个研究组、考虑染色体组织上的差异。总之,这些例子说明由完整基因组研究所导致的比较基因组学必将为基因组研究开辟新的领域。第34页/共75页4.大规模基因功能表达谱的分析

随着人类基因组测序完成,一些学者提出如下问题:即使我们已经获得了人的完整基因图谱,那对人的生命活动能说明到什么程度呢?于是他们提出了一系列上述数据不能说明的问题,如:基因表达产物是否与何时出现,浓度是多少,是否存在翻译后修饰过程,若存在是如何修饰的;基因敲出或基因过度表达的影响是什么;多基因的表现型如何等。概括这些问题,其实质是我们虽然知道了基因和核酸序列,但不知道它们如何发挥功能,或者说是如何按照特定时间、空间进行基因表达的,表达量有多少。为了得到基因表达的功能谱,国际上在核酸和蛋白质两个层次上都发展了新技术。这就是在核酸层次上的DNA芯片技术和在蛋白质层次上的二维凝胶电泳和测序质谱技术,也称蛋白质组技术。第35页/共75页5.生物大分子的结构模拟与药物设计

随着人类基因组计划的执行,估计几年之内就可找到人类的8万到10万个基因,也就是发现它们的一级序列。然而要了解他们的功能、要找到这些蛋白质功能的分子基础,必须进一步知道它们的三维结构。与此同时,要设计药物也需要了解相应的蛋白质受体的三维结构。这是摆在科学家面前的紧迫任务。第36页/共75页6.非编码区信息结构分析

近年来完整基因组的研究表明,在细菌这样的微生物中非编码区只占整个基因组序列的10%到20%,而高等生物和人的基因组中非编码区都占到基因组序列的绝大部分。从生物进化的观点看来,随着生物体功能的完善和复杂化非编码区序列明显增加的趋势表明,这部分序列必定具有重要的生物功能。普遍的认识是,它们与基因在四维时空的表达调控有关。因此寻找这些区域的编码特征以及信息调节与表达规律是未来相当长时间内的热点课题。第37页/共75页对人类基因组来说,迄今为止,人们真正掌握规律的只有DNA上的编码蛋白质的区域(基因),很多资料说这部分序列只占基因组的3%到5%,也就是说,人类基因组中多达95%到97%是非编码区。如何深人了解这些非编码区序列的功能是当前科学家们面临的一个真正的挑战。第38页/共75页7.遗传密码起源和生物进化的研究

自1859年Darwin的物种起源发表以来,进化论成为对人类自然科学和自然哲学发展的最重大贡献之一。进化论研究的核心是描述生物进化的历史(系统进化树)和探索进化过程的机制。自本世纪中叶以来,随着分子生物学的不断发展,进化论的研究也进入了分子水平。当前分子进化的研究已是进化论研究的重要手段,并建立了一套依赖于核酸、蛋白质序列信息的理论方法。第39页/共75页近年来,随着序列数据的大量增加,对序列差异和进化关系的争论也越来越激烈。不少的研究结果并不支持分子钟的假设。因为基于某一种分子序列所重构出的进化树,只能反映这种序列的系统发育关系,并不一定能代表物种之间真正的进化关系,即可能存在着基因树与物种树之间的差异。同时,对垂直进化和水平演化之间关系的讨论正逐渐引起人们的重视。当前的资料给了我们一个更为复杂也更为丰满的进化模式,它启示我们要彻底了解进化的规律必须使用整个基因组的信息。相应地必须发展新的理论方法。第40页/共75页四、我国HGP研究维甲酸调控基因的分离、克隆和基因鉴定:(陈竺)生育/不育相关基因:(王琳芳)人脑发育相关基因:(施伯勤)神经性耳聋基因的分离、鉴定及序列测定(夏家辉)人工病毒载体(侯云德)转基因动物(曾溢涛,刘德培)基因治疗(刘德培)基因的调控机制(张俊武)第41页/共75页中国在HGP中的贡献中国科学院杨焕明教授南方基因组陈竺院士北方基因组强伯勤院士测序中心—北京昌平空港工业园HGP的1%,约3000万bp总投资约6千万第42页/共75页基因组工程基因组学蛋白质组学药物基因组学功能基因组学比较基因组学分子病理学生物信息学等第43页/共75页有关HGP的深入研究方兴未艾2000年,测定HGP的全部基因序列2010年,识别所有的基因2050年,确定HGP中所有基因的功能2100年,确定HGP中基因变异和疾病的关系2000-2100年,研究其他生命大分子与生命活的关系,包括蛋白质、多糖、脂肪分子。第44页/共75页HGP的完成启发了我们新的思考……由于基因是遗传信息的携带者,而生命活动的执行者却是蛋白质,即基因表达产物。因此,即使得到人类全部基因序列,也只是解决了遗传信息库的问题。人类揭示整个生命活动的规律,就必须研究基因的产物--蛋白质。相对于基因组而言,对于蛋白质的研究称为蛋白质组学。第45页/共75页HGP计划的最新进展:1990年启动,历时约15年,耗资约30亿$2006年,人类基因组计划在美国、欧洲、亚洲20个研究所科学家的合作下已经完成。人类基因数量是20000-25000个2006年5月《Nature》发表的论文是最完整的基因序列,包括99%的基因部分,已经确定了99.7%的已知基因,精确度达到99.9%近6000万年-1亿年中,新在人类基因组中出现的基因有1183个,有30个基因受到抑制。基因功能研究是今后的重点第46页/共75页伦敦大学学院(UniversityCollegeLondon)著名遗传学家施蒂夫·琼斯教授说,人类现在已经到了历来最大可能的先进阶段,而且进化的过程已经减慢。物竞天择、变异和突变是进化的三大要素。他说,人类在体能和智力两方面,已经到了可能达到的最高程度。在150年前能活到21岁的儿童只有一半,但是现在已经达到98%。人类基因变异的最大源头来自年纪大的男子。由于生育的模式改变,人类基因变异已经失去了原有的生物学动力。第47页/共75页人类基因组工程确定了大约三万四千个与蛋白质制造有关的基因。而其余的基因片段——也就是大多数基因——被认为是由所谓的没有功能的“垃圾”DNA片段组成的。但是最近几年的研究发现这些所谓的“垃圾”DNA产生了大约50万种RNA,只不过这些RNA的功能还未被发现2.5万基因所包含的DNA序列,大概只有人类基因组序列总长的2%左右。也就是说,人类生命蓝图中约有98%的信息似乎不属于什么基因,是无用的垃圾。第48页/共75页Newprogress2006年10月25日,来自全球63个科研机构的100多名科学家经过4年努力完成了蜜蜂的全基因组,这是继果蝇、蚊子之后完成的第三个昆虫基因组。基因显示,蜜蜂的祖先来自非洲,推翻了以往来自欧亚的论点。蜜蜂极其古老,进化缓慢,但体内控制生理节奏、衰老、RNAi等相关基因与昆虫有较大差异,与人等脊椎动物的同类基因更为接近。控制嗅觉的基因极为发达。第49页/共75页AnRNAgeneexpressedduringcortialdevelopmentevolvedrapidlyinhumansNature2006,Vol443167-172比较遗传学揭示,一个RNA基因HAR1,在黑猩猩和人类分化前保持不变,但在以后人类加速演化时发生表达改变,该基因在neocortex的胚胎发育过程种表达,而neocortex是大脑很多最复杂发育过程的发生部位,该基因在妊娠的关键阶段活跃于Cajal-Retzius的神经元中,正在此时,neocortex的许多神经细胞正在大脑内确定自己的功能。第50页/共75页果蝇的比较基因组学美国国立人类基因组研究所(NHGRI)资助的一个国际科研组织11月8日宣布,他们完成了12种“近亲”果蝇的基因组对比研究工作,其中有10种果蝇的基因组是首次测序。对比分析确定出了数千个新的基因和其他功能元件,并揭示了进化过程在果蝇基因组上留下的痕迹。相关论文以封面文章的形式发表于2007年11月8日的《自然》杂志上。NHGRI主任Francis

S.

Collins表示,“这项非凡的科学成就强调了基因测序和基因组对比研究的价值,尤其是那些能够深化人们对基本生命过程理解的物种模型。”

第51页/共75页一个世纪以来,果蝇一直是生命科学研究中理想而重要的模型。尽管它们的基因组只有人类的1/25,但许多基因与人类是对应的,控制着相同的生理功能。近些年来,科学家已经利用果蝇发现了许多基因线索,它们与疾病、动物发育、人类遗传学、细胞生物学、神经生物学等问题直接相关。第52页/共75页这项最新的大规模研究由16个国家100多家研究机构的数百位科学家共同完成。在12种果蝇中,黑腹果蝇(Drosophila

melanogaster)和拟暗果蝇(D.

pseudoobscura)的基因组是已知的,论文分别发表在2000年和2005年的《自然》杂志上。其余10种果蝇的基因组都是最新测定的,它们分别是D.

sechellia,D.

simulans,D.

yakuba,D.

erecta,D.

ananassae,D.

persimilis,D.

willistoni,D.

mojavensis,D.

virilis和D.

grimshawi。在常人看来,盘旋于腐烂香蕉上的果蝇们没有太大的差别。的确,它们的基因组乍一眼看来确实十分相似。不过,更加细致的分析表明,黑腹果蝇和其他11个种类只共享大约77%的编码蛋白基因(约13700个)。第53页/共75页研究人员发现,果蝇基因组的不同区域进化速度也不相同,进化最快的是与果蝇味觉和嗅觉、解毒和代谢、性别和繁殖以及免疫性和防御相关的基因。这表明,果蝇基因的进化很大程度上是适应环境变化和性别选择的结果。比如,生活在印度洋岛屿上的D.

sechellia果蝇由于食物来源较为单一,与味觉相关的基因损失速度是其它种类的5倍。而另一种D.

willistoni果蝇是科学家发现的唯一一种没有硒蛋白(Selenoproteins,有助减少机体摄入的硒矿物质量)的动物。研究人员推测,该类果蝇可能以未知的特殊方式合成硒蛋白。

除了进化上的认识,研究人员还发现了数千个新的基因和功能元件。他们利用进化信号,发现了1193个新的编码蛋白序列,并且对此前报告的黑腹果蝇基因组中的414个编码蛋白序列提出了质疑。新发现的功能元件共有数百个,包括非蛋白编码基因、转录调控部分以及负责染色体结构和动力学调控的DNA序列。第54页/共75页来自麻省理工与哈佛大学Broad研究院(The

Broad

Institute),加州大学Santa

Cruz分校,Wellcome

Trust基因科学园(Wellcome

Trust

Genome

Campus)Sanger研究院,丹麦哥本哈根大学,比利时布鲁塞尔自由大学(

Universite

libre

de

Bruxelles,

ULB)等多国研究人员组成的研究小组测序分析了12种果蝇的基因组,从中揭示了基因和基因组进化的奥秘,以及识别了动物DNA中的功能性元素。这是首次进行的如此大规模的测序基因组对比,研究成果公布在11月7日的《Nature》封面上,同期配发了一组重要论文,除此之外,在《Genome

Research》和其它杂志上也发表了40多篇相应的文章,引起了基因组研究领域,乃至整个生物学研究领域的轰动。1995年8月,冷泉港实验室出版社创办,关注所有物种的基因组研究第55页/共75页无编码意义的DNA的作用酵母和蠕虫之类的简单生物是如何进化为鸟和哺乳动物这样的复杂生物的呢?一项针对基因组进行的广泛比较研究显示,问题的答案可能就隐藏在生物的垃圾脱氧核糖核酸(DNA)中。美国科学家发现,生物越复杂,其携带的垃圾DNA就越多,而恰恰是这些没有编码的“无用”DNA帮助高等生物进化出了复杂的机体.生物的大多数DNA并没有形成有用的基因。从突变保护到染色体的结构支撑,对于这种所谓的垃圾DNA的可能解释有许多种。但是去年从人类、小鼠和大鼠身上得到的完全一致的关于垃圾DNA的研究结果却表明,在这一区域中可能包含有重要的调节机制,从而能够控制基础的生物化学反应和发育进程,这将帮助生物进化出更为复杂的机体。第56页/共75页美国加利福尼亚大学圣塔克鲁斯分校(UCSC)的计算生物学家DavidHaussler领导的一个研究小组,对5种脊椎动物——人、小鼠、大鼠、鸡和河豚——的垃圾DNA序列与4种昆虫、两种蠕虫和7种酵母的垃圾DNA序列进行了比较。研究人员从对比结果中得到了一个惊人的模式:生物越复杂,垃圾DNA似乎就越重要。酵母与脊椎动物共享了一定数量的DNA,毕竟它们都需要制造蛋白质,但是只有15%的共有DNA与基因无关。酵母与更为复杂的蠕虫进行了比较,后者是一种多细胞生物,发现有40%的共有DNA没有被编码。随后,研究人员又将脊椎动物与昆虫进行了对比,这些生物比蠕虫更为复杂,结果发现,有超过66%的共有DNA包含有没有编码的DNA。

第57页/共75页不同物种的基因组比较有些物种的基因组更加“精练”、垃圾更少,比如鸡的基因组大小只有人类的1/3、河豚则为人类的1/10,但它们的基因数量却与人类差不多。也有的更夸张,如洋葱的基因组有人类基因组的12倍那么大、阿米巴变形虫的基因组更是比人的基因组大200多倍。有证据显示,至少一部分垃圾DNA很像真正的垃圾,因为动物失去它们之后依然生活得很好。2004年10月,一组美国科学家在《自然》杂志上发表报告说,他们删除了小鼠基因组中超过100万个碱基对的非编码DNA(约占鼠基因组的1%),但并没有对这些小鼠的发育、寿命和繁殖造成可察觉的影响。在100多项评估基因活性的组织测试中,只有两项发现了差异。他们还培育出失去300万个碱基对的非编码DNA小鼠,也没有发现明显异常。第58页/共75页天花病毒,大肠杆菌和其他微生物的基因都是一个挤着一个,中间并没有“垃圾”或基因内区。甚至有几种高等生物,如河豚,就只有很少的非编码DNA。大部分哺乳动物,无论是人、田鼠、猫,还是鼹鼠等,其基因组有大约30亿个碱基对的长度植物的基因组经常是比哺乳动物的要更长。例如,小麦的DNA大约有160亿个碱基对的长度,而野百合花却大约有1000亿个的长度;大部分“垃圾”DNA是冗长的、非编码的单一形态。一些微生物,如天花病毒和细菌,有一些微小的,整齐的并不必要的基因组。它们迅速地繁殖,却不能引发与立即复制相关的任何活动。但是,高等动物的生命策略和复制策略都不仅仅是每20秒发生一次双裂变那样简单,它们能提供更复杂、更高级的基因组并且能为漫长而曲折的进化过程做出贡献。第59页/共75页动植物的基因组大熊猫基因组2008年10月12日由中国完成牡蛎基因组2009年上半年完成牡蛎基因组精细图谱绘制籼稻2002年第60页/共75页Nature456,60-65(6November2008)《自然》杂志以封面文章形式发表了由深圳华大基因研究院完成的首个中国人基因组序列研究成果(定名“炎黄一号”)。

深圳华大基因研究院院长汪建介绍说,这一长达7页的长篇论文描绘了第一个亚洲人的全基因组图谱,测序数据总量达到1177亿碱基对,基因组平均测序深度达到36倍,有效覆盖率高达99.97%,变异检测精度达99.9%以上。

科学家在这一研究中详细比较了中国人与已有数据的白种人基因组在序列和结构上的差异性,新发现了41.7万例独有的遗传多态性位点,并对相应的基因功能进行了探讨,较全面地阐述了中国人基因组结构的特征。

“炎黄一号”作为中国人参照基因组序列,从基因组学上对中国人与其他族群在疾病易感性和药物反应方面的显著差异作出了解释第61页/共75页2009年10月14日简介:我国科学家领衔的白菜、甘蓝和油菜全基因组测序项目取得阶段性重大成果,项目组日前获得了白菜全基因组的精细图,甘蓝和油菜全基因组的框架图。白菜、甘蓝和油菜的基因.组大小分别约为5亿个、6.5亿个和11亿个碱基对,白菜和甘蓝含有的基因总数目分别约4.2万个和4.5万个,油菜基因覆盖度为85%以上。9月23日,由14国科学家组成的“国际马铃薯基因组测序协作组”分别在北京、阿姆斯特丹、伦敦、纽约、利马等地同时宣布了马铃薯基因组序列框架图的完成。

第62页/共75页2009年10月9日,美国科学家通过将人类基因组分成数百万个片段并重新排列组合,成功描绘出清晰度和分辨率最高的基因组三维图像。第63页/共75页2009年8月29日,我国科学家共获得了40个家蚕突变品系和中国野桑蚕的全基因.组序列,共测632.5亿对碱基序列,覆盖了99.8%的基因.组区域,是多细胞真核生物大规模重测序研究的首次报道;绘制完成了世界上第一张基因.组水平上的蚕类单碱基遗传变异图谱,这是世界上首次报道的昆虫基因.组变异图。第64页/共75页Nature

Biotechnology:斯蒂芬·夸克(StephenQuake)最近用“自绘”个人基因组图谱。斯坦福大学8月10日发表声明说,夸克在两名同事的帮助下,利用一台冰箱大的单分子测序仪器,测定了自身的基因组序列,并绘制了图谱。与约10年前人类基因组计划花费的庞大资金相比,夸克只用了不到5万美元。“换言之,一项曾花费一架飞机的钱的任务,现在降到了一辆中等豪华轿车的价格”。由于价格太高,目前全球已绘制个人基因组图谱的只有10人左右,其中一些还是免费绘制。

科学家指出,拥有个人基因组图谱,意味着医生可以凭此为你设计“个性化医疗方案”,更精确地治病,甚至在发病前就进行干预。

第65页/共75页2009-10-29Nature:大肠杆菌(E.

coli)基因组演化的速度和模式:韩、美、法三国科学家组成的研究小组长达20年实验中,研究人员在实验室中培养了一批大肠杆菌,它们在近20年时间里一直以葡萄糖为一种限制性营养物。大肠杆菌克隆的基因组分别在2,000代、5,000代、10,000代、15,000代、20,000代和40,000代后被取样。适应性的发展加速极快,但基因组演化在20,000代几乎是不变的。这样的一致性被认为是中性演化的特点,但来自几个方面的证据都表明,这些突变大部分都是有益的。这个种群后来突变速度加快,并且积累了数百个另外的、以中性为特征的突变。显然,基因组演化和适应性演化之间的耦合是一个复杂的问题。第66页/共75页2009-10-10,Nature:基因组和转录组随肿瘤转移所发生的变化:测序方法被用来研究来自一个患者(而不是来自一个细胞系或异种移植物)的一种“雌激素-受体-阿尔法-阳性”转移性小叶乳腺癌的基因组和转录组,研究的时段是从原发肿瘤被诊断出到出现转移之间的9年时间。对同一患者转移肿瘤和原发肿瘤中的体细胞非同义编码突变所做比较,以及对基因组和转录组数据的组合分析,加深了我们对会随病情发展出现的突变演化的认识第67页/共75页2009-10-9,Nature:找到自闭症易感基因自闭症是一种具有高度遗传性的神经发育疾病,然而迄今所发现的特定易感基因非常少。现在,在一组1,031个多元化自闭症

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论