基因组比较基因组学_第1页
基因组比较基因组学_第2页
基因组比较基因组学_第3页
基因组比较基因组学_第4页
基因组比较基因组学_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组比较基因组学基因组比较基因组学第1页第一节人类基因组计划该计划是美国科学家1985年率先提出,1990年正式开启。美、英、德、法、日先后参加了此项工作,1999年我国成为HGP第六个组员国。

HGP意在说明人类基因组DNA所含有3×109核苷酸序列,发觉全部人类基因并说明其在染色体上位置,破译人类全部遗传信息,使得人类第一次在分子水平上全方面地认识自我。其研究内容还包含创建计算机分析管理系统,检验相关伦理、法律及社会问题。

年完成了人类基因组“工作框架图”。年公布了人类基因组图谱及初步分析结果。

HGP实施,揭开了生命科学新一页,它能够造福于人类,但也面临伦理挑战。基因组比较基因组学第2页1985年:5月,R.Sinsheimer在加州大学SantaCruz分校主持会议,讨论将人类基因组全部测序可行性;12月,西特斯企业(CetusCorp.)K.Mullis和他同事们创造了PCR技术,利用这项技术,科学家们能够在短时间内准确复制成百万DNA片段,从而不再为遗传物质用量而担忧.1986年:3月,美国能源部(DepartmentofEnergy,DOE)在新墨西哥州召开会议,讨论人类基因组测序计划;6月,科学家们齐聚纽约州冷泉港实验室,以“人类分子生物学”为题讨论人类基因组计划可能带来利益和前景;同月,加州理工学院L.Hood和L.Smith共同创造了第一台DNA自动测序仪;9月,DOE从1987年财政预算中拨款530万美元,资助C.DeLisi开始基因组研究.1987年:2月,W.Gibert从美国国家研究委员会(NationalResearchCouncil,NRC)辞职,组建Genome企业,同时宣称该企业将参加人类基因组测序工作,并将为测序结果申请专利;4月,一个教授小组提议DOE在未来7年内拨款10亿美元,用以进行人类基因图谱测定和基因组测序,DOE主持人类基因组计划开始实施;5月,华盛顿大学D.Burke,M.Olson和G.Carle创造酵母人工染色体(YAC)克隆技术,使插入片段长度扩充了10倍;10月,H.Donis-Keller发表了第一张带有403个遗传标记遗传图谱,由此在全世界范围内引发了测序竞争;同月,杜邦企业将荧光链终止双脱氧技术引入到DNA快速测序中;这一年,AppliedBiosystems企业将第一台自动测序仪推上市场.1988年:2月,在一份至关主要汇报中,NRC同意了人类基因组计划,并提出分阶段实施和每年2亿美元拨款申请;3月,在许多教授提议下,J.Wyngaarden在弗吉尼亚州Reston召开会议上宣告,美国国立卫生研究院(NationalInstitutesofHealth,NIH)应代替DOE成为人类基因组计划中主要负责机构.在这之后,Wyngaarden被任命为NIH主席;6月,第一届基因组年会在冷泉港召开;9月,NIH宣告成立人类基因组研究办公室,并任命发觉DNA双螺旋结构J.Watson为主任;10月,NIH与DOE达成谅解备忘录,双方同意在人类基因组计划中团结协作.1989年:1月,洛克菲勒大学N.Zinder主持了第一次HGP顾问委员会会议;9月,Olson,Hood,Botstein和Cantor共同描绘了基因图谱测定新战略;同月,DOE与NIH共同组建了一个委员会,以处理基因组计划可能带来伦理、法律和社会问题;10月,NIH人类基因组研究办公室升级为人类基因组研究国家中心(NationalCenterofHumanGenomeResearch,NCHGR),并被授予拨款权.1990年:L.Smith,B.Karger和N.Dovichi分别领导3个小组各自独立地发展了毛细管电泳技术,这项技术以后被广泛应用于大规模测序中;4月,NIH和DOE一起发表了一个五年计划,内容包含测定完整遗传图谱和物理图谱(每100kb含一个标识),并在年之前完成模式生物基因组测序;8月,NIH决定对四种模式生物开始大规模测序尝试.这四种模式生物是:支原体(Mycoplasmacapricolum)、大肠杆菌(Escheriachiacoli)、线虫(Caenorhabditiselegans)和酿酒酵母(Saccharomycescerevisiae);10月,NIH和DOE宣告这一年10月1日为人类基因组计划正式开启时间.同月,生物技术信息中心(NationalCenterofBiotechnologyInformation,NCBI)D.Lipman与E.Myers发表了用于进行同源序列比较BLAST算法.1991年:6月,NIH生物学家J.C.Venter发表了一个发现表示基因新战略,即使用表示序列标签(ExpressedSequenceTag,EST);一个月之后,Venter在国会听证会上披露,NIH堆积了上千份表示基因专利申请,由此引发了一场关于基因能否取得专利大争论;10月,日本开始对水稻基因组测序;12月,用于基因查找第一个程序GRAIL开发成功.1992年:4月,就基因申请专利问题,Watson在与B.Healy争论之后辞去了NCHGR主任职位,后者随即被任命为NIH主席;6月,Venter离开NIH组建了基因组研究所(TheInstituteofGenomeResearch,TIGR),这是一个位于马里兰州Rockville非盈利机构;7月,英国慈善机构WellcomeTrust投资9500万美元,加入人类基因组计划;9月,加州理工学院M.Simon和他同事们创造细菌人工染色体(BAC)克隆新技术,使大规模克隆成为可能,BAC以后成为基因组研究中“硬通货”;10月,美国和法国两支研究队伍分别完成了人类Y染色体和第21条染色体第一张物理图谱;12月,经过长时间讨论,NIH和DOE为勉励资源共享放宽了对数据资源限制,要求研究人员必须在6个月之内将新数据传送到公共数据库中;同月,美国和法国上述两个研究机构又分别完成了鼠和人遗传图谱.1993年:4月,密歇根大学F.Collins被任命为NCHGR领导人;10月,NIH和DOE公布了新五年计划,按照这个计划,到1998年底,将有80MbDNA被测序,而人类基因组将在年被全部测序.与此同时,位于英国剑桥Sanger中心在J.Sulston领导下加入人类基因组计划,并成为一个主要测序中心.1994年:9月,爱荷华大学J.Murray与法国GénéthonCohen及他们同事们完成了人类基因组中第一个完整遗传连接图谱.1995年:5~8月,测序染色新技术和热稳定聚合酶开发成功;7月,第一个基因组——流感嗜血杆菌(Haemophilusinfluenzae)全序列发表,大小为1.8Mb;9月,日本政府拨款1590万美元,用以资助3个研究机构从事基因组测序工作;10月,斯坦福大学P.Brown和他同事们发表了第一篇关于完整cDNA探针芯片论文.1996年:2月,各国科学家聚集在百慕大群岛召开会议,讨论并经过了数据资源共享问题,要求今后测序结果必须在24小时内传送到公共数据库中,这就是著名百慕大标准;4月,NIH资助6个研究小组尝试人类基因组大规模测序;同月,Affymetrix将DNA芯片商品化;10月,酿酒酵母(Saccharomycescerevisiae)基因组全部测序完成;11月,RIKENY.Hayashizaki小组完成了第一套小鼠全长cDNA测序.1997年:1月,NCHGR升级为美国国家基因组研究所(NationalHumanGenomeResearchInstitute,NHGRI),DOE也成立了对应联合基因组研究所(JointGenomeInstitute);9月,大肠杆菌(Escherichiacoli)基因组全部测序完成,全长5Mb;同月,毛细管测序仪出现.1998年:1月,NIH公布了一项新计划,其目标是在浩如烟海DNA碱基序列中寻找单核苷酸多态性(singlenucleotidepolymorphisms,SNPs);5月,PEBiosystems企业开发成功PEPrism3700毛细管测序仪;同月,Venter宣告成立一个新企业,取名Celera,并宣称将在3年内,投资3亿美元,采取“全基因组鸟枪法”(wholegenomeshotgun)完成人类基因组全部测序,同时Ventor宣告Celera企业数据将不遵从百慕大标准.与此同时,WellcomeTrust将它对人类基因组计划投资加倍,到达了3亿3千万美元,以此作为对Celera企业回应.从此,人类基因组测序在“公”(HGP)与“私”(Celera)之间展开了激烈竞争;10月,NIH和DOE宣告将在年完成人类基因组工作框架图,并将全部测序最终期限从年提前到年;12月,线虫(Caenorhabditiselegans)基因组测序完成.1999年:3月,作为对Celera企业应战,NIH再次宣告将人类基因组工作框架图完成时间提前到年春季,大规模测序工作主要集中在以下五个测序中心:.麻萨诸塞州Whitehead生物医学研究所、位于圣路易斯华盛顿大学、位于休斯敦Baylor医学院、英国剑桥Sanger中心和位于加利福尼亚州DOE下属联合基因组研究所;4月,10家企业与WellcomeTrust签署协议,合作开展SNP研究,并计划将公共数据库中SNP数据每季度更新一次;9月,NIH宣告将在3年内投资1亿3千万美元,完成小鼠基因组测序;12月,英国、日本和美国科学家们共同完成了第一条人染色体——第22条染色体全部测序工作.年:3月,Celera企业完结果蝇(Drosophilamelanogaster)基因组(180Mb)全部测序工作,在当初全部已测序基因组中是最大,同时这也证实了“全基因组鸟枪法”可行性;3月,因为对数据资源共享政策持不一样观点,HGP与Celera企业合作计划破产;5月,德国和日本科学家公布了人类第21条染色体测序结果;6月26日,这是一个值得纪念日子,HGP与Celera企业领导人在白宫庆祝仪式上共同宣告了人类基因组工作框架图完成,并约定将双方研究结果同时发表;12月,第一个植物基因组——拟南芥(Arabidopsisthaliana)基因组被全部测序,大小为125Mb.年:2月,HGP将自己测定人类基因组工作框架图发表在《Nature》(,409(6822))上;Celera企业则将它们结果发表在《Science》(,291(5507))上.发表“工作框架图”已能覆盖人类基因组97%,其中最少92%序列已组装得准确无误,并显示其中只有3万到4万个编码蛋白质基因,这是人类基因组研究一个主要里程碑.基因组比较基因组学第3页HGP取得成就完成了人类基因组工作草图绘制,揭示了人类基因组若干细节基础上测定了人类基因组上碱基序列一些模式生物(果蝇、拟南介等)和作物(如水稻)基因草图绘制成功,测序基础完成促进了生物信息学、蛋白质组学、糖组学迅猛发展人类基因组草图绘就,中国科学家功不可没基因组比较基因组学第4页华大基因测序试验室NationalCenterforHumanGenomeResearch(NCHGR)杨焕明,基因组学家。中国科学院北京基因组研究所研究员。1952年10月生于浙江温州乐清市,籍贯浙江乐清。1978年毕业于原杭州大学(现浙江大学),1982年于原南京铁道医学院(现东南大学)获硕士学位,1988年获丹麦哥本哈根大学博士学位,年12月27日,当选为中国科学院院士。曾任中国科学院北京基因组研究所所长。基因组比较基因组学第5页第一节人类基因组计划人类基因组计划主要内容包含绘制人类基因组4张图,即遗传(连锁)图、物理图、DNA序列图和转录图。1.遗传图(geneticmap)

遗传图又称连锁图(linkagemap)是指基因或DNA标识(如多态性遗传标识)在染色体上以遗传距离表示相对位置图。遗传距离通常以基因或DNA片段在染色体交换过程中分离频率--厘摩(cM)来表示。

基因组比较基因组学第6页基因组比较基因组学第7页分子生物学技术在遗传标识上应用:RFLP:限制性片段长度多态性。DNA序列上微小改变,甚至1个核苷酸改变,也能引发限制性内切酶切位点丢失或产生,造成酶切片段长度改变。多态性限制性位点DNA(等位基因1)DNA(等位基因2)加入限制性内切酶4个片段3个片段*基因组比较基因组学第8页小卫星标识和微卫星标:

有大量重复序列存在于人类基因组中,包含重复单位长度在15-65个核苷酸小卫星DNA(minisatelliteDNAlabel),重复单位长度在2-6个核苷酸微卫星DNA(microsatelliteDNAlabel),后者又称为简短串连重复(shottandemrepeatpolymorphism,STR)。基因组比较基因组学第9页SNP:单核苷酸多态性。DNA遗传标识,可能也是最好遗传标识,是分散于基因组中单个碱基差异。这种差异包含单个碱基缺失和插入,但更常见到是单个核苷酸替换,即单核苷酸多态性(singlenucleotidepolymorphism,SNP)。基因组比较基因组学第10页基因组比较基因组学第11页基因组比较基因组学第12页2.物理图(physicalmap)

物理图指表示DNA序列上DNA标识之间实际距离图。通常由DNA限制酶片段或克隆DNA片段有序排列而成。标识之间物理距离以DNA上核苷酸数目标多少(kb,表示千碱基对,或Mb,1Mb=1000kb)来表示。基因组比较基因组学第13页

遗传图所表现,是经过连锁分析确定各基因间相对位置;物理图则表现染色体上每个DNA片段实际次序。物理图是指以已知核苷酸序列DNA片段(序列标签位点,sequence-taggedsite,STS)为“路标”,以碱基对(bp,kb,Mb)作为基础测量单位(图距)基因组图。PCR

现在测序技术还不能对整个DNA分子进行序列测定,所以须先将它切成一个个大小不一样片段,然后将这些片段连起来,组成连续序列。切割工具,是一类限制性内切核酸酶,它能识别DNA中特定序列,并在该位点对DNA链进行切割。有一类稀有限制性内切核酸酶,因为DNA中这么序列比较少,所以用它可将DNA分子切割成约100万碱基大小大片断。这么片段有利于排序,不过必须用脉冲场凝胶电泳法,才能将它们分开。2.物理图(PhysicalMap)基因组比较基因组学第14页基因组比较基因组学第15页基因组测序

一次测序普通只能测定1000碱基对,然后用已知序列下游个别合成引物,进行另一次测序,如此一步步地“步行”,逐步完成较大片段测序。所以,需先用质粒建立许多克隆,组成质粒文库,再对这些质粒克隆进行测序,然后用电脑搭配成邻接克隆群。

因为自动化和电脑应用,现在一天已可进行10万个测序反应。华盛顿大学、贝勒医学院等机构,均已完成几百万到几千万碱基正确测序,错误率仅万分之一,测序速度和准确性已大大提升。2.物理图(PhysicalMap)基因组比较基因组学第16页基因组比较基因组学第17页3.转录图(expressionprofiling)

在整个人类基因组中,只有1%~5%DNA序列为编码序列。在人体某一特定组织细胞中,普通只有10%基因是表示。假如能把某段DNA序列对应mRNA确定下来,就抓住了基因主要个别,即可转录个别。所以,一张人类基因组转录图,即cDNA图或表示序列图,EST)才是人类基因图雏形。用已在染色体定位YACDNA或BACDNA为探针,与全部可能相关各组织cDNA文库杂交,寻找其同源克隆并做深入分析。基因组比较基因组学第18页4.序列图(humangenomesequence)

序列图是指整个人类基因组核苷酸序列图,也是最详尽物理图。测定总长度约为1m。由30亿个核苷酸对组成序列图就是人类基因组计划。所以,这一“代表性人类个体”基因与序列,在理论上能够代表全人类基因组信息,在实际意义上可用于任何个体基因诊疗、基因分析。既包含可转录序列,也包含非转录序列,是转录序列、调整序列和功效未知序列总和。基因组比较基因组学第19页第二节人工染色体构建

酵母人工染色体(YeastArtificialChromosome,YAC)为创制基因组物理图谱提供了极大方便。YAC是迄今容量最大克隆载体,插入片段平均长度为500-1000kb,最大能够到达2Mb。

自主复制序列:ARS序列(autonomousreplicationsequence)着丝粒序列:CEN序列(centromericsequences)端粒序列:TEL序列(telomeresequence)基因组比较基因组学第20页第二节人工染色体构建

人工染色体含有三种必需成份:着丝粒(CEN):位于染色体中央,呈纽扣状结构,在有丝分裂时结合微管并调控染色体运动,也是姐妹染色单体配对时最终位点,接收细胞信号而使姐妹染色体分开。

端粒(TEL):主要功效是预防染色体融合、降解、确保其完整复制。端粒酶以其本身RNA为模板,在染色体端部添加上端粒重复序列,并参加端粒长度和细胞增殖调控。基因组比较基因组学第21页第二节人工染色体构建基因组比较基因组学第22页复制起点:DNA复制通常由起始蛋白与特定DNA序列相互作用开始。DNA合成起始位点和DNA复制起点(遗传位点)所需Cis靶区常位于同一段长约100bpDNA上。第二节人工染色体构建基因组比较基因组学第23页第二节人工染色体构建基因组比较基因组学第24页第二节人工染色体构建基因组比较基因组学第25页YAC主要缺点1.存在高百分比嵌合体,即一个YAC克隆含有两个原来不相连独立片段;2.个别克隆子不稳定,在转代培养中可能会发生缺失或重排;3.难与酵母染色体区分开,因为YAC与酵母染色体含有相同结构。4.操作时轻易发生染色体机械切割。第二节人工染色体构建基因组比较基因组学第26页

以细菌寄主系统(BAC)为基础克隆载体形成嵌合体频率较低,转化效率高,又易于分离。科学家用"染色体建造"法用F质粒及其调控基因构建细菌载体,克隆大片段DNA。该质粒主要包含oriS,repE(控制F质粒复制)和parA、parB(控制拷贝数)等成份。第二节人工染色体构建基因组比较基因组学第27页第二节人工染色体构建细菌人工染色体构建riS和repE控制F质粒复制parA和parB控制质粒拷贝数基因组比较基因组学第28页BAC优点

1.易于用电击法转化E.coli(转化效率比转化酵母高10-100倍);

2.超螺旋环状载体,易于操作;

3.F质粒本身所带基因控制了质粒复制;

4.极少发生体内重排。第二节人工染色体构建基因组比较基因组学第29页

另外,有些人把人类染色体端粒DNA上单个α-卫星DNA单元多聚化形成1Mb左右大片段并与人类基因组DNA混合,产生了能被复制、能正常分裂并得到长久稳定保留人工合成染色体,长度约为6-10Mb,称为MAC(哺乳类人工染色体)。第二节人工染色体构建基因组比较基因组学第30页第三节全基因组鸟枪法测序基因组比较基因组学第31页第三节全基因组鸟枪法测序全基因组鸟枪法测序主要步骤:

第一、建立高度随机、插入片段大小为2kb左右基因组文库。

第二、高效、大规模末端测序。对文库中每一个克隆,进行两端测序。

第三、序列集合。开发软件,尽可能排除错误连锁匹配。

第四、填补缺口。有两种待填补缺口,一是没有对应模板DNA物理缺口,二是有模板DNA但未测序序列缺口。基因组比较基因组学第32页第三节全基因组鸟枪法测序鸟枪法测序缺点

伴随所测基因组总量增大,所需测序片段大量增加,各个片段重合或一个连续体概率是2n2-2n;高等真核生物(如人类)基因组中有大量重复序列,造成判断失误。基因组比较基因组学第33页第三节全基因组鸟枪法测序基因组比较基因组学第34页

鸟枪法测序不能判别高等真核生物基因组中重复序列基因组比较基因组学第35页第三节全基因组鸟枪法测序对鸟枪法改进

(1)Clonecontig法。首先用稀有内切酶把待测基因组降解为数百kb以上片段,再分别测序。

(2)靶标鸟枪法(diretedshotgun)。首先依据染色体上已知基因和标识位置来确定个别DNA片段相对位置,再逐步缩小各片段之间缺口。基因组比较基因组学第36页改进后鸟枪法测序原理图基因组比较基因组学第37页基因组序列主要分为3类经过比较确知其生理功效;在数据库中有匹配蛋白质序列,但不知道功效;在现有数据库中没有匹配蛋白质序列新基因。第四节比较基因组学

比较基因组学(comparativegenomics)是经过对一个生物相关基因认识来了解、诠释甚至克隆分离另一个生物基因基因组比较基因组学第38页第四节比较基因组学1.经过基因组数据进行全局性分析数据存放。碱基百分含量分析。不论是GC富含区还是AT富含区,都可能是一些特殊功效区域。ORF分析。首先要用多个不一样软件来要找到并估测基因组中每一个ORF。

开放阅读框(ORF,Openreadingframe)是基因序列一个别,包含一段能够编码蛋白碱基序列,一个起始和终止密码子之间序列。基因组比较基因组学第39页个别经典真核和原核生物基因组成成份分析基因组比较基因组学第40页人基因组片段分析基因组比较基因组学第41页人基因组数据库中蛋白质编码基因个别主要参数比较性质平均值外显子(内源性)长度/bp外显子(内源性)个数内含子长度/bp3’非翻译区(UTR)5’非翻译区(UTR)开放阅读框(ORF)长度/bp核基因长度/kb1458.83365770300134027基因组比较基因组学第42页物种完成年份总长度/Mp已完成总长百分数/%占常染色质百分数/Mb基因数/Mb酵母19961293100483线虫19989699100197果蝇1166497117拟南芥11592100221人类第21染色体34751007人类第22染色体199934709716人类全基因组(PublicSequence)2693849012人类全基因组(CeleraSequence)26548399-9315基础完成DNA序列分析真核生物基因组比较基因组比较基因组学第43页不一样物种中单拷贝基因数量及占基因总数比较物种单拷贝基因个数单拷贝基因占基因总量%流感嗜血杆菌酵母果蝇线虫拟南芥1587510510736141771160188.871.472.555.235.0基因组比较基因组学第44页第四节比较基因组学2.经过基因组数据进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论