版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上海交通大学医学院分子生物学课程(优选)上海交通大学医学院分子生物学课程2.HGP发展过程:(1)源起“肿瘤计划”搁浅60年代初期,肿瘤发病率在世界各国急剧上升决心在20年内解决肿瘤的早期诊断和治疗斥资几百亿美元,动员全国的力量几乎所有同细胞增殖有关的基因,都与肿瘤有关人类所有疾病,都直接或间接与基因有关(2)提议1985年,能源部(DepartmentofEnergy,DOE)在加州大学圣克鲁滋会议上第一次对人类基因组全部测序进行可行性论证形成“人类基因组计划”草案。(2)提议1986年,诺贝尔奖获得者RenatoDulbecco发表于《Science》杂志的短文《肿瘤研究的转折点:人类基因组测序》中高瞻远瞩地率先向世界公开提出人类基因组计划,并倡导全世界有能力的科学家共同完成这一国际性大课题。“如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。……人类的DNA序列是人类的真谛,这个世界上发生的一切事情,都与这一序列息息相关。”1987年人类基因组创意报告(能源部)1988年人类基因组的作图与测序报告(科学院),同年底国会通过1990年开始实施,预计15年完成,拨款30亿美元.J.Watson担任“国家人类基因组计划研究中心”首任主任1997年:大肠杆菌基因组(5Mb)全部测序完成,毛细管测序仪上市(3)发展1992年:和法国的两支研究队伍分别完成了人类Y染色体和第21条染色体的第一张物理图谱;随后又分别完成了鼠和人的遗传图谱。1993年:位于英国剑桥的Sanger中心加入人类基因组计划,并成为一个重要的测序中心。1994年:与法国完成了人类基因组中的第一个完整遗传连接图谱1996年:各国科学家聚集在百慕大群岛,讨论并通过了充分体现HGP精神(全球共有,国际合作,即时公布,免费共享)的百慕大原则。1998年:CraigVenter宣布成立Celera公司,并宣称将采用“全基因组鸟枪法”完成人类基因组的全部测序。从此,人类基因组测序在“公、私”之间展开了激烈竞争线虫基因组测序完成。
(3)发展1999年:中国获准参加HGP,承担测定人类基因组1%测序任务;英国和共同完成了第一条人染色体—第22条染色体的全部测序工作。(3)发展(3)发展2000年:6月26日,HGP与Celera公司的领导人在白宫的庆祝仪式上共同宣布了人类基因组工作框架图的完成,并约定将双方的研究成果同时发表2000年6月公共领域测序计划工作框架图2000年Celera公司完成了果蝇基因组(180Mb)的全部测序工作,证明了“全基因组鸟枪法”的可行性;德国和的科学家公布了人类第21条染色体的测序结果;第一个植物基因组—拟南芥基因组(125Mb)被全部测序。(3)发展2001年2月:HGP将人类基因组工作框架图发表在《Nature》;Celera公司则将其成果发表在《Science》上。“工作框架图”已能覆盖人类基因组的97%,其中至少92%的序列已组装得准确无误,并显示其中只有3万到3.5万个编码蛋白质的基因,这是人类基因组研究的一个重要里程碑。Celera公司:Science,2001,291:1304-1351
六国科学家:Nature,2001,Vol.409:860
(作者274人,其中中国科学家57人)(3)发展(3)发展2003年4月14日当地时间11时HGP负责人CollinsF.在华盛顿宣布,人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现2006年5月18日人类最后一个染色体-1号染色体基因测序完成,发表在Nature上。至此“生命之书”覆盖基因组99.99%。我国是一个人口大国,丰富的人群遗传资源1994年,在吴旻、强伯勤、陈竺、杨焕明的倡导下启动中国HGP1998年,国家自然科学会和863高科技计划的支持,先后启动了“中华民族基因组中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构和功能研究”;1998年,在上海成立了南方基因中心;1999年,在北京成立了北方人类基因组中心;1999年7月,在国际人类基因组注册,得到完成人类3号染色体短臂上一个约30Mb区域的测序任务,该区域约占人类整个基因组的1%。国际人类基因组
测序任务分配情况遗传图谱转录图谱0.7cM或kb
序列图谱物理图谱100kbSTSmap四张图:遗传图、物理图、序列图、转录图(1)遗传图(geneticmap,又称连锁图)
指基因根据重组频率在染色体上的线形排列和分布。是以具有遗传多态性的遗传标记为路标,以遗传学距离为图距绘制的基因组图。遗传多态性:在某个遗传位点上具有一个以上的等位基因,且其在群体中出现的频率均高于1%。遗传学距离:在减数分裂事件中,两个位点之间进行交换、重组的百分率,规定1%的重组率为1cM(厘摩尔根)。cM值越大,两者之间距离越远。第一代多态性标记:RFLP(restrictionfragmentlengthpolymorphism,限制性片段长度多态性)不同个体的DNA在用某种限制性内切酶水解时,会产生两种不同长度的水解片段。由一个多态性位点出现在某种限制性内切酶的酶切位点上造成的。缺点:数量较少,信息量有限第二代多态性标记
微卫星标记(microsatellitemarker,MS),简短串联重复序列(shorttandemrepeat,STR),短序列长度多态性(shortsequencelengthpolymorphism,SSLP)
重复单元2-6bp,多态性主要来自重复序列拷贝数的变化优点:高度多态性,信息量大,符合孟德尔遗传规律可采PCR使操作自动化CTAGCTTATATATATATATATATATATATAAGCTTGC1994年底,完成由RFLP和STR组成的遗传图谱,第三代多态性标记:单核苷酸的多态性(singlenucleotidepolymorphism,SNP)是由于单个核苷酸改变而导致的核酸序列多态性。
人类基因密码差异不到0.1%,不同人群仅有140万个核苷酸差异。这些差异是SNP产生的,它构成了不同个体的遗传基础。特点:SNP在基因组中的数目多,可达到300万个,平均每1000个碱基对就有一个。因而成为一种信息量非常大的遗传标记系统。SNP可能在密度上达到人类基因组“多态”位点数目的极限。SNP与RFLP、STR等DNA标记的不同,是不再以“长度”的差异作为检测手段,而直接以序列的差异作为标记。SNP为DNA芯片技术应用于遗传作图提供了基础。
定位基因的重要手段,大致了解各个基因或DNA片断之间的相对距离与方向研究人类基因组遗传与变异的重要手段意义:(2)物理图(physicalmap)以已知核苷酸序列的DNA片段为“位标”(STS),以DNA实际长度为图距的基因组图谱。
标记:序列标记位点(sequence-taggedsite,STS)。指基因组中任何单拷贝的长度在100~500bp之间的DNA序列,与核酸内切酶识别序列相关联。在基因组中有明确位置。图距:Mb或Kb主要内容:建立含有STS对应序列的相互重叠连接的DNA片段重叠群(Contig)只要有一定数量的STS标签,所有DNA大片段在该染色体或基因组中的位置都能被确定。1995年,完成分辨率为200kb,以STS为标志的物理制图意义:把遗传学的位点信息转化为基因组位点的物理信息基于STS位点信息的大片段DNA克隆重叠群(clonecontig)提供基因定位的参考依据(3)序列图最详尽的物理图。测定总长约lm、由30亿个核苷酸组成的全序列。既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和HGP的基本目标(4)转录图(基因图谱)
目的:在人类基因组中鉴定出全部基因的位置、结构、功能。方法:把mRNA先分离、定位,再转录成cDNA片段,就构成一张人类基因的转录图。cDNA片段又称表达序列标签(expressedsequencetag,EST)。
EST:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的5'或3'端序列称为表达序列标签(EST),一般长300-500bp左右。意义有效反映在正常或受控条件中表达的全基因的时空图EST除提供序列信息外,同时也提供了该基因表达的组织、生理状况与发育阶段的信息。1990年,提出了HGP的大规模cDNA测序研究战略并建立了EST技术。至1998年,公共数据库中EST序列已达一百多万条,加上各公司已测但未公布的数据,估计现有的EST已包含了绝大多数的人类基因序列。
(1)实验室测序Sanger的末端终止法:在PCR时加入荧光标记的复制终止剂,比如ddA,ddT,ddC,ddG(相应于4种碱基)ddX的两个作用:可以当作正常碱基参与复制一旦链入DNA中,反应终止电泳谁终止,碱基就是谁此方法获1974年的Nobel奖(2)大规模测序与实验室测序的不同实验室测序:手工操作,效率低,结果是第一位的大规模测序:流水线操作,自动化追求稳定、高效、低成本(3)大规模测序基本策略基于BAC的逐个克隆法:先把基因组打碎成200-300kb的片段并制成BAC文库,再对连续克隆系中排定的BAC克隆逐个进一步打碎成小片段,进行亚克隆测序并进行组装(公共领域测序计划)全基因组鸟枪法(Shotgun):直接将基因组分解成小片段随机测序,利用超级计算机进行组装(Celera公司)1)基于BAC的方法全基因组DNA随机打成大片段选择并克隆大片段排序,选择再打碎,克隆,测序,拼接细菌人工染色体(BAC)BacterialArtificialChromosomePlasmidtransformingandcloninginbacteriarangefrom100to300kbpStable2)Shotgun测序DNA片段的制备:将DNA用超声波切成能够测序的小片断转化培养:小片断和载体结合,植入细菌中进行扩增。提质粒:从细菌中提取出繁殖好的质粒电泳检测:检测质量的好坏测序:上测序仪测序Shotgun测序DNA全自动分析仪:ABIPrism®
3700型全自动遗传分析仪安玛西亚DNA序列分析系统型号:MegaBACE500/1000/4000
DNA的鸟枪法测序的优缺点:优点:速度快缺点:●随着所测基因组总量增大,所需测序的片段大量增加●高等真核生物(如人类)基因组中有大量重复序列,导致判断失误拼接错误:Repeat的存在拼接软件的新需求能充分利用正反向测序的配对信息,避免重复序列造成的错误拼接能处理数以百万甚至千万计的数据程序并行化高效率比对能逐步拼接bp组成:个人差异:0.1%外显子1.1%,内含子24%,间隔序列75%基因重复片段高达5.3%人类基因组人类蛋白质61%与果蝇同源43%与线虫同源46%与酵母同源80%与小鼠同源公用基因组浏览器国立卫生研究院(NIH)国立生物技术信息中心(NCBI)的Genbank圣克鲁斯加州大学(UCSC)的UCSC基因组浏览器英国WellcomeTrustSanger研究所和欧洲分子生物学实验所(EMBL)-欧洲生物信息学研究所的总基因组浏览器DNA数据库
EMBL的核苷酸序列数据库的EMBL-Bank,为:
分析序列,描述基因组所有基因的功能,包括研究基因的表达及其调控模式。核心问题:1)基因组多样性的研究2)基因组的表达调控和蛋白质组学的研究3)模式生物体(ModelOrganism)作为
功能基础组学工具
三、后基因组计划1)基因组多样性的研究疾病基因组学通过分析细胞在正常和患病状态下表达基因谱的差异,寻找与疾病发生发展相关的关键基因。
环境基因计划(Enviromentalgenomeproject,EGP)研究对环境发生反应的基因中多态性对其功能的影响以及在流行病学中研究基因与环境的相互作用。先把基因组打碎成200-300kb的片段并制成BAC文库,再对连续克隆系中排定的BAC克隆逐个进一步打碎成小片段,进行亚克隆测序并进行组装(公共领域测序计划)缺点:数量较少,信息量有限斥资几百亿美元,动员全国的力量(Enviromentalgenomeproject,EGP)上海交通大学医学院分子生物学课程追求稳定、高效、低成本上海交通大学医学院分子生物学课程2)基因组的表达调控和蛋白质组学的研究(haplotypemap,HapMap)ModelOrganismsUsedinGenomics高效率比对安玛西亚DNA序列分析系统型号:MegaBACE500/1000/4000几乎所有同细胞增殖有关的基因,都与肿瘤有关指基因组中任何单拷贝的长度在100~500bp之间的DNA序列,与核酸内切酶识别序列相关联。……人类的DNA序列是人类的真谛,这个世界上发生的一切事情,都与这一序列息息相关。至此“生命之书”覆盖基因组99.药物基因组学(Pharmacogenomics)研究所有与药物作用有关的基因在不同个体的多样性,以及这些多样性对药物的疗效、毒性或不良反应等的影响。药物遗传多态性:药物代谢酶、药物受体、药物靶标药物分析:寻找药物靶点,进行大批量药物筛选和分析。药物设计:针对基因组多样性设计更安全有效的个性化治疗方案目标:临床个体化用药数据处理和关联分析发现药物作用对象确定靶目标分子针对靶目标进行合理的药物设计国际单体型图谱计划(haplotypemap,HapMap)绘出人类基因组的单体型模块,以及与此相关的单核苷酸多态性标记。2002年10月启动。单体型:一个染色体区域中所有相关联的SNP等位基因的集合。这些SNP之间高度相关。单体型模块:一个在上从未发生重组,并且只存在几个单倍型的染色体区段。意义:为疾病相关基因寻找提供有效研究工具人类基因组多样性计划(humangenomediversityproject,HGDP)采集世界各地人群标本,鉴定人群基因组的多态性,建立资源库储存世界人群多样性的信息及遗传统计数据和各种生物样本。2)基因组的表达调控和蛋白质组学的研究蛋白质组(proteome):由一个细胞或一个组织的基因组所表达的全部相应的蛋白质。是一个动态的概念。双向凝胶电泳
(2-dimentionalgelelectrophoresis,2-DGE)质谱鉴定(massspectrometry,MS)计算机图像数据处理和蛋白质数据库蛋白质芯片生物信息学以大分子为研究对象,以计算机为工具,运用数学和信息科学的观点、理论和方法去研究生命现象,组织和分析呈指数级增长的生物信息数据的一门学科。由数据库、计算机网络、和应用软件组成。研究热点:序列对比基因识别和DNA序列分析蛋白质结构预测分子进化数据库中知识发现(Knowledgediscoveryindatabase,KDD)常用数据库Thehumangenomeorganization
Genbank
基因图谱
蛋白质结构数据库(PDB)
蛋白质序列数据库(Swiss-Prot)
目的:利用模式生物基因组与人类基因组再编码序列和组织结构上的同源性,用单一或简单的生物模式阐明人类基因组在结构和物种进化的内在联系。3)模式生物体(ModelOrganism)作为
功能基础组学工具要求:成本便宜,供应量高容易安置繁殖容易,世代间隔短,生产量大容易操作处理基因量小而简单。ModelOrganismsUsedinGenomics(1)大肠杆菌(Escherichicoli)原核生物模式生物(2)果蝇
(Drosophlmelanogaster,FruitFly)果蝇是遗传学和分子发育生物学的国王,研究信号传递的模式生物。
日变周期老化性行为成瘾行为(3)美丽线虫
(Caenorhabditiselegans,C.Elegant)第一个完成基因组测序的多细胞生物细胞分裂与分化的调控的研究细胞凋亡的研究6月26日,HGP与Celera公司的领导人在白宫的庆祝仪式上共同宣布了人类基因组工作框架图的完成,并约定将双方的研究成果同时发表“肿瘤计划”搁浅现HGP精神(全球共有,国际合作,即时公布,免费安玛西亚DNA序列分析系统型号:MegaBACE500/1000/40001%,内含子24%,间隔序列75%HGP负责人CollinsF.随机打成大片段选择并克隆优生优育6月26日,HGP与Celera公司的领导人在白宫的庆祝仪式上共同宣布了人类基因组工作框架图的完成,并约定将双方的研究成果同时发表有重复序列存在,小鼠和人类比例最高指基因组中任何单拷贝的长度在100~500bp之间的DNA序列,与核酸内切酶识别序列相关联。意义:为疾病相关基因寻找提供有效研究工具几乎所有同细胞增殖有关的基因,都与肿瘤有关共享)的百慕大原则。细胞分裂与分化的调控的研究(4)酵母(Saccharomycescerevisiae,Yeast)细胞周期核DNA修复的模式酵母双杂交技术的发展(5)小鼠(Musmusculus,Mouse)2002年12月完成基因草图小鼠的蛋白质与已知的人类蛋白质的结构很相似,与人的同源性高达80%理想的模式生物,与人亲缘最近。6)其它模式生物拟南芥(Arabidopsisthaliana)
Nature408:796-815(2000)
第一个植物的全基因组全长125Mb,10条染色体,25,498个基因。共同特征:基因组比较小,编码基因比例高,重复序列少GC含量高,CpG岛比例也较高。和进化程度成反比。有重复序列存在,小鼠和人类比例最高不同物种中,重要生物功能由同源序列基因蛋白承担。同线(Synteny)的同源基因在不同物种基因组中有相同连锁关系生物体复杂性与基因组的C值大小及基因数量未必呈线性关系在基因组图谱和测序基础
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤矿机电设备管理系统技术方案
- 绩效发展咨询服务
- 展会服务合同范本在线看
- 拼花地板购销合同样本
- 个人工作承诺
- 社区安宁餐饮业静音承诺
- 马戏团表演安全保障服务协议
- 终止协议合同的操作
- 版评审表采购合同
- 机电工程招标文件解读与指导
- 博物馆综合安保系统技术方案-工程投标型
- 文华财经-半自动程序化交易使用指南101212
- 全国优质课大赛一等奖人教版高中地理必修一《土壤》精美赛课课件
- 产品合格证标签出厂合格证模板
- GA/T 2007-2022法庭科学气枪弹检验技术规范
- 春节人员流失预控方案
- 《孔乙己》改编剧本
- 化工自动化控制仪表作业安全操作资格培训教材课件
- 绘画心理治疗专家讲座
- 合同Amazon店铺代运营协议模板
- 拉丁字母字体造型规律课件
评论
0/150
提交评论