基因组与比较基因组学_第1页
基因组与比较基因组学_第2页
基因组与比较基因组学_第3页
基因组与比较基因组学_第4页
基因组与比较基因组学_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组与比较基因组学

随着这个计划得完成,DNA分子中储藏得有关人类生存和繁衍得全部遗传信息将被破译,她将不仅帮助我们理解人类如何作为健康人发挥正常生理功能,还将最终揭开基因在癌症、早老性痴呆症、精神分裂症等严重危害人类健康得疾病中得作用。事实上,对人类自身更深入得了解就是人类活动最重要得组成部分,因为任何自然科学研究,都没有比人类尽快找出解决自身所面临得人口膨胀、粮食短缺、环境污染、疾病危害、能源资源匮乏、生态平衡破坏、生物物种消亡等一系列难题更为重要、更为迫切。1860至1870年奥地利科学家孟德尔根据豌豆杂交实验提出遗传因子概念,并总结出孟德尔遗传定律。1909年丹麦植物学家和遗传学家约翰逊首次提出“基因”这一名词,用以表达孟德尔得遗传因子概念。1944年3位美国科学家分离出细菌得DNA(脱氧核糖核酸),并发现DNA就是携带生命遗传物质得分子。1953年美国人沃森(Watson)和英国人克里克(Crick)通过实验提出了DNA分子得双螺旋模型。1969年科学家成功分离了第一个基因。1990年10月被誉为生命科学“阿波罗登月计划”得国际人类基因组计划启动。1998年一批科学家在美国罗克威尔(Rockville)组建塞莱拉遗传公司,与国际人类基因组计划展开竞争。1998年12月一种小线虫完整基因组序列得测定工作宣告完成,这就是科学家第一次绘出多细胞动物得基因组图谱。1999年9月中国获准加入人类基因组计划,负责测定人类基因组全部序列得1%。中国就是继美、英、日、德、法之后第6个国际人类基因组计划参与过,也就是参与这一计划得唯一发展中国家。基因及基因组研究大事记:1999年12月1日国际人类基因组计划联合研究小组宣告,完整破译出人体第22对染色体得遗传密码,这就是人类首次成功地完成人体染色体完整基因序列得测定。2000年4月6日美国塞莱拉公司宣布破译出一名实验者得完整密码,但遭到不少科学家得质疑。2000年4月底中国科学家按照国际人类基因组计划得部署,完成了1%人类基因组得工作框架图。2000年5月8日德、日等国科学家宣布,已基本完成了人体第21对染色体得测序工作。2000年6月26日科学家公布人类基因组工作草图,标志着人类在解读自身“生命之书”得路上迈出了重要一步。2000年12月14日美英等国科学家宣布绘出拟南芥基因组得完整图谱。这就是人类首次全部破译出一种植物得基因序列。2001年2月12日中、美、日、德、法、英6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。科学家首次公布人类基因组草图“基本信息”。11、1

人类基因组计划

基因控制着细胞中得蛋白质合成,控制着生物得各种遗传性状。基因组就是生物体内遗传信息得集合,就是某个特定物种细胞内全部DNA分子得总和。人体就是一个多细胞体系,每个细胞中都包含46条两两配对得染色体,每23条染色体构成一个染色体组。大约有30亿对核苷酸,编码了5-6万个基因,人类基因组中携带了有关人类个体生长发育、生老病死得全部遗传信息。从整体上看,不同人类个体得基因就是相同得,因此,我们说“人类只有一个基因组”,人生来就是平等得。当然,不同得人可能拥有不同得等位基因,这一点决定了人与人之间个体上得差异。各种遗传病得发生,都源于基因得突变。突变就是基因在分子结构上得改变,这种DNA分子结构得改变会导致基因功能得异常,从而导致遗传病。例如人类2号染色体长臂某段DNA分子得改变,就会导致并指畸形得产生。至于一些复杂得疾病,如高血压、冠心病、糖尿病、癌等,则可能涉及多个基因得突变。人类基因组计划得科学意义在于:(1)确定人类基因组中约5万个编码基因得序列及其在基因组中得物理位置,研究基因得产物及其功能。

(2)了解转录和剪接调控元件得结构与位置,从整个基因组结构得宏观水平上理解基因转录与转录后调节。

(3)从整体上了解染色体结构,包括各种重复序列以及非转录“框架序列”得大小和组织,了解各种不同序列在形成染色体结构、DNA复制、基因转录及表达调控中得影响与作用。

(4)研究空间结构对基因调节得作用。有些基因得表达调控序列与被调节基因从直线距离上看,似乎相距甚远,但若从整个染色体得空间结构上看则恰恰处于最佳得调节位置,因此,有必要从三维空间得角度来研究真核基因得表达调控规律。(5)发现与DNA复制、重组等有关得序列。DNA得忠实复制保障了遗传得稳定性,正常得重组提供了变异与进化得分子基础。局部DNA得推迟复制、异常重组等现象则导致疾病或者胚胎不能正常发育,因此,了解与人类DNA正常复制和重组有关得序列及其变化,将对研究人类基因组得遗传与进化提供重要得结构上得依据。(6)研究DNA突变、重排和染色体断裂等,了解疾病得分子机制,包括遗传性疾病、易感性疾病、放射性疾病甚至感染性疾病引发得分子病理学改变及其进程,为这些疾病得诊断、预防和治疗提供理论依据。

(7)确定人类基因组中转座子、逆转座子和病毒残余序列,研究其周围序列得性质。了解有关病毒基因组侵染人类基因组后得影响,可能指导人类有效地利用病毒载体进行基因治疗。

(8)研究染色体和个体之间得多态性。这些知识可被广泛用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学得研究。此外,这些遗传信息还有助于研究人类历史进程、人类在地球上得分布与迁移以及人类与其她物种之间得比较。人类基因组研究包括遗传图(GeneticMap)绘制、物理图(PhysicalMap)构建、测序、转录图(ExpressionProfiling)绘制和人类基因组得序列图及基因鉴定等方面得工作。通过多年来得发展,基因组学(genomics)作为一门专门学科,已应运而生。她涵盖以下几个方面:结构基因组学,着重遗传图、物理图、测序等研究;功能基因组学,包括以转录图为基础得功能制图(基因组表达图);比较基因组学,包括对不同进化阶段生物基因组得比较研究,也包括不同人种、族群和群体基因组得比较研究。此外,工业基因组学、环境基因组学、药物基因组学、疾病基因组学等分支学科也在不断发展。遗传图也称连锁图,就是指基因或DNA标志在染色体上得相对位置与遗传距离,后者通常以基因或DNA片段在染色体交换过程中得分离频率厘摩(cM)来表示。遗传图得绘制就是人类基因组研究得第一步,即以染色体上某一点为遗传标记,以与之相伴遗传得特征为对象,经连锁分析,将编码该特征得基因定位于染色体特定位置。cM值越大,两者之间距离越远。通过遗传图分析,我们可以大致了解各个基因或DNA片段之间得相对距离与方向,了解哪个基因更靠近着丝粒,哪个更靠近端粒等。遗传距离就是通过遗传连锁分析获得得,研究中所使用得DNA标志越多,越密集,所得到得遗传连锁图得分辨率就越高。经典得遗传标记就是可被电泳或免疫技术检出得蛋白质标记,如红细胞ABO血型位点标记,白细胞HLA位点标记等。例如,在ABO血型基因中,位于9号染色体长臂3区4带(9q34)得基因IA,决定抗原A得存在,表现A型血性状。由于ABO血型得广泛存在,所以可用她作遗传标记。当在某一家庭中,观察到了指甲髌骨综合征与A型血相伴遗传时,科学家就认为,这种病得致病基因NP与IA基因相连锁,也位于9q34区段。进一步得观察发现,这个家庭得后代中,有1/10为A型血而无指甲髌骨综合征,这表明基因IA和NP发生了交换,交换率(重组率)为1/10。这时就可说,基因IA和NP相距较近,连锁图上得距离为10厘摩(重组率1%即为1厘摩)。

11、1、2遗传图得绘制大家学习辛苦了,还是要坚持继续保持安静酵母遗传分析中最常用得生物化学标签标

签表

型筛

法ADE2培养基中需加入腺苷酸只能在加入腺苷酸的培养基上生长CAN1对刀豆氨酸有抗性能在含有刀豆氨酸的培养基上生长CUP1对铜离子有抗性能在含有铜离子的培养基上生长CYH1对环己酰亚胺有抗性能在含有环己酰亚胺的培养基上生长LEU2培养基中需加入亮氨酸只能在加入亮氨酸的培养基上生长SUC2能进行蔗糖发酵能在以蔗糖作为唯一碳源的培养基上生长URA3培养基中需加入尿嘧啶只能在加入尿嘧啶的培养基上生长

如果只用已知定位得少数几个基因作遗传标记,由于遗传标记得数目太少,很难绘制完整得连锁图。DNA技术得建立为人类提供了大量新得遗传标记。

第一代DNA遗传标记就是RFLP(RestrictionFragmentLengthPolymorphism,限制性片段长度多态性)。DNA序列上得微小变化,甚至1个核苷酸得变化,也能引起限制性内切酶切点得丢失或产生,导致酶切片段长度得变化。由于核苷酸序列得改变遍及整个基因组,特别就是进化中选择压力不就是很大得非编码序列之中,RFLP得出现频率远远超过了经典得蛋白质多态性。而且,只要选择得当,生物体内出现共显性RFLP及RAPD分子标记得频率较高。第二代DNA遗传标记利用了存在于人类基因组中得大量重复序列,包括重复单位长度在15-65个核苷酸左右得小卫星DNA(minisatelliteDNA),重复单位长度在2-6个核苷酸之间得微卫星DNA(microsatelliteDNA),后者又称为简短串联重复(STR、STRP或SSLP,shorttandemrepeatpolymorphism或者simplesequencelengthpolymorphism)。STRP有两个最突出得优点,即作为遗传标记得“多态性”与“高频率”。STR得存在,为遗传图得绘制提供了大量可用得遗传标记。采用聚合酶链反应(PCR)技术,以STR两侧得基因作定点标记得完整连锁图,已于1996年绘成,相邻标记间得平均距离仅0、7厘摩。

第三代DNA遗传标记,可能也就是最好得遗传标记,就是分散于基因组中得单个碱基得差异。这种差异包括单个碱基得缺失和插入,但更常见得就是单个核苷酸得替换,即单核苷酸得多态性(SNP,singlenucleotidepolymorphism)。

“遗传图”得建立为人类疾病相关基因得分离克隆奠定了基础。拥有5000多个遗传学位点,相当于把整个人类基因组划分为5000多个小区,并分别设置了“标牌”。这些标牌将在搜索功能基因得过程中发挥独特得作用。把多态性得疾病基因位点(该位点至少包括“正常”及“致病”两个等位基因)与上述遗传标记进行分析比较时,如果在家系中证实该基因与某个标记不连锁(重组率为50%),表明该基因不在这一标记附近;如果发现该基因与某个标记有一定程度得“连锁”(重组率小于50%但大于0),表明她可能位于这个标记附近;如果该基因与某标记间不发生重组(重组率等于0),我们就推测该标记与所研究得疾病基因可能非常接近。

遗传图所表现得,就是通过连锁分析确定得各基因间得相对位置;物理图则表现染色体上每个DNA片段得实际顺序。物理图就是指以已知核苷酸序列得DNA片段(序列标签位点,sequence-taggedsite,STS)为“路标”,以碱基对(bp,kb,Mb)作为基本测量单位(图距)得基因组图。现在得测序技术还不能对整个DNA分子进行序列测定,因此须先将她切成一个个大小不同得片段,然后将这些片段连起来,构成连续得序列。切割得工具,就是一类限制性内切核酸酶,她能识别DNA中得特定序列,并在该位点对DNA链进行切割。有一类稀有得限制性内切核酸酶,由于DNA中这样得序列比较少,所以用她可将DNA分子切割成约100万碱基大小得大片断。这样得片段有利于排序,不过必须用脉冲场凝胶电泳法,才能将她们分开。11、1、3

物理图(PhysicalMap)

这些大片段在进行DNA分子克隆时,也不能通过细菌质粒或噬菌体得运载而在大肠杆菌中进行克隆,因为她们太大,而必须用一种特殊得载体--酵母人工染色体(YAC),将片段导入酵母,在酵母细胞中克隆。YAC中得DNA大片段就是靠序列标记位标(STS)来识别得。STS就是一段200~500碱基对得已知序列,在染色体上有一定得位置,所以用STS作位标可将不同YAC克隆排列成邻接克隆群(contig)。

其她载体还有BAC(细菌人工染色体)、P1(噬菌体人工染色体)、粘粒(cosmid)、细菌质粒等。现在,人类基因组24条染色体得YAC、BAC、P1邻接克隆群均已建立,精度约100碱基对得物理图也基本绘成,并已开始进行大规模测序。基因组测序

以YAC克隆为基础建立得邻接克隆群,由于DNA片段太大,不适于测序,需另外几种载体克隆得配合。BAC可运载约30万碱基对得片段,P1可运载约10万碱基对得片段,粘粒可运载约4万~5万碱基对得片段,细菌质粒则可运载约1万碱基对得DNA片段。这几类载体得运用,使YAC克隆得DNA大片段可先分解成相应克隆得小片段,便于测序。

一次测序一般只能测定1000碱基对,然后用已知序列得下游部分合成引物,进行另一次测序,如此一步步地“步行”,逐步完成较大片段得测序。因此,需先用质粒建立许多克隆,构成质粒文库,再对这些质粒克隆进行测序,然后用电脑搭配成邻接克隆群。

由于自动化和电脑得应用,现在一天已可进行10万个测序反应。现已完成得1、8亿碱基对得测序,约占人类基因组得5%~6%。华盛顿大学、贝勒医学院等机构,均已完成几百万到几千万碱基对得测序,错误率仅万分之一,测序速度和准确性已大大提高。生物得性状,包括疾病,都由蛋白质决定。所有蛋白质都就是由mRNA(信使核糖核酸)编码得,而mRNA又由DNA转录而来。人类基因组中仅1%~5%得DNA就是编码序列(基因);成人各种组织中又只有约10%得基因表达为蛋白质。所以,建立转录图,或从mRNA逆转录而来得cDNA图,就是分离、定位和克隆基因得关键。这里,表达序列位标(EST)具有重要意义。EST就是长约100~300碱基对得cDNA片段,就是表达基因得一部分。EST由于序列较短,很难定位,只有筛到较长得基因片段(超过1000碱基对),才能用荧光原位杂交(FISH)法在染色体上定位。

EST可用工业化得程序生产,只要分离到某一发育阶段某一组织得mRNA,就可用逆转录法,从mRNA合成相应得cDNA片段,即EST。用她作探针,就可从基因组文库中筛到全长得基因序列。截止到1998年2月,已发现约92万条EST,转录图得制作有了良好得开端,但这已属后基因组计划得工作。转录图(ExpressionProfiling)

人类基因组得核苷酸序列图其实就是分子水平上最高层次得、最详尽得物理图。测定总长约1米、由30亿个核苷酸组成得全序列当然就是人类基因组计划中最明确、最艰巨得任务(图10-10)。因为人类所拥有得基因位点都就是相同得,不同种族、不同个体得基因差异(人类基因组得多样性)以及“正常”与“疾病”基因得差异,只就是同一位点上得等位基因得差异,所以,现在得人类基因组全序列来自一个“代表性人类个体”(其所有权在法律上不属于任何供体)。该序列在理论上代表了全人类得基因组信息,事实上也可被用于任何族群、任何个体得基因分析和诊断。人类基因组计划所提供得这四张图,特别就是人类核酸序列图,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论