比较基因组学课件_第1页
比较基因组学课件_第2页
比较基因组学课件_第3页
比较基因组学课件_第4页
比较基因组学课件_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2022/11/12比较基因组学

Comparativegenomics

何光源中英联合实验室2022/11/10比较基因组学

Comparativeg1比较基因组学的基本概念比较基因组学的应用比较基因组学的研究方法比较基因组学与进化模式生物与比较基因组学研究比较基因组学的基本概念22022/11/12比较基因组学的基本概念2022/11/10比较基因组学的基本概念32022/11/12物种完成年份总长度Mb已完成总长的百分数/%占常染色质百分数/Mb基因数/Mb酵母19961293100483线虫19989699100197果蝇20001166497117拟南芥200011592100221人类第22染色体199934709716人类第21染色体200033751007人类全基因组(PublicSequence)20012693849012人类全基因组(CeleraSequence)200126548399-9315基本完成DNA序列分析的真核生物基因组比较2022/11/10物种完成年份总长度Mb已完成总长的百分数41999年12月1日,人体第22对染色体的遗传密码破译,人类首次成功完成人体染色体基因完整序列的测定,英、美、日三国研究人员合作完成第二小的染色体,34Mb,发现679个基因,55%新发现;先天性心脏病、免疫功能低下、精神分裂症、智力低下、出生缺陷以及许多恶性肿瘤(白血病);679个基因中,545个是功能基因;134个是假基因,曾经发生过作用,但现在已不再发挥功能;200~300个功能和结构尚待确认的基因;160个人体基因与小鼠基因遗传密码相似,找到人类和生物在进化过程中更深层的秘密。1999年12月1日,人体第22对染色体的遗传密码破译,人类52000年5月德国和日本科学家完成人体第21对染色体测序最小的一对:33Mb,人体全部的1%;127个基因,估计还存在98个基因;多种遗传疾病相关基因白血病唐氏综合症阿尔茨海默症躁郁症:《躁狂抑郁多才俊》

肌肉萎缩性侧索硬化症2000年5月德国和日本科学家完成人体第21对染色体测序6Down综合征DSDownSyndrome21三体综合征、先天愚型染色体结构畸变所致的疾病,患者核型为47,XX(XY)、+21★妊娠前后,孕妇有病毒感染史,如流感、风疹等;★受孕时,夫妻一方染色体异常;★夫妻一方年龄较大;★妊娠前后,孕妇服用致畸药物,如四环素等;★夫妻一方长期在放射性荧幕下工作或污染环境下工作;★习惯性流产史、早产或死胎的孕妇;★长期饲养宠物者。

Down综合征DSDownSyndrome7第一章剖析天才第二章躁狂抑郁症第三章牛顿第四章贝多芬第五章狄更斯第六章梵·高第七章减弱创造力第八章增强天才第一章剖析天才8比较基因组学课件92006年05月1号染色体的基因测序完成,“生命之书”的最后一个章节150名英国和美国科学家、10年,块头最大;2.23亿bp,基因数量最多,达3141个,是平均水平的两倍,破译难度最大;350余种疾病:癌症、帕金森氏症、老年痴呆症、孤独症、智障;发掘出诊断和治疗5000多种遗传疾病以及恶性肿瘤、心血管疾病和其他严重疾患的方法,阻止甚至扭转一些疾病的遗传;神经生物学、细胞生物学、发育生物学相关学科发展。2006年05月1号染色体的基因测序完成,“生命之书”102022/11/12比较基因组学定义利用不同物种基因组之间功能区域序列上、组织结构上的同源性;对系统发育中的代表性物种之间的基因和基因家族的比较分析;构建系统发育的遗传图谱;克隆新基因;揭示基因与基因家族的起源、功能、进化过程中复杂化和多样化的机制。

back2022/11/10比较基因组学定义利用不同物种基因组之间功112022/11/12比较基因组学的应用染色体片段的分析序列的比对分析,物种序列的优化选择对DNA序列的信息注释发现新基因揭示非编码功能序列发现功能性SNP确定基因组序列的进化关系,阐述物种间的进化史阐明人类疾病过程的分子机制。back2022/11/10比较基因组学的应用染色体片段的分析bac12比较基因组学的研究方法基因组比较作图

Comparativemapping基于基因组全序列的比较基因组学研究基于DNA芯片技术的比较基因组学研究2022/11/12比较基因组学的研究方法基因组比较作图2022/11/1013基因组比较作图Comparativemapping利用共同的遗传标记(分子标记、cDNA克隆、基因克隆)对相关物种进行遗传/物理作图;比较遗传标记在相关物种基因组中的分布情况,揭示物种间DNA或DNA片段上的同线性synteny、共线性collinearity、微共线性microsynteny;对相关物种的基因组结构、基因组进化历程进行精确分析。2022/11/12基因组比较作图Comparativemapping202214同线性synteny

:相关物种间同源染色体或染色体片段上存在共同的遗传标记,但这些标记间的相对顺序可能存在差异;共线性collinearity

:高度同线性,共同的遗传标记且标记排列顺序保守;微共线性:一个小的基因组区域内(一段特定的DNA序列)存在共线性的情形。YAC或BAC克隆的限制性图谱、DNA测序,比较分析发现基因组的微共线性。2022/11/12同线性synteny:相关物种间同源染色体或染色体片段上存15理想分子标记特点:直接来自于基因表达序列、不同遗传背景(如杂交组合)下可进行信息传输、共显性。

RFLP、SSR、ESTRFLP标记--初期使用共显性遗传标记;由于标记数目和群体大小的限制,分辨率不高,共线性区段往往在5~10cM之内,错过分析缺失、重复和倒位的情况。2022/11/12理想分子标记特点:2022/11/1016SSR--SimpleSequenceRepeats,STMS

sequencetaggedmicrosatellitesite数量丰富、覆盖整个基因组;重复单位数目的高度变异性,揭示高度多态性;具有复等位基因的特性,信息量丰富;以孟德尔方式遗传,呈共显性;侧翼序列保守,设计特异引物PCR,便于不同的实验室相互交流合作开发引物;引物设计、PCR扩增、PAGE电泳分析、QuantityOne(BIO-RAD)软件统计、NTSYS软件计算出遗传相似性系数、UPGMA聚类分析构建聚类图。2022/11/12SSR--SimpleSequenceRepeats,17ESTExpressedSequenceTag

高度保守且结构特殊性:来自于基因表达序列或直接来自候选基因candidategenes;跨越家系与种的限制,亲缘关系较远的物种间比较作图;分子标记:构建基因组遗传图谱与物理图谱、探针、用于定位克隆、寻找新基因、基因功能研究、生物群体多态性研究、药物开发、品种改良、基因芯片。ESTExpressedSequenceTag18基于基因组全序列的比较基因组学研究完成全基因组测序,

针对全基因组序列进行比较分析,可精确到单碱基差异;比较已有的全基因组序列,

如拟南芥、水稻、杨树等,进行系列研究,进展迅速;全基因组测序工程浩大,耗费巨大,不可能对所有研究的物种采用这种方式进行比较基因组研究。2022/11/12基于基因组全序列的比较基因组学研究2022/11/1019基于芯片技术的比较基因组学研究

以已知序列基因组为参考,通过芯片技术,进行未测序基因组与参考基因组间的比较基因组杂交分析;检测待比较基因组中对应DNA区域的存在、缺失、变异;成本较低,研究结果可靠性较高,应用前景广阔。2022/11/12基于芯片技术的比较基因组学研究2022/11/10202022/11/12基因组成的相似性基因共线性:基因排列顺序的一致性;宏观共线性:遗传连锁图上锚定标记排列次序的一致性;微观共线性:物理图上基因序列的一致排列;进化距离非常近的物种间保持很好的微观共线性;在进化过程中,基因共线性被各种因素所破坏,进化距离越远的物种之间基因共线性越差;物种间共线性程度可作为衡量它们之间进化距离的尺度。2022/11/10212022/11/12高度保守和高度变异X染色体极为保守,人类和猫的X染色体具有纵贯全条的共线性;在保守性较低的区段,基因进化速率快于整个基因组的平均进化速率;种间基因组中很少表现共线性;甚至在同一物种的不同生态型之间这些区段也会发生较大变异;当用基因共线性程度估算物种分化年代时,应当注意避免高度保守和高度变异的区段。2022/11/10高度保守和高度变异222022/11/122022/11/10232022/11/12破坏基因组共线性的因素转座插入染色体重排区段加倍和缺失。2022/11/10破坏基因组共线性的因素242022/11/12基因岛和基因协同进化基因岛:区段基因密度远远高于全基因组的平均密度。可能通过基因水平转移(horizontalgenetransfer,HGT)进入基因组;

基因岛中的基因群通常具有功能上的相关性;协同丢失和协同进化;多种生物功能:病原性基因岛、抗性基因岛。

2022/11/10基因岛和基因协同进化基因岛:区段基因密度252022/11/12图位克隆--跨物种基因克隆有效的基因克隆技术,随着植物分子标记遗传图谱的建立和基因分子定位而发展起来;根据基因组研究提供的高密度遗传图谱、大尺寸物理图谱、大片段基因组文库和基因组全序列,利用分子标记辅助,直接克隆基因;无需事先知道基因的DNA序列,无需了解基因的表达产物;首先在拟南芥中取得成功,后来在番茄、大麦、小麦、甜菜、水稻,理论上适用于一切基因在水稻中运用该技术分离出抗白叶枯病基因Xa-21、Xa-1,抗稻瘟病基因Pi-b和矮生突变基因D1。在基因组较小的模式植物中,分离被精确定位在大基因组中的基因;避免大量重复序列的干扰,减少染色体步移的次数。2022/11/10图位克隆--跨物种基因克隆262022/11/12直系同源集簇由祖先基因衍生的一组基因种间同源物:不同基因组中执行同一生物学功能;种内同源物(平行基因):同一基因组中因基因加倍产生;预测新基因功能。back2022/11/10直系同源集簇由祖先基因衍生的一组基因ba272022/11/12比较基因组学与进化

古细菌产甲烷球菌与原核生物比较共同的染色体组织与结构:环状基因组、基因的操纵子结构;能量产生和固氮基因:与原核生物有很高同源性;蛋白质编码基因:与细胞分裂相关蛋白质、20多个无机离子运输蛋白的ORF,与原核生物同源;调控模式:类似于原核生物。2022/11/10比较基因组学与进化古细菌产甲282022/11/12与真核生物比较细胞遗传信息传递:转录和翻译系统;分泌系统;比较基因组学研究在进化系统树上,古细菌与真核生物亲缘关系比原核生物更近。在自养生物的三个分支,细菌、古细菌和真核生物中,细菌的分化发生较早。back2022/11/10与真核生物比较back292022/11/12模式生物与比较基因组学研究模式生物原核生物酵母线虫果蝇小鼠、人类拟南芥、水稻、玉米、小麦2022/11/10模式生物与比较基因组学研究模式生物30模式生物

modelorganism生物的一个物种species,在研究生命现象的过程中长期、反复地被作为研究材料;其许多生命活动规律往往代表了许多物种共同的规律;对其形态、解剖、生理、生化、细胞及遗传进行全面分析和归纳;将对其研究中得出的规律,推演到相关的生物物种中,以加快其他各种生物研究的步伐。模式生物modelorganism生物的一个物种spec31模式生物具备的基本条件容易培养,成本低廉,随时获取以供实验研究,繁殖周期短;能在短时间内产生大量的后代,满足研究分析的需求;十分方便地取得种内的遗传变异体;已经过长期研究取得该物种的丰富背景信息。模式生物具备的基本条件容易培养,成本低廉,随时获取以供实验研322022/11/12模式生物基因组研究特点1“压缩”的基因组:基因组通常比较小,编码基因比例较高,重复序列和非编码序列较少;2模式生物基因组中G+C%含量高,同时CpG岛的比例也比较高;3在模式生物特别在人的基因组中发现了重复duplication;2022/11/10模式生物基因组研究特点1“压缩”的基因332022/11/12模式生物比较基因组研究特点4在各种不同的物种中大多数的重要生物学功能是由相当数量的同源序列基因(Orthologous)蛋白承担;5同线(synteny)连锁的同源基因在不同物种基因组中有相同连锁关系;6生物体的复杂性一般表现在“生物学”的复杂性,与基因组的C值大小及基因数量未必一定呈线性关系--C值悖论。back2022/11/10模式生物比较基因组研究特点4在各种不同342022/11/12原核模式生物比较基因组学尿殖道支原体--已知最小的基因组0.58Mb,由此确定能自我复制的细胞必需的一套最少的核心基因;流感嗜血杆菌的基因组为1.83Mb;?基因组大小影响了基因数目还是基因尺度。2022/11/10原核模式生物比较基因组学尿殖道支原体--352022/11/12原核模式生物比较基因组学基因大小:流感嗜血杆菌基因平均900bp,尿殖道支原体的基因为1040bp,差不多;基因密度:流感嗜血杆菌中平均1042bp有1个基因,尿殖道支原体中平均1235bp有1个基因;基因数量的差异:流感嗜血杆菌基因组有1743个ORF,而尿殖道支原体只有470个ORF。

2022/11/10原核模式生物比较基因组学基因大小:流感嗜362022/11/12原核模式生物比较基因组学比较尿殖道支原体与流感嗜血杆菌这两个亲缘关系较远的生物基因组;

选取其共同的基因(共240个);再加上一些其他基因;组成一套含256个基因的最小基因组。back2022/11/10原核模式生物比较基因组学比较尿殖道支原体372022/11/12酿酒酵母基因组

—最简单的真核生物基因组:12,068kb,比单细胞的原核生物和古细菌大一个数量级;基因数:ORF

5887,比原核生物和古细菌要多很多;基因密度:1个基因/2kb,密度小于流感嗜血杆菌和尿殖道支原体。酿酒酵母--最小的真核基因组裂殖酵母其次:密度是1/2.3kb,13.8Mb线虫:简单多细胞生物,基因密度为1/30kb。内含子:酿酒酵母4%的编码基因有内含子,裂殖酵母有40%编码基因有内含子。2022/11/10酿酒酵母基因组

—最简单382022/11/12酵母良好的实验系统

单细胞,可在特定的培养基上生长,能够完全控制其化学和物理环境。酵母的生命周期也很适合被用来作遗传分析,可以构建一套16条染色体单倍型的详尽的图谱。可将其6000个基因中的任何一个用突变的等位基因替代或准确地从基因组中缺失。back2022/11/10酵母良好的实验系统单细39线虫简单多细胞生物减数分裂细胞核外形细胞分裂胚胎形态的发育

back线虫简单多细胞生物back402022/11/12果蝇基因组果蝇基因组全长120mb,2/3是euchromatin,1/3是heterochromatin;BlastSearch确定有14113个转录产物(功能基因)。

Science,287:2185-2195(2000)

2022/11/10果蝇基因组果蝇基因组全长120mb,2/412022/11/12人类基因组的一个片段2022/11/10人类基因组的一个片段422022/11/122022/11/10432022/11/12人类染色体组型姬母萨染色的G带模式图2022/11/10人类染色体组型姬母萨染色的G带模式图442022/11/122022/11/10452022/11/12

人类基因组基因的三条推测依据

根据已测定大片段DNA中ORF的比例;

CpGisland的个数(56%的已知基因5’都与CpG相连,而人基因组中有45000个Islands)ESTs2022/11/10人类基因组基因的三条推测依据

462022/11/12

模式生物基因组研究对人类基因组研究的促进作用1利用基因序列上的同源性克隆人类疾病基因

人类cDNA与已知功能的模式生物基因高度相关,该表型的候选基因定位于与cDNA相同的位置上,就有助于识别该基因。人类基因组与酵母30%基因对应,小鼠99%对应2022/11/10

模式生物基因组研究对人类基因472022/11/12模式生物基因组研究对人类基因组研究的促进作用2模式生物基因组研究揭示了人类疾病基因的功能某些模式生物基因的功能已知,对人类疾病基因的功能研究有很大的促进作用。

跨种关系使模式生物基因的有效功能数据立刻用于研究它的高等生物的同源体。2022/11/10模式生物基因组研究对人类基因组研究的促进482022/11/12模式生物基因组研究对人类基因组研究的促进作用3充分利用模式生物实验系统上的优越性模式生物实验上的优越性成为人类疾病状态下分子机制的阐明和基因功能分析的有效手段。酵母一个很好的实验系统。2022/11/10模式生物基因组研究对人类基因组研究的促进49与定位克隆的人类疾病基因高度同源的酿酒酵母基因人类疾病人类基因人类cDNA

GenBank登记号酵母基因酵母cDNA

GenBank登记号酵母基因功能遗传性非息肉性小肠癌MSH2U03911MSH2M84170DNA修复蛋白遗传性非息肉性小肠癌MLH1U07418MLH1U07187DNA修复蛋白囊性纤维变性CFTRN28668YCF1L35237金属抗性蛋白威尔逊氏病WNDU11700CCC2L36317铜转运器甘油激酶缺乏症GKL13943GUT1X69049甘油激酶布卢姆氏综合症BLMU39817SGS1U22341蜗牛酶X-连锁的肾上腺脑白质营养不良ALDZ21876PAL1L38491过氧化物酶转运器共济失调性毛细血管扩张症ATMU26455TEL1U31331P13激酶肌萎缩性脊髓侧索硬化SOD1K00065SOD1J03279过氧化物歧化酶营养不良性肌萎缩DML19268YPK1M21307丝氨酸/苏氨酸蛋白激酶勒韦氏综合症OCRLM88162YIL002CX47047IPP-5-磷酸酶I-型神经纤维瘤NF1M89914IRA2M33779抑制性的调节蛋白与定位克隆的人类疾病基因高度同源的酿酒酵母基因人类疾病人类基502022/11/12模式生物基因组研究对人类基因组研究的促进作用4比较基因组作图在人类基因组研究中的应用。应用一:使连锁信息和基因组资源从作图较为详尽的物种转移到作图不完善的物种例如:通过定位一套在哺乳动物中进化上保守的位点,把这些保守位点作为出发点,使连锁信息从人、鼠等物种扩展到牛、猪、羊等物种,以促进基因组研究。2022/11/10模式生物基因组研究对人类基因组研究的促进512022/11/12模式生物基因组研究对人类基因组研究的促进作用

应用二:通过比较基因组作图,进行复杂性状的分析。许多遗传性状由多基因控制,这些基因的识别在小鼠中比人容易。一个候选疾病基因或疾病区域在小鼠中确认,就可以筛选同源基因或同源区域,看看是否与人类遗传病相对应。2022/11/10模式生物基因组研究对人类基因组研究的促进52小鼠—十分重要的模式生物繁殖率高、近交系;对多种毒素和病原体易感;对致癌物敏感,自发性肿瘤多;药物筛选、药效、毒性试验、肿瘤模型

小鼠—十分重要的模式生物繁殖率高、近交系;532022/11/12模式生物基因组研究加深了对基因组结构的认识人类的基因很大,在人类基因组全部测序完成之前,已有一些cDNA上测序。所以其基因组结构可能尚属未知。利用低等模式生物基因组较小、呈压缩状态,就可能用节约的方法在基因组水平上测序。展示基因组的结构,包括内含子和外显子的边界和周围序列,还可能包括调节因子,如启动子和增强子。不但为基因结构的研究,也为相关基因的进化提供了信息。2022/11/10模式生物基因组研究加深了对基因组结构的认542022/11/12

利用模式生物基因组研究信息研究人类疾病基因的可行性定位克隆是一项有效的疾病基因克隆的手段。但是如果仅仅依靠位置信息进行定位克隆,将十分费时费力。比较生物学这个名词在许多文献中出现,模式生物基因组研究的结果被大量地用于人类基因组的研究,成为人类疾病基因克隆的一条捷径。back2022/11/10

利用模式生物基因组研究信息研究人类疾55神奇的拟南芥神奇的拟南芥56拟南芥优势植株小,15cm高,最高30~40cm;占用空间小;可温室和培养皿培养。取材方便,生长易于控制;生活周期很短,一个生活周期6~8周,无明显季节性;每株可产上万粒种子,为子代性状分析提供足够群体,易于扩增变异株种子库,理想的诱变实验材料;典型的自交繁殖植物,开花后一般为自体受精,人工诱变后直接筛选变异株的纯合子;亦可进行异花授粉,实现人工杂交;经人工诱变或天然群体筛选可产生十分理想的突变株;二倍体,其单倍体染色体数为5;最小高等植物基因组,115Mb(玉米6600Mb,小麦16000Mb,水稻450Mb),三个基因组全序列均完成;完成了大量的基础研究,十分丰富的基础信息,大量突变体,成熟转化方法等。拟南芥优势植株小,15cm高,最高30~40cm;占用空间小572000年12月,第一个植物基因组拟南芥被全部测序,全长125Mb

十字花科的显花植物(地球上的统治者,为地球大陆提供绿色外衣,为动物提供食物、氧气)

近缘物种:油菜、卷心菜、甘蓝生活周期短--6周植株较小、一个植株产生很多种子5条染色体构成,包含约1.2亿个碱基对、编码约2.57万个基因2000年12月,第一个植物基因组拟南芥被全部测序,全长1258水稻重要的粮食作物;单子叶植物基因组研究的模式植物;应用经典遗传学理论,20世纪60年代以矮化育种为标志的“绿色革命”和70年代的水稻杂种优势利用,使水稻产量有了前所未有的突破之后水稻产量停滞不前21世纪新的“绿色革命”--基因组的研究水稻重要的粮食作物;59小麦异源六倍体,含有A、B和D三个基因组水稻基因组的40倍、人类基因组的5.5倍

中科院遗传与发育生物学研究所与深圳华大基因研究院等合作,完成了小麦A基因组草图的绘制,开启了全面破译小麦基因组的序幕。3月24日,《Nature》发表。小麦异源六倍体,含有A、B和D三个基因组602022/11/12比较基因组学

Comparativegenomics

何光源中英联合实验室2022/11/10比较基因组学

Comparativeg61比较基因组学的基本概念比较基因组学的应用比较基因组学的研究方法比较基因组学与进化模式生物与比较基因组学研究比较基因组学的基本概念622022/11/12比较基因组学的基本概念2022/11/10比较基因组学的基本概念632022/11/12物种完成年份总长度Mb已完成总长的百分数/%占常染色质百分数/Mb基因数/Mb酵母19961293100483线虫19989699100197果蝇20001166497117拟南芥200011592100221人类第22染色体199934709716人类第21染色体200033751007人类全基因组(PublicSequence)20012693849012人类全基因组(CeleraSequence)200126548399-9315基本完成DNA序列分析的真核生物基因组比较2022/11/10物种完成年份总长度Mb已完成总长的百分数641999年12月1日,人体第22对染色体的遗传密码破译,人类首次成功完成人体染色体基因完整序列的测定,英、美、日三国研究人员合作完成第二小的染色体,34Mb,发现679个基因,55%新发现;先天性心脏病、免疫功能低下、精神分裂症、智力低下、出生缺陷以及许多恶性肿瘤(白血病);679个基因中,545个是功能基因;134个是假基因,曾经发生过作用,但现在已不再发挥功能;200~300个功能和结构尚待确认的基因;160个人体基因与小鼠基因遗传密码相似,找到人类和生物在进化过程中更深层的秘密。1999年12月1日,人体第22对染色体的遗传密码破译,人类652000年5月德国和日本科学家完成人体第21对染色体测序最小的一对:33Mb,人体全部的1%;127个基因,估计还存在98个基因;多种遗传疾病相关基因白血病唐氏综合症阿尔茨海默症躁郁症:《躁狂抑郁多才俊》

肌肉萎缩性侧索硬化症2000年5月德国和日本科学家完成人体第21对染色体测序66Down综合征DSDownSyndrome21三体综合征、先天愚型染色体结构畸变所致的疾病,患者核型为47,XX(XY)、+21★妊娠前后,孕妇有病毒感染史,如流感、风疹等;★受孕时,夫妻一方染色体异常;★夫妻一方年龄较大;★妊娠前后,孕妇服用致畸药物,如四环素等;★夫妻一方长期在放射性荧幕下工作或污染环境下工作;★习惯性流产史、早产或死胎的孕妇;★长期饲养宠物者。

Down综合征DSDownSyndrome67第一章剖析天才第二章躁狂抑郁症第三章牛顿第四章贝多芬第五章狄更斯第六章梵·高第七章减弱创造力第八章增强天才第一章剖析天才68比较基因组学课件692006年05月1号染色体的基因测序完成,“生命之书”的最后一个章节150名英国和美国科学家、10年,块头最大;2.23亿bp,基因数量最多,达3141个,是平均水平的两倍,破译难度最大;350余种疾病:癌症、帕金森氏症、老年痴呆症、孤独症、智障;发掘出诊断和治疗5000多种遗传疾病以及恶性肿瘤、心血管疾病和其他严重疾患的方法,阻止甚至扭转一些疾病的遗传;神经生物学、细胞生物学、发育生物学相关学科发展。2006年05月1号染色体的基因测序完成,“生命之书”702022/11/12比较基因组学定义利用不同物种基因组之间功能区域序列上、组织结构上的同源性;对系统发育中的代表性物种之间的基因和基因家族的比较分析;构建系统发育的遗传图谱;克隆新基因;揭示基因与基因家族的起源、功能、进化过程中复杂化和多样化的机制。

back2022/11/10比较基因组学定义利用不同物种基因组之间功712022/11/12比较基因组学的应用染色体片段的分析序列的比对分析,物种序列的优化选择对DNA序列的信息注释发现新基因揭示非编码功能序列发现功能性SNP确定基因组序列的进化关系,阐述物种间的进化史阐明人类疾病过程的分子机制。back2022/11/10比较基因组学的应用染色体片段的分析bac72比较基因组学的研究方法基因组比较作图

Comparativemapping基于基因组全序列的比较基因组学研究基于DNA芯片技术的比较基因组学研究2022/11/12比较基因组学的研究方法基因组比较作图2022/11/1073基因组比较作图Comparativemapping利用共同的遗传标记(分子标记、cDNA克隆、基因克隆)对相关物种进行遗传/物理作图;比较遗传标记在相关物种基因组中的分布情况,揭示物种间DNA或DNA片段上的同线性synteny、共线性collinearity、微共线性microsynteny;对相关物种的基因组结构、基因组进化历程进行精确分析。2022/11/12基因组比较作图Comparativemapping202274同线性synteny

:相关物种间同源染色体或染色体片段上存在共同的遗传标记,但这些标记间的相对顺序可能存在差异;共线性collinearity

:高度同线性,共同的遗传标记且标记排列顺序保守;微共线性:一个小的基因组区域内(一段特定的DNA序列)存在共线性的情形。YAC或BAC克隆的限制性图谱、DNA测序,比较分析发现基因组的微共线性。2022/11/12同线性synteny:相关物种间同源染色体或染色体片段上存75理想分子标记特点:直接来自于基因表达序列、不同遗传背景(如杂交组合)下可进行信息传输、共显性。

RFLP、SSR、ESTRFLP标记--初期使用共显性遗传标记;由于标记数目和群体大小的限制,分辨率不高,共线性区段往往在5~10cM之内,错过分析缺失、重复和倒位的情况。2022/11/12理想分子标记特点:2022/11/1076SSR--SimpleSequenceRepeats,STMS

sequencetaggedmicrosatellitesite数量丰富、覆盖整个基因组;重复单位数目的高度变异性,揭示高度多态性;具有复等位基因的特性,信息量丰富;以孟德尔方式遗传,呈共显性;侧翼序列保守,设计特异引物PCR,便于不同的实验室相互交流合作开发引物;引物设计、PCR扩增、PAGE电泳分析、QuantityOne(BIO-RAD)软件统计、NTSYS软件计算出遗传相似性系数、UPGMA聚类分析构建聚类图。2022/11/12SSR--SimpleSequenceRepeats,77ESTExpressedSequenceTag

高度保守且结构特殊性:来自于基因表达序列或直接来自候选基因candidategenes;跨越家系与种的限制,亲缘关系较远的物种间比较作图;分子标记:构建基因组遗传图谱与物理图谱、探针、用于定位克隆、寻找新基因、基因功能研究、生物群体多态性研究、药物开发、品种改良、基因芯片。ESTExpressedSequenceTag78基于基因组全序列的比较基因组学研究完成全基因组测序,

针对全基因组序列进行比较分析,可精确到单碱基差异;比较已有的全基因组序列,

如拟南芥、水稻、杨树等,进行系列研究,进展迅速;全基因组测序工程浩大,耗费巨大,不可能对所有研究的物种采用这种方式进行比较基因组研究。2022/11/12基于基因组全序列的比较基因组学研究2022/11/1079基于芯片技术的比较基因组学研究

以已知序列基因组为参考,通过芯片技术,进行未测序基因组与参考基因组间的比较基因组杂交分析;检测待比较基因组中对应DNA区域的存在、缺失、变异;成本较低,研究结果可靠性较高,应用前景广阔。2022/11/12基于芯片技术的比较基因组学研究2022/11/10802022/11/12基因组成的相似性基因共线性:基因排列顺序的一致性;宏观共线性:遗传连锁图上锚定标记排列次序的一致性;微观共线性:物理图上基因序列的一致排列;进化距离非常近的物种间保持很好的微观共线性;在进化过程中,基因共线性被各种因素所破坏,进化距离越远的物种之间基因共线性越差;物种间共线性程度可作为衡量它们之间进化距离的尺度。2022/11/10812022/11/12高度保守和高度变异X染色体极为保守,人类和猫的X染色体具有纵贯全条的共线性;在保守性较低的区段,基因进化速率快于整个基因组的平均进化速率;种间基因组中很少表现共线性;甚至在同一物种的不同生态型之间这些区段也会发生较大变异;当用基因共线性程度估算物种分化年代时,应当注意避免高度保守和高度变异的区段。2022/11/10高度保守和高度变异822022/11/122022/11/10832022/11/12破坏基因组共线性的因素转座插入染色体重排区段加倍和缺失。2022/11/10破坏基因组共线性的因素842022/11/12基因岛和基因协同进化基因岛:区段基因密度远远高于全基因组的平均密度。可能通过基因水平转移(horizontalgenetransfer,HGT)进入基因组;

基因岛中的基因群通常具有功能上的相关性;协同丢失和协同进化;多种生物功能:病原性基因岛、抗性基因岛。

2022/11/10基因岛和基因协同进化基因岛:区段基因密度852022/11/12图位克隆--跨物种基因克隆有效的基因克隆技术,随着植物分子标记遗传图谱的建立和基因分子定位而发展起来;根据基因组研究提供的高密度遗传图谱、大尺寸物理图谱、大片段基因组文库和基因组全序列,利用分子标记辅助,直接克隆基因;无需事先知道基因的DNA序列,无需了解基因的表达产物;首先在拟南芥中取得成功,后来在番茄、大麦、小麦、甜菜、水稻,理论上适用于一切基因在水稻中运用该技术分离出抗白叶枯病基因Xa-21、Xa-1,抗稻瘟病基因Pi-b和矮生突变基因D1。在基因组较小的模式植物中,分离被精确定位在大基因组中的基因;避免大量重复序列的干扰,减少染色体步移的次数。2022/11/10图位克隆--跨物种基因克隆862022/11/12直系同源集簇由祖先基因衍生的一组基因种间同源物:不同基因组中执行同一生物学功能;种内同源物(平行基因):同一基因组中因基因加倍产生;预测新基因功能。back2022/11/10直系同源集簇由祖先基因衍生的一组基因ba872022/11/12比较基因组学与进化

古细菌产甲烷球菌与原核生物比较共同的染色体组织与结构:环状基因组、基因的操纵子结构;能量产生和固氮基因:与原核生物有很高同源性;蛋白质编码基因:与细胞分裂相关蛋白质、20多个无机离子运输蛋白的ORF,与原核生物同源;调控模式:类似于原核生物。2022/11/10比较基因组学与进化古细菌产甲882022/11/12与真核生物比较细胞遗传信息传递:转录和翻译系统;分泌系统;比较基因组学研究在进化系统树上,古细菌与真核生物亲缘关系比原核生物更近。在自养生物的三个分支,细菌、古细菌和真核生物中,细菌的分化发生较早。back2022/11/10与真核生物比较back892022/11/12模式生物与比较基因组学研究模式生物原核生物酵母线虫果蝇小鼠、人类拟南芥、水稻、玉米、小麦2022/11/10模式生物与比较基因组学研究模式生物90模式生物

modelorganism生物的一个物种species,在研究生命现象的过程中长期、反复地被作为研究材料;其许多生命活动规律往往代表了许多物种共同的规律;对其形态、解剖、生理、生化、细胞及遗传进行全面分析和归纳;将对其研究中得出的规律,推演到相关的生物物种中,以加快其他各种生物研究的步伐。模式生物modelorganism生物的一个物种spec91模式生物具备的基本条件容易培养,成本低廉,随时获取以供实验研究,繁殖周期短;能在短时间内产生大量的后代,满足研究分析的需求;十分方便地取得种内的遗传变异体;已经过长期研究取得该物种的丰富背景信息。模式生物具备的基本条件容易培养,成本低廉,随时获取以供实验研922022/11/12模式生物基因组研究特点1“压缩”的基因组:基因组通常比较小,编码基因比例较高,重复序列和非编码序列较少;2模式生物基因组中G+C%含量高,同时CpG岛的比例也比较高;3在模式生物特别在人的基因组中发现了重复duplication;2022/11/10模式生物基因组研究特点1“压缩”的基因932022/11/12模式生物比较基因组研究特点4在各种不同的物种中大多数的重要生物学功能是由相当数量的同源序列基因(Orthologous)蛋白承担;5同线(synteny)连锁的同源基因在不同物种基因组中有相同连锁关系;6生物体的复杂性一般表现在“生物学”的复杂性,与基因组的C值大小及基因数量未必一定呈线性关系--C值悖论。back2022/11/10模式生物比较基因组研究特点4在各种不同942022/11/12原核模式生物比较基因组学尿殖道支原体--已知最小的基因组0.58Mb,由此确定能自我复制的细胞必需的一套最少的核心基因;流感嗜血杆菌的基因组为1.83Mb;?基因组大小影响了基因数目还是基因尺度。2022/11/10原核模式生物比较基因组学尿殖道支原体--952022/11/12原核模式生物比较基因组学基因大小:流感嗜血杆菌基因平均900bp,尿殖道支原体的基因为1040bp,差不多;基因密度:流感嗜血杆菌中平均1042bp有1个基因,尿殖道支原体中平均1235bp有1个基因;基因数量的差异:流感嗜血杆菌基因组有1743个ORF,而尿殖道支原体只有470个ORF。

2022/11/10原核模式生物比较基因组学基因大小:流感嗜962022/11/12原核模式生物比较基因组学比较尿殖道支原体与流感嗜血杆菌这两个亲缘关系较远的生物基因组;

选取其共同的基因(共240个);再加上一些其他基因;组成一套含256个基因的最小基因组。back2022/11/10原核模式生物比较基因组学比较尿殖道支原体972022/11/12酿酒酵母基因组

—最简单的真核生物基因组:12,068kb,比单细胞的原核生物和古细菌大一个数量级;基因数:ORF

5887,比原核生物和古细菌要多很多;基因密度:1个基因/2kb,密度小于流感嗜血杆菌和尿殖道支原体。酿酒酵母--最小的真核基因组裂殖酵母其次:密度是1/2.3kb,13.8Mb线虫:简单多细胞生物,基因密度为1/30kb。内含子:酿酒酵母4%的编码基因有内含子,裂殖酵母有40%编码基因有内含子。2022/11/10酿酒酵母基因组

—最简单982022/11/12酵母良好的实验系统

单细胞,可在特定的培养基上生长,能够完全控制其化学和物理环境。酵母的生命周期也很适合被用来作遗传分析,可以构建一套16条染色体单倍型的详尽的图谱。可将其6000个基因中的任何一个用突变的等位基因替代或准确地从基因组中缺失。back2022/11/10酵母良好的实验系统单细99线虫简单多细胞生物减数分裂细胞核外形细胞分裂胚胎形态的发育

back线虫简单多细胞生物back1002022/11/12果蝇基因组果蝇基因组全长120mb,2/3是euchromatin,1/3是heterochromatin;BlastSearch确定有14113个转录产物(功能基因)。

Science,287:2185-2195(2000)

2022/11/10果蝇基因组果蝇基因组全长120mb,2/1012022/11/12人类基因组的一个片段2022/11/10人类基因组的一个片段1022022/11/122022/11/101032022/11/12人类染色体组型姬母萨染色的G带模式图2022/11/10人类染色体组型姬母萨染色的G带模式图1042022/11/122022/11/101052022/11/12

人类基因组基因的三条推测依据

根据已测定大片段DNA中ORF的比例;

CpGisland的个数(56%的已知基因5’都与CpG相连,而人基因组中有45000个Islands)ESTs2022/11/10人类基因组基因的三条推测依据

1062022/11/12

模式生物基因组研究对人类基因组研究的促进作用1利用基因序列上的同源性克隆人类疾病基因

人类cDNA与已知功能的模式生物基因高度相关,该表型的候选基因定位于与cDNA相同的位置上,就有助于识别该基因。人类基因组与酵母30%基因对应,小鼠99%对应2022/11/10

模式生物基因组研究对人类基因1072022/11/12模式生物基因组研究对人类基因组研究的促进作用2模式生物基因组研究揭示了人类疾病基因的功能某些模式生物基因的功能已知,对人类疾病基因的功能研究有很大的促进作用。

跨种关系使模式生物基因的有效功能数据立刻用于研究它的高等生物的同源体。2022/11/10模式生物基因组研究对人类基因组研究的促进1082022/11/12模式生物基因组研究对人类基因组研究的促进作用3充分利用模式生物实验系统上的优越性模式生物实验上的优越性成为人类疾病状态下分子机制的阐明和基因功能分析的有效手段。酵母一个很好的实验系统。2022/11/10模式生物基因组研究对人类基因组研究的促进109与定位克隆的人类疾病基因高度同源的酿酒酵母基因人类疾病人类基因人类cDNA

GenBank登记号酵母基因酵母cDNA

GenBank登记号酵母基因功能遗传性非息肉性小肠癌MSH2U03911MSH2M84170DNA修复蛋白遗传性非息肉性小肠癌MLH1U07418MLH1U07187DNA修复蛋白囊性纤维变性CFTRN28668YCF1L35237金属抗性蛋白威尔逊氏病WNDU11700CCC2L36317铜转运器甘油激酶缺乏症GKL13943GUT1X69049甘油激酶布卢姆氏综合症BLMU39817SGS1U22341蜗牛酶X-连锁的肾上腺脑白

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论