组学分析策略11_第1页
组学分析策略11_第2页
组学分析策略11_第3页
组学分析策略11_第4页
组学分析策略11_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、组学分析策略组学分析策略组学分析组学分析n基因组基因组 有参考序列的基因组有参考序列的基因组 无参考序列的基因组无参考序列的基因组n转录组转录组 数字基因表达谱数字基因表达谱( DGE ) 转录组转录组(RNA Seq) Small RNA 测序测序 降解组测序降解组测序n蛋白组蛋白组n代谢组代谢组 基因组基因组n 结构基因组学结构基因组学 基因定位基因定位 基因组作图基因组作图 测定核苷酸序列测定核苷酸序列n 功能基因组学功能基因组学 基因的识别、鉴定、克隆基因的识别、鉴定、克隆 基因结构、功能及其相互关系基因结构、功能及其相互关系 基因表达调控的研究基因表达调控的研究n有参考基因组物种有参

2、考基因组物种 个体基因组再测序。个体基因组再测序。 多种品系基因组重测序。多种品系基因组重测序。 群体遗传学分析。群体遗传学分析。 图谱构建与家系连锁分析。图谱构建与家系连锁分析。 全基因组关联分析。全基因组关联分析。 基因组重测序开发新标记。基因组重测序开发新标记。 简化基因组重测序开发新标记。简化基因组重测序开发新标记。 基因组基因组 基因组基因组 个体基因组再测序个体基因组再测序对于已测序的重要经济物种和模式物种的野生种、突变种或亚种进行基因组测序。策略: 1. 近缘物种的de novo ;2.全基因组重测序+de novo。1.基因组de novo组装;近缘物种进化分析;2.序列比对+

3、 de novo组装;SNP、插入/缺失和结构变异鉴定;进化分析。栽培大豆基因组栽培大豆基因组第一个大豆基因第一个大豆基因组组Genome sequence of the paleopolyploid soybean. Nature, 2010, 463:178-183.美国农业部 美国联合基因组研究中心华盛顿大学美国普渡大学等研究目的研究目的大豆基因组测序大豆基因组测序GS1.1Gb(2n=40)实验设计研究材料:研究材料:栽培大豆Glycine max var. Williams 82 测序策略:测序策略:建库3 kb, 8 kb, fosmid 及 BAC;Sanger:6.5X研究结果

4、研究结果1. 组装:组装:contigN50:189.4 Kb; scaffoldN50:47.8 Mb ;锚定染色体;锚定染色体上。上。2. 46,430个蛋白编码位点,个蛋白编码位点,283个豆个豆科特有基因家族。科特有基因家族。3. 两次基因组复制事件两次基因组复制事件:5900万年万年前和前和1300万年前。万年前。4. 结瘤基因结瘤基因:28个结瘤基因和个结瘤基因和24个个关键调控基因。关键调控基因。5. 控油基因控油基因:脂类代谢相关基因远:脂类代谢相关基因远多于拟南芥,大豆具有更复杂的转多于拟南芥,大豆具有更复杂的转录调控。录调控。野生大豆基因组野生大豆基因组第二个大豆基因组第二

5、个大豆基因组Whole-genome sequencing and intensive analysis of the undomesticated soybean (Glycine soja Sieb. and Zucc.) genome. PNAS, 2010. 107: 22032-22037 .韩国首尔大学 韩国生命工学研究院研究目的野生大豆与栽培大野生大豆与栽培大豆基因组比较。豆基因组比较。实验设计研究材料:研究材料:野生大豆G. soja IT182932植株纯合型。测序策略:测序策略:454+Solexa序列比对+ de novo 组装。研究结果研究结果1、序列比对得到、序列比对

6、得到915.4M的的G. soja 基基因组,覆盖已发表大豆基因组序列因组,覆盖已发表大豆基因组序列的的97.65%;2、软件分析发现复制区域占、软件分析发现复制区域占G. soja 基因组的基因组的80%,鉴定得到,鉴定得到2.5million SNPs;3、发现、发现35.6%的高可信度基因都是的高可信度基因都是受受G. soja 基因组的非同义基因组的非同义SNPs影响影响的;的;4、通过序列比对和软件计算,证明、通过序列比对和软件计算,证明G. soja 和和G.max基因组在基因组在27万年前产万年前产生分化,远远早于驯化得到生分化,远远早于驯化得到G.max的的时间(时间(6000

7、-9000年前);栽培大豆年前);栽培大豆来自于先于来自于先于G. soja/G. max 复合体存复合体存在的祖先。在的祖先。野生大豆与栽培大豆的进化关系野生大豆与栽培大豆的进化关系野生大豆与栽培大豆分化时间早于大豆驯化时间。野生大豆与栽培大豆分化时间早于大豆驯化时间。 G.max 本质上是本质上是G. soja的驯化形式的驯化形式.。G. soja/G.max 复合复合体至少在体至少在270,000 y 前就出现了。前就出现了。多种品系基因组重测序多种品系基因组重测序核心种质资源资源是育种家最为宝贵的财富。通过对核心核心种质资源资源是育种家最为宝贵的财富。通过对核心种质资源进行重测序,可以

8、实现:种质资源进行重测序,可以实现:核心种质资源数据库(分子标记,材料间聚类关系);核心种质资源数据库(分子标记,材料间聚类关系);研究与品种优良性状相关的分子机制。研究与品种优良性状相关的分子机制。玉米重测序玉米重测序研究材料:研究材料:6个中国重要玉米个中国重要玉米骨干亲本骨干亲本测序:测序:Illumina 每株每株5xSOAP v2.18比对参比对参考基因组序列考基因组序列发现了发现了100多万个多万个SNPs位点和位点和3万多个万多个IDPs位点,建立了高密度分子标记遗位点,建立了高密度分子标记遗传图谱传图谱。发现了发现了101个序列多态性较低的区域,个序列多态性较低的区域,在这些区

9、域中含有大量在选择过程中在这些区域中含有大量在选择过程中与玉米性状改良有关的候选基因。与玉米性状改良有关的候选基因。实验设计实验设计研究发现研究发现玉米重测序玉米重测序 玉米自交系的重测序数据与玉米自交系的重测序数据与玉米玉米B73的基因组序列进行的基因组序列进行比对,发现不同的自交系中比对,发现不同的自交系中存在不同数量的基因丢失与存在不同数量的基因丢失与获得性变异(获得性变异(PAVs)。)。材料选择样品数量30个以上物种内亚群的划分明确,且相同亚群的个体具有一定的代表性测序每个样品全基因组重测序5X-10X标准信息分析SNP的检测及注释InDel的检测及注释SV的检测及注释高级信息分析连

10、锁不平衡分析群体进化分析群体结构分析选择分析等选择有代表性品种重测序,能够揭示物种在驯化过程中发生变化的机制,研究进化和驯化在基因组上留下的“痕迹”,重新找回因人工选择而流失的优秀基因。群体遗传学分析群体遗传学分析研究目的鉴定野生、栽培大豆的遗传分化和选择实验设计研究材料:17野生大豆14株栽培大豆测序策略:illumina 每个个体5X左右研究成果1、发现了630多万个SNP, 筛选出20多万个tag SNP 。2、鉴定出18多万个两种大豆中获得和缺失变异(PAVs)。3、鉴定了470个受选择的区域,分布在大概5%的基因组范围。4、发现大豆基因组存在较高程度的基因连锁不平衡和较高比例的单核苷

11、酸非同义替换/同义替换比例。香港中文大学 华大基因大豆重测序Resequencing of 31 wild and cultivated soybean genomes identifies pattern of genetic diversity and selection.Nature genetics,2010,42(12):1053-1059材料选择RIL、DH系等作图群体子代个体在100个以上测序双亲10X以上重测序子代0.1-2X的全基因组重测序或芯片分型标准信息分析SNP的检测及注释InDel的检测及注释SV的检测及注释高级信息分析分子标记筛选子代基因分型遗传图谱构建和QTL分析

12、图谱构建与家系连锁分析。遗传图谱是QTL定位的基础。对作图群体进行低深度重测序或者SNP分型,可以构建高分辨率的遗传图谱,通过连锁分析,进行QTL定位、进而辅助育种。研究目的通过全基因组重测序检测得到SNPs进行基因分型实验设计9311和日本晴构建的F11的150个RILs,每个RIL测0.02X数据,所得数据与2个亲本基因组数据相对比,找出SNPs研究成果以SNPs构建了高精度的基因分型图(bin map)。以bins 为markers 构建了全基因组高密度分子标记的连锁图谱。标记的平均密度为0.66cM。水稻重测序构建遗传图谱High-throughput genotyping by wh

13、ole-genome resequencing.Genome Research,2009,19:1068-1076全基因组关联分析 通过对核心种质资源进行重测序,结合物种LD信息,构建物种HapMap,获得该物种大量Tag SNPs,应用Tag SNPs进行全基因组关联分析(GWAS),从而挖掘功能相关基因。基因组重测序开发新标记基因组重测序开发新标记 n无参考基因组物种无参考基因组物种 基因组基因组 de novo测序。测序。 简化基因组简化基因组 de novo测序开发测序开发SNP标记。标记。 SNP分型构建遗传图谱。分型构建遗传图谱。 基因组基因组已发表植物基因组物种信息已发表植物基因

14、组物种信息 已发表动物基因组物种信息已发表动物基因组物种信息 已发表动物基因组物种信息已发表动物基因组物种信息 基因表达研究进入数字时代基因表达研究进入数字时代数字基因表达谱数字基因表达谱DIGITAL GENE EXPRESSION PROFILLING数字基因表达谱数字基因表达谱DIGITAL GENE EXPRESSION PROFILLING数字基因表达谱数字基因表达谱DIGITAL GENE EXPRESSION PROFILLING实验流程实验流程数据分析流程数据分析流程n基本特点基本特点测量准确度高测量准确度高通量高通量高可重复性高可重复性高n独特优势独特优势无需重复实验无需重复实验检测低丰度基因检测低丰度基因检测新转录本检测新转录本检测反义链转录本检测反义链转录本数字基因表达谱数字基因表达谱DIGITAL GENE EXPRESSION PROFILLING数字基因表达谱基因芯片数字基因表达谱基因芯片检测率达检测率达98%(多少基因含多少基因含CATG位点位点)21bp Tag能唯一检测多少基因能唯一检测多少基因 转录组分析转录组分析RNA SeqcDNA文库构建测序比对到参考序列RNA SeqRNA S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论