草案的甜橙基因组_第1页
草案的甜橙基因组_第2页
草案的甜橙基因组_第3页
草案的甜橙基因组_第4页
草案的甜橙基因组_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 草案的甜橙基因组(类)文摘桔子是一种很重要的营养来源,人类健康和具有巨大的经济价值。在这里,我们提出一个综合分析基因组草案的甜橙(类)。装配序列覆盖87.3%的估计橙色基因组,这是相对紧凑,20%是由重复的元素。我们预测29445个蛋白编码基因,其中一半是杂合状态。与其他两个柑橘类物种的测序和比较分析七个柑橘的基因组,我们目前的证据表明,甜橙起源于一个回交柚子和普通话之间的混合。集中在维生素C代谢相关基因分析表明,GalUR,编码galacturonate途径的限速酶,在橙果显著调节,这个基因家族的最近的扩张可能会提供一个基因组的基础。这个草案基因组代表一个宝贵的资源对于理解和改善在未来许多

2、重要的柑橘类特征。left. 图1. 图2. 图1. 图2. 图3. 图4.介绍柑橘是一个大属,包括几个主要栽培品种,包括c .喹酮(甜橙),试(橘子和普通话),柠檬(柠檬),茅(柚子)和柑橘paradisi(葡萄柚)。2009年,全球种植面积是900万公顷,柑橘产量1.223亿吨(粮农组织统计,见url),这是排名最高的在所有的水果作物。1090万吨(价值 $93亿)柑橘产品的交易在2009年,甜橙占大约60%的柑橘生产新鲜水果和果汁加工消费(粮农组织统计,见url)。此外,柑橘类水果和果汁是人类的主要来源,维生素C、人类营养的一个重要组成部分。柑橘类水果也有一些独特的植物特性,如

3、珠心的embryony(珠心细胞可以发育成单性生殖的胚胎基因完全相同的母亲植物)。因此,体细胞胚胎的生长比合子的胚胎更大力的种子,种苗本质上是克隆母体的父母。这样citrus-unique特点阻碍了柑橘遗传和育种研究改进1,2。完整的基因组序列将提供有价值的遗传资源为提高柑橘作物。柑橘被认为是原产于东南亚3,4,5,种植的水果作物发生在至少4000年前3,6。甜橙的遗传起源并不清楚,虽然有一些猜测,甜橙可能来自一些原始的柑橘类物种的种间杂交7,8。柑橘也无患子目的顺序,一个妹妹Malvidae Brassicales秩序,使其有价值的比较基因组学研究的模式植物拟南芥。我们旨在序列的基因组瓦伦西

4、亚甜橙(c . sinensis简历。瓦伦西亚),其中一个最重要的全球甜橙品种培育和种植主要为橙汁生产。普通甜橙二倍体,估计九对染色体基因组的大小 367 Mb9。降低测序基因组的复杂性,我们获得了双单倍体(dihaploid)来自瓦伦西亚甜橙的花药培养10。我们首先生成的全基因组鸟枪paired-end-tag读取从dihaploid基因组DNA序列,建立了一个新创作为柑橘参考基因组组装;然后我们产生鸟枪测序读从父母的二倍体DNA和单倍体的参考基因组的序列映射到瓦伦西亚甜橙获得完整的基因组信息。此外,我们进行了全面的转录组测序分析四个代表组织使用猎枪RNA序列(RNA-Seq)来捕获所有转录

5、序列和paired-end-tag RNA序列(RNA-PET)划分的5和3末端的成绩单。DNA和RNA序列数据的基础上,我们橙色基因组的基因特征内容,杂合性和演化特性。基因组和转录组分析提出研究收益率甜橙的起源的新见解和维生素C的基因基础代谢和提供丰富的资源为柑橘育种和遗传改良的遗传信息。结果基因组测序和组装dihaploid DNA的甜橙(补充图17.85亿),我们生成高质量paired-end-tag测序读(2×100个基点)从不同的DNA片段大小( 300个基点,2 kb,10 kb和20 kb)使用Illumina公司GAII编曲,碱基对覆盖率和代表214倍214倍的物理覆

6、盖估计柑桔基因组(补充表1)。顺序读取被SOAPdenovo组装11和歌剧12,导致16890年组装序列重叠群(obasanjo 49.89 kb)和4811支架(obasanjo 1.69 Mb)(表1)。总叠连群序列长度(320.5 Mb)涵盖了估计甜橙基因组的87.3%,超过135年80%的基因组组装支架大于713 kb和8.2 Mb。评估柑桔基因组组装的准确性,我们评估质量支架的BAC克隆分析,对准既定的柑橘遗传连锁图和细胞遗传学分析.表1:统计的甜橙基因组草案基因组大小的估计367 MB染色体数目(2 n)18总装配重叠群的大小320.5 Mb多的重叠群(> 500个基点)16

7、890年最大重叠群323.34 kbobasanjo长度(重叠群)49.89 kb支架(> 500个基点)4811年组装支架的总大小301.02 Mbobasanjo长度(支架)1.69 MB最长的脚手架8.16 MBGC含量34.06%数量的基因模型29445/44387意味着记录长度1817个基点意思是编码序列长度1255个基点意思是外显子的长度312个基点意味着基因内区长度359个基点数量的预测microrna基因227年转位因子的总大小61.7 Mb甜橙的BAC克隆库曾被构造和特点13,估计尺寸范围的BAC克隆插入120 kb。我们选择个人BAC-end毛细管测序克隆。BAC-e

8、nd 735双的序列读取两端的一对映射在同一叠连群,的平均距离是125875±26788个基点(班)。这是与此前估计的BAC克隆的长度一致13,表明重叠群装配的正确性。进一步评估的准确性在当地组装,我们分析了七个完整BAC序列的甜橙基因库并锚定在甜橙遗传图谱。这些BAC序列之间的对齐和柑桔基因组装配显示整体的身份97.6%(补充图2和补充表2)。在一起,BAC克隆测序分析验证装配是高质量的。然后我们问的组装基因组序列建立了甜橙遗传连锁图14。我们绘制了支架- 768标记与已知序列的基因连锁集团,和160年固定支架(每个> 10 kb),占239 Mb的柑桔基因组组装(补充表3)

9、。此外,83年支架,占大多数的固定支架的长度(178.7 Mb,或75%的总固定支架)是在匹配定位在遗传图谱(补充注意),这表明高锚定遗传标记之间的对齐一致和序列支架。对齐方式不一致可能反映了技术的准确性,如标记密度不足、基因分错误或测序基因组之间的个体差异(瓦伦西亚甜橙)和遗传图谱,是基于三个三个甜橙品种之间穿过14。瓦伦西亚橙色是已知染色体重组相对于破旧的甜的橘子15。结合组装基因组序列和遗传连锁集团,我们构建了pseudomolecules为每个9染色体,命令他们在遗传的基础上长度(图1).图1:对齐的基因组序列组装的遗传图谱蛾。组装支架(蓝色,239 Mb或组装基因组序列的75%)被锚

10、定在9个联系组(LG1-LG9、黄色)与相应的遗传标记(黑酒吧)。pseudochromosome数据分配的基础上估计的长度遗传连锁群14.然后我们拍了一些细胞学标记,包括两种核糖体基因(45 s和5 s)和串联重复序列(107个基点),鱼分析进一步验证组装柑桔基因组序列的一致。细胞学上标记染色体显示初步一致性genomically pseudochromosomes定义(补充表4)。例如,pseudochromosomes 1和8,轴承45年代地区近端位置,对应两个b染色体,一个脆弱的网站(补充图3);pseudochromosome 6,映射包含45支架和5 s核糖体DNA序列在远端区域,

11、对应于d类型染色体脆性位点;和染色体7包含大量的副本107 - bp串联重复序列在两个远端位置,它对应于c型染色体(补充图3)。总的来说,我们的细胞学实验提供染色体sequence-matched证据1、6、7和8。其它染色体所需额外的细胞学证据。+*-+基因组特征大多数植物基因组与转座因子高度重复的地区特色和独特的基因编码区域。我们分析了柑橘在这两个方面揭示基因组基因的基本结构和功能特性。转座的元素是主要组件的植物基因组和基因组进化的重要贡献者。然而,很少有以前在柑橘转座的元素。橙色的基因转位因子分析,我们首先构建一个自定义数字转座因子库使用从头开始,同源性,基于结构转座因子预测工具,然后这

12、个数据集应用于柑橘参考基因组注释。这种分析识别了61.7 Mb的装配序列重叠群,占20.5%的c(基因组的补充表5)。这种级别的重复是拟南芥的类似16和大米17,这表明甜橙相对紧凑的基因组。类我长末端重复反转位子活动占据超过89%的转座的元素,包括198年Copia家庭和前者130年吉普赛家庭。类似于其他紧凑如拟南芥基因组18和大米19,每一个家庭的完整元素小于250成员,而超过90%的长末端重复逆转录转座子家庭只包含一个五个完整的元素。插入时间估计表明,80%以上的完整元素放大在过去的200万年里,和10%比50000年更年轻(补充表6)。相比之下,二类DNA转座子转座因子只有 11%组成的

13、,类似于苹果20和木瓜21基因组。在二类DNA转座子,微型inverted-repeat转位因子(螨)占据了67%的序列。值得注意是,我们发现了一个新型的螨虫,名叫MiM(螨插入微卫星),在柑桔基因组(补充表5).注释的柑桔基因组蛋白质编码基因,我们使用一个全面的战略,结合从头开始基因预测,蛋白质同源性搜索和实验支持(est,RNA-Seq和RNA-PET)(补充图4)。我们使用四个从头开始基因发现程序(Fgenesh、GeneID Genscan和GlimmerHMM)repeat-masked基因组序列。此外,我们收集了917610蛋白质从UniProt数据库22和958121年柑橘EST

14、读从基因库和生成9.646亿RNA-Seq读从四个柑橘组织(愈伤组织、叶、花和果实)(补充表1)。总的来说,我们鉴定了29445个蛋白编码基因座(基因模型)与44387年成绩单(图2和补充表7),23421个基因在9个pseudochromosomes分配模型。1817个基点的基因记录的平均长度,平均编码序列的大小1255个基点,平均5.8每个基因外显子。RNA-Seq和EST数据显示,有26%的基因模型(7640基因位点)编码的两个或两个以上的成绩单亚型(补充图5)。总体来看,85%的基因模型包含多个外显子(补充图5 b),和99%的预测编码序列和80%的接头连接网站RNA-Seq支持的数据

15、(图2 b和补充表7),显示精度高的基因注释在橙色的基因组中。我们评估和纠正所有基因预测模型使用RNA-PET测序数据(互补RNA-Seq数据)标定基因边界(补充图6)。我们生成大约1亿RNA-PETs从四个组织(愈伤组织、叶、花和果实),用它们对地图、集群和基因组的注释(补充表1),确认70%的5和3边界的基因转录(图2 c和补充表8)。值得注意的是,我们发现967 744年的成绩单公认的基因模型完全的基础上结合RNA-Seq和RNA-PET数据(补充表9和补充图7),代表一个潜在的新和citrus-specific基因集合。此外,我们发现了一个181核糖体RNA,451转移核糖核酸,39个

16、小核仁的RNA在柑橘类和104个小核RNA基因组(补充注意)。我们还发现了40守恒的微RNA(microRNA)有227个成员的家庭在橙色基因组的基础上,以前的小核糖核酸测序数据23 (补充表10),大多数的microrna基因是均匀分布在整个基因组,与几个小集群(补充图8).图2:基因组特征。(一)圆形图描绘的九个甜橙基因组景观pseudochromosomes(Chr1 Chr9规模Mb)。每个轨道的外延上市是正确的。RPKM,每千碱基读取每百万映射读取外显子模型。(b)基因模型预测实验数据支持。离开时,箱线图RNA-Seq读取对齐的基因特性。顶部和底部的盒子显示上、下四分位数,

17、分别。中间的红酒吧代表中间,红点表示每个特性的平均值。cd、编码序列。的权利,维恩图预测RNA拼接连接支持的各种证据(美国东部时间,蛋白质和RNA-Seq数据)。括号里的数字是每个类别接头连接的数量。(c)基因模型边界的界定RNA-PET数据。直方图的情节RNA-PET数据与一致的基因模型的5(假定的转录起始站点,TSS)和3(假定的保利(A)网站,PAS)边界。一)圆形图描绘的九个甜橙基因组景观pseudochromosomes(Chr1 Chr9规模Mb)。每个轨道的外延上市是正确的。RPKM,每千碱基读取每百万映射读取外显子模型。(b)基因模型预测实验数据支持。离开时,箱线图RNA-Se

18、q读取对齐的基因特性。顶部和底部的盒子显示上、下四分位数,分别。中间的红酒吧代表中间,红点表示每个特性的平均值。cd、编码序列。的权利,维恩图预测RNA拼接连接支持的各种证据(美国东部时间,蛋白质和RNA-Seq数据)。括号里的数字是每个类别接头连接的数量。(c)基因模型边界的界定RNA-PET数据。直方图的情节RNA-PET数据与一致的基因模型的5(假定的转录起始站点,TSS)和3(假定的保利(A)网站,PAS)边界。为了更好地理解citrus-specific生物学,我们确定citrus-specific基因。我们进行比较分析的橙色对21个其他植物基因组和筛选EST和肽序列的公共数据库(补

19、充注意)。橙色基因组的29445个蛋白编码基因,23804被分成14348基因家族,1691个基因在特定于柑橘类(补充图9)。大多数(96%)的citrus-specific基因是“假设”和未知函数。58岁的带注释的基因,占蛋白质域是锌指转录因子域和nucleotide-binding-site leucine-rich-repeat(NBS-LRR)领域,其中包含潜在的抗病基因(补充表11).杂合性和混合甜橙的起源杂合性是一种常见的功能在大多数真核生物,在作物具有重要的生物功能。尽管柑橘树通常视为高度杂合的特征2在整个基因组的杂合性还不清楚。提供的单倍体和二倍体基因组测序基因组数据(补充表1

20、2)对我们全面评估甜橙的杂合性。从二倍体基因组测序数据,我们发现106万个snp和176953小插入/删除(indels)。超过80%的单核苷酸多态性和九pseudochromosomes indels停靠。整体多态密度是3.6个和0.6 indels kb基因组(补充表13)。大约三分之一的snp是位于基因的区域(补充表14),16843个基因位点(72%)至少包含一个SNP(补充图10)。考虑0.52%的错误率检测单核苷酸多态性(补充注意),我们建立了一个严格的标准的5个或5个以上每个基因单核苷酸多态性可靠地调用变异等位基因;使用这一标准,12297个基因位点(53%)被认为港变异等位基因

21、(补充表15)。这个观察明,特别是在基因位点杂合性率高。来验证这一观点,我们检测了307简单重复序列(SSR)标记dihaploid和父母的二倍体的甜橙和确定了155(50%)SSR位点杂合的状态(图3和补充表16),这是类似于发现的蛋白质编码基因位点的杂合性率SNP分析。此外,染色体核型分析显示,6 18父母二倍体染色体没有明确的对应,而染色体很容易分成9个双dihaploid线(图3 b),进一步支持观察,甜橙的二倍体基因组高度杂合的。图3:杂合性和混合甜橙的起源。(一)甜橙基因组的杂合性率。纯合子的基因的杂合的国家地区被发现使用从父母的二倍体基因组SNP数据;重复区域被比较评估SSR标记

22、在二倍体和dihaploid模式。顶级饼图中的数字表明基因数量和饼图底部的SSR标记的数量。(b)的染色体核型dihaploid(左)和父母二倍体(右)。每个核的18个染色体(装备)很容易发现dihaploid线分成九个配对,而六个二倍体细胞核的染色体没有明确,表明高杂合度二倍体状态。细胞学类型的染色体是传统命名为男朋友,B,C,Df,根据4 D和F6-diamidino-2-phenylindole(蓝色)和色霉素A3(黄色)条带区域,以及脆弱的网站(圆),如前所述41 (补充图3)。(c)基因分型结果SSR标记的两个柚子品种(P1和P2),甜橙(因此)和两个普通话品种(M1M2)

23、。共享307年的307个SSR标记,柚子,橘子和普通话(中间),55是柚子遗传(左)和147年普通话世袭(右)。一个标志显示orange-specific模式和被排除在这一分析。(d)的遗传起源甜橙dihaploid基因组由高密度SNP标记的柚子和普通话。OP,起源模式(柚子起源在黄色,普通话起源在橙色和灰色待定);SC序列组装支架,LG,连锁群的地图。Pseudochromosome 1所示为例,和其他染色体所示补充图11。(e)的模型甜橙。与柚子(PP)作为母本交叉与普通话(MM)的种间杂交杂交与普通话(毫米)和古代甜橙。· 全尺寸图像(344 KB)· 以前的

24、3; 数据/表索引· 下一个我们因此研究甜橙的推测杂种起源柚子(c .茅)和普通话(c .试)7,8,这是柑橘类的两个原始的物种。衡量可能的遗传贡献甜橙柚子和普通话,我们调查甜橙的基因型,两个柚子品种和两个普通话使用甜orange-derived品种SSR标记和识别202多态标记,其中55个柚子遗传和147年普通话遗传(图3 c和补充表16)。值得注意的是,数字pummelo-hereditary标记和mandarin-hereditary标记(分别为55 - 147)很适合1:3比例(2 = 0.54 <20.95(2 - 1)= 3.84),表明一个有趣的甜橙之间遗传关系,

25、柚子和普通话。全面验证甜橙的基因组组成推断从SSR标记,我们扩展我们的分析使用高密度SNP制造商。为此,我们生成的全基组鸟枪短序列读取三个柚子品种和三个普通话品种,每个超过30倍覆盖的柑桔基因组(补充表12);然后,我们绘制了单倍体橙色参考基因组序列,确定了475450个snp共同在三个个人柚子和308837个snp共同在三个别官员(补充表17)。使用100 kb基因组窗口,我们计算了SNP密度对柚子的偏好或普通话,然后确定遗传起源(补充注意),它允许我们指定39.7 Mb的甜橙基因组从普通话,柚子和118.2 Mb基因组约适合1:3的比例的贡献从柚子和普通话(图3 d和补充图11),与SSR

26、分析结果一致。的基础上的杂合性率高(50%)、柚子和普通话的1:3比例的证据表明,叶绿体基因输入和甜橙可能是来自柚子7 (补充图12),我们假设甜橙起源于一种间杂交柚子为母本和普通话为父本,后跟一个回交和男性的普通话(甜橙=(柚子×普通话)×普通话)(图3 e).基因组进化描述和注释的柑桔基因组为我们进一步研究提供了基本特征的进化历史甜的橘子。大多数植物物种已经通过全基因组重复(WGD)在进化过程中24。paralogous基因家族积累的规模和频率在每个基因组作为记录这样的进化过程。组合的柑橘类基因组序列的基础上23421个基因模型位于九pseudochromos

27、omes确认1296 paralogous基因组(图4)。平均同义替换率(Ks)复制基因(Ks = 1.27)表明一个古老WGD发生在柑橘类(图4 b和补充图13)。此外,我们分析了intergenome之间的共线性橙色和可可25,拟南芥16,苹果20、草莓26和葡萄27日基因组,发现橙色直系同源基因syntenic块对这些基因组(补充表18)。一对一的同源关系主要orange-to-cacao,orange-to-grape orange-to-strawberry比较,表明没有最近wgd除了共享古老的三倍,称为 事件,由所有核心双共享24。相比之下,我们发现一个大约一到两个同源关

28、系orange-to-apple比较和1:4的关系orange-to-Arabidopsis比较,支持一个额外的一个,最近两轮WGD发生在苹果和拟南芥,分别为(图4摄氏度和补充图。14)。此外,跨物种的基础上同线性块边界,我们估计至少49染色体易位和融合的事件发生在9个柑橘染色体进化染色体的提议paleohexaploid祖先共同eudicot基因组测序28日。值得注意的柑橘pseudochromosome 4只有一个染色体翻译和融合事件,而其他pseudochromosomes接受多个(3 - 12)interchromosome融合在其进化历史(补充图。15).图4:甜橙基因组的进化分析。

29、(a)的示意图表示主要的染色体间的关系在1294年paralogous基因群体在甜橙基因组中。Syntenic块来自七个祖先protochromosomes A1,A4,A7,A10,A13,A16 A19(ref。28日颜色编码表示。(b)分布的同义替换率(Ks)同源基因群体intrachromosome和interchromosome比较。基因重复分析相比,苹果、拟南芥和可可表明没有最近wgd发生在甜橙基因组。(c)的示意图表示syntenic甜橙9号染色体的关系和相应的染色体在拟南芥,可可,马吕斯×龄,草莓属vesca和葡萄。Syntenic地区来自七个祖先protochrom

30、osomes颜色编码的。是59 Syntenic块甜橙染色体9和拟南芥染色体,22例(37%)显示主要对应四个拟南芥块,10到三个街区,24 -两块,3块,在79 Syntenic块甜橙染色体9和苹果之间的染色体,48例(61%)显示主要对应两个拟南芥块,20到三个街区,6 -四块,2块。因此,这些百分比的基础上,1:4和一到两个关系被确定最可能的orange-to-Arabidopsis和orange-to-apple比较,分别。(d)柑橘发展史的基础上,103年单份基因在拟南芥之间共享,可可,杨树、葡萄、苹果、草莓、木瓜和蓖麻核基因组数据。米娅,百万年前。· 全尺寸图像(388

31、KB)· 以前的· 数据/表索引· 下一个这个系统发育分析的全基因组序列还提供了全面的信息。我们应用最大似然法对公司系统发生的分析使用103共享单份核基因从橙色,拟南芥16,可可25,杨树29日、葡萄27日,苹果20、草莓26、木瓜21和蓖麻30 (图4 d和补充注意)。系统发育树显示,柑橘是过去接近可可,拟南芥和木瓜,尽管它是古代在Malvidae相比,和估计背离锦葵目8500万年前。因此,我们的分析提供了新的信息系统学的柑橘和其他植物物种的基础上公司数据。基因参与柑橘类的水果特别生物学柑橘类的水果生物学是一个有趣的话题不仅因为柑橘类水果对人类是重要的

32、营养来源,还因为它们涉及独特的代谢途径。这种柑橘参考基因组框架提供了一个全面的基因组基因帮助解决生物学柑橘类的水果。一个清晰的策略是确定在水果组织特异表达基因。我们RNA-Seq数据来源于愈伤组织相比,叶,花和水果和确定了2697(9.2%)基因显著调节(P < 0.01),水果(补充表19)。调节基因的基因本体分析柑橘类水果表明氧化还原酶基因,氧化还原和维生素绑定占绝对优势(补充表20).果实成熟是一个重要的生物功能和具有巨大的经济价值。基因在番茄成熟已经被充分研究过31日。16个番茄成熟的基因,我们发现只有3(ETR3(也称为天然橡胶),MADS-RIN和BP0353(也称为PHYF

33、)差异表达在橙色水果,而大多数(13)不(补充表21),可能反映了两种不同的成熟机制的存在对更年期(番茄)和nonclimacteric(橙色)水果。MADS-RIN,尤其是转录因子之前证明是必要的正常发展和成熟的西红柿32(更年期)和草莓33(nonclimacteric)高度调节橙色水果(补充表21),提供进一步支持这一概念,MADS-RIN可能作为key-ripening调节器具有广泛影响更年期和nonclimacteric水果成熟。我们特别感兴趣的生物合成维生素C(L抗坏血酸(AsA),一个强大的抗氧化剂代理),橙色水果富含这种维生素。我们分析了关键酶的基因转录参与四种已知生物合成通路

34、的上游AsA分支34,35 (补充图16),发现这些基因调节特别是水果。值得注意的是,这三个基因的酶(PG,光磁电式和GalUR)参与galacturonate路径分支大幅度调节(图5),其中的基因编码 维-galacturonic酸还原酶(GalUR)是这个途径的限速步骤36。巧合的是,我们发现18 GalUR paralogous柑桔基因组基因(补充表22),这是植物基因组之间的最大数目(17日在苹果和小道消息,15日草莓,13日在木瓜,12日在大米、玉米和可可,7在拟南芥,6在衣藻Brachypodium无人)(补充表23)。进一步的进化分析使用Malvidae中的四

35、个密切相关的植物物种进化枝(橙、可可、木瓜和拟南芥)显示两个集群(有四个基因和其他七个基因)最近GalUR基因的扩张在柑桔基因组中,可能通过串联重复(图5 b)。值得注意的是,这两个集群还展示了木瓜的扩张模式,另一个树作物果实维生素C含量高。明显,橙色GalUR基因在这些两个集群在不同的发展阶段表现出不同的表达模式。其中一个(GalUR-12)显著调节果实(P = 5×107),而其他三个成员在同一集群没有显示类似的表达式模式(图5 a,B),表明多样化AsA生物合成基因转录调节的。GalUR-12股票高序列标识(E值< 10106)和显示了密切的系统发育关系(补充图17与草莓

36、GalUR基因),为特定的维生素C生产进一步测试36。总的来说,我们的数据表明,galacturonate途径是橙色水果和高度调节GalUR可能最重要的贡献者AsA积累橙色水果。图5:维生素C代谢有关的基因。(一)热图的规范化RNA-Seq参与AsA新陈代谢的基因数据。基因表达水平最低(RNA-Seq RPKM > 1(ref。42显示)。(b)的系统发育分析GalUR基因家族在c、拟南芥、番木瓜和t .可可(顶部);两个最近扩张阴影和两个椭圆圈(一个集群GalUR-6 GalUR-11,GalUR-12和GalUR-13(橙色椭圆形)和其他集群与GalUR-1 GalUR-2,GalU

37、R-3,GalUR-4,GalUR-8,GalUR-10和GalUR-14(灰色椭圆)。注意GalUR-12是最近的个家庭成员和高度调节橙色水果。18 GalUR基因的基因组组织(黑色箭头)所示的甜橙基因组(底部)。Sc,脚手架。· 全尺寸图像(351 KB)· 以前的· 数据/表索引讨论· 文摘· 介绍· 结果· 讨论· 方法· 加入代码· 引用· 应答· 作者信息· 补充信息我们使用一个两步甜橙基因组测序的方法:首先,我们dihaploid基因组测序和组装,第二

38、,我们绘制了父母的二倍体基因组DNA序列读取单倍体参考基因组的杂合的基因组完成建设地图。甜橙基因组序列的可用性为柑橘遗传和育种提供了一个宝贵的基因资源的改善。甜橙的序列,为芸香科的一员和无患子目,还提供了有价值的参考植物基因组进化分析。我们的基因组分析表明,只有一个古老的()三倍的事件,没有最近WGD事件在橙色的基因组中,这部分解释了柑桔基因组的规模小。系统发育分析表明,柑橘相当古老,进化可可,估计在8500万年前分化锦葵目。一个罕见的生殖周期在某些类群因为孤雌生殖,雌性或雄性不育,长不成熟和营养繁殖可能导致基因组扩张和发展的限制。杂合性的对植物的兴趣。杂交导致高度杂合性可以创建混合活力被称为

39、杂种优势37。非常高度的基因组的杂合性品种瓦伦西亚甜橙(c . sinensis简历。瓦伦西亚),在我们的基因组和细胞学分析,暗示甜橙是柚子和普通话之间的种间杂交。证据的基础上的集体,我们重构了场景中关于古代的主要事件起源甜橙:女性与男性普通话柚子交叉创建最初的种间杂交,再进一步交叉与男性普通话产生甜橙。这个事件可能发生在至少2300年前,或更早,甜橙是记录在中国文学早在公元前314年3,38。尽管额外的基因变化可能发生之后,它仍然是引人注目的,这个古老的混合基因型似乎是保存在今天的甜橙,可能因其严格的无性生殖的性质(通过珠心的无融合生殖胚胎)和人工选择和传播通过嫁接。这个场景解释了为什么大多

40、数今天的甜橙品种是一个生物型和高度杂合的基因,与多样化发生主要通过体细胞突变7,39,40.表征柑桔基因组蛋白质编码基因和与其他植物的基因组比较基因组分析,以及转录组分析,得出几个见解citrus-specific基因,特别是那些涉及水果生物学和代谢途径。我们的分析表明,速率限制酶GalUR36galacturonate通路中的高维生素C可能是一个重要的因素积累在柑橘类水果,和最近的扩张GalUR基因家族在柑桔基因组可能表明基因调节维生素C生产的基础。橙色基因组的可用性和深度挖掘orange-specific基因与已知或未知的生化功能将有助于更好地理解许多重要经济和农艺性状,包括水果的颜色,味

41、道,糖、有机酸和对疾病的抵抗力。未来比较的甜橙基因组与最近发布高质量的克莱门泰普通话基因组组装草案(见url)应提供新的见解柑橘生物进化的问题。url。联合国粮食及农业组织(粮农组织统计数据),/default.aspx,克莱门泰普通话基因组组装,方法植物材料和DNA测序。dihaploid行c .刺蛾的简历来自另一种文化。瓦伦西亚10用于使用Illumina公司GAII paired-end-tag DNA测序平台。大约7.85亿2×100个基点从库读取生成不同的片段大小(300个基点,2 kb,10 kb和20 kb)。DNA的杂合的二倍

42、体的母公司dihaploid行(树的花药收获,dihaploid推导行),三个柚子(c .茅)和三个官员(c .试)进行全基因组鸟枪测序的paired-end-tag读取300 - bp基因组DNA片段(补充表12).基因组组装。我们第一次地震应用软件43纠正每个库的读取。测序数据的重叠群装配、脚手架和填缝是使用汇编SOAPdenovo完成的11,三个DNA-PET库(2 kb,10 kb和20 kb)被用来连接重叠群成支架。支架和重叠群与填缝模块进一步细化SOAPdenovo(GapCloser),用于连接支架空白,生产组装支架obasanjo 427 kb,覆盖286 Mb的柑桔基因组。为

43、了进一步提高组装,我们使用最优架子工歌剧12与DNA-PET读取(10 kb和20 kb),BAC结束(125年 125 kb,BAC-end序列)为了提高图书馆规模的使用GapCloser构建更大的支架和填补空白(最终的基因组大小的320.5 Mb和obasanjo的320.5 Mb)。DNA-PET读和BAC两端分别映射与领结SOAPdenovo大会44和BWA-SW45 (补充注意).组装支架锚定遗传图谱。c . sinensis遗传图谱的里昂et al。14用于锚定基因组组装。共有768个序列标记在遗传图谱被BLASTN分析用于调整支架的E值截止1×1020。支安打

44、与覆盖率> 50%和身份> 50%被认为是映射标记。pseudomolecules被构造的基础上锚定的结果,和染色体的顺序号码是基于连锁群长度在cM中。柑桔基因组重复元素的识别。转座因子库建立了通过集成不同的基于签名的结果,同源和ab initio-based方法(补充注意)。结果从不同的方法组合在一起,形成转座因子家庭所描述的柳条et al。46。每个家庭至少有一个成员被选中来构建定制的转座因子库,它被用于掩盖柑桔基因组使用RepeatMasker软件(/).基因预测和注释。使用混合的方法,结合从头预测和以证据为基础的数据(es

45、t、蛋白质同源性和RNA-Seq)分析使用PASA和维生素47管道(补充注意)。挣值管理的基因模型预测都被PASA组装排列然后更新。基因功能被分配根据最好的校准使用BLASTP(E值< 105)Uniprot数据库(包括SWISS-PROT和TrEMBL数据库)。microrna的基础上预测小核糖核酸测序数据23,标准应用于描述中描述一个microrna轨迹补充注意.RNA-Seq分析。RNA-Seq读取使用Illumina公司和坚实的平台和生成一致的参考基因组使用大礼帽48(v1.2.0)和放映机(v1.3,默认参数),分别为(补充表1和补充图4),发现外显子和接头连接从头开始。每一个

46、基因的表达水平在每个RNA-Seq RPKM库计算42 (补充注意)。生物和技术复制进行基因表达分析(补充图18)。层次聚类分析,我们使用集群软件集群3.0(ref。49)来执行完整的链接层次聚类基因利用偏心皮尔逊相关性的距离测量。RNA-PET分析。RNA-PET分析全身mRNA成绩单是阮阮中描述和执行50。大约1亿RNA-PETs(补充表1)从四个组织生成(愈伤组织、花、叶和果实)和被用于映射,集群和参考基因组的注释(补充图6).识别潜在的种特异的基因。OrthoMCL方法51通过构建基因家族在22个植物物种的基因(补充图19)。蛋白质与其他没有同源染色体21植物基因组被用于TB

47、LASTN搜索对植物独特的成绩单装配数据库(,/)排除假阳性基因造成的不完整的基因组注释。潜在的种特异的基因被爆炸二次筛分对nonredundant蛋白质数据库搜索的基因库。单核苷酸多态性和小indels分析。Illumina公司读取从杂合的二倍体橙色(二倍体的母公司dihaploid行),三个普通话品种(c .试)和三个柚子品种(c .茅)用于SNP和小indel分析。所有顺序读取映射使用bwa v0.5.9 pair-end读取的默认参数。两个变量调用工具,SAMtools52和基因组分析工具包(GATK53),使用(补充注意)。从dihaploid行序列数据被用于负控制SNP分析如上所述估计的SNP检测错误率(补充注意).分析混合甜橙的起源。SSR和SNP标记基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论