四倍体栽培棉种的分化与驯化_第1页
四倍体栽培棉种的分化与驯化_第2页
四倍体栽培棉种的分化与驯化_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、四倍体栽培棉种的分化与驯化棉花的驯化经历了从多年生乔木到一年生栽培灌木的过程。 两个四倍体栽培棉种,海岛棉(G.barbadense)和陆地棉(G.hirsutum),在四倍体棉种形成以后不 断被驯化并且在世界范围内广泛种植。关于海岛棉和陆地棉的驯化研究一直争论不断。 尽管早期有不同分子标记和 同工酶的研究 , 但是由于数据有限 , 结果比较片面。重测序的研究已经应用于多种作物 , 但是目前为止 , 还没有对四倍体棉花栽 培种全基因组水平上的遗传多样性研究。 本研究中 , 我们对 147 个不同棉花材料 , 包括野生近亲 , 地方品种和现代品种进行了大约 5 倍覆盖的全基因组重测序 , 得 到

2、约 1.8TB 数据, 通过锚定到陆地棉参考基因组进行分析。并辅助海岛棉新海 21进行基因组验证 ,数据缺失率只有 6.8%,而且,我们随 机选择了 68个SNP通过PCR勺方法在7个陆地棉品种和4个海岛棉品种中进行 了验证,结果显示,我们的准确率达到 95%,本研究数据的高质量和测序覆盖倍数 足以用来进行后续勺进化和群体遗传分析。 通过全基因组重测序我们总共挖掘到 16,377,749非单体型SNP至少在两个品种中出现的SNP),144,662InDels(lbp-8kb) 。这些变异均匀分布在棉花 26条染色体上,平均SNP密度是8.5 SNPs/kb,其中At和Dt之间分别是9.2SNP

3、s/kb和7.4SNPs/kb,At略高于Dt。为了分析147 个品种每个SNP位点的等位基因频率,共鉴定了 7,993,856共有SNPs(common SNPs)(等位基因频率>5%),包括,种内SNPs海岛棉3,770,221和陆地棉 3,203,112,以及2,752,128(34.4%)固定SNPs(等位基因频率在海岛棉或者陆 地棉中 >95%, 而在其他物种中 <5%) 。这些全基因组内的SNPs认为就是物种特异的SNP海岛棉和陆地棉的遗传 多样性高 , 两者之间有明显的遗传分化。通常情况下,遗传多样性可以用SNP频率来量化。本研究中共鉴定44,250 固定 SN

4、P(nearly-fixed cSNPs) 在海岛棉和陆地棉之间高度分化。为了检测群体的遗传多样性 , 我们分别计算了 26 条染色体的遗传多样性群 体分化指数FST,发现海岛棉和陆地棉在全基因组水平上存在较强的遗传分化,A和D亚组的群体分化指数FST分别是0.63和0.65,大于水稻籼稻和粳稻之间的 分化(FST=0.55)(Hua ng et al.,2010)。海岛棉和陆地棉是独立驯化的。用全基因组的所有SNP用于构建四倍体棉花的群体N-J进化树。进化树主要 分化成 2个主要的分枝 , 陆地棉分枝 (包括 85个)海岛棉分枝 (包括 52 个, 其中包 括黄褐棉 , 可能是一个驯化过的地

5、方种 )。通过分析四倍体棉花的群体结构发现,当K(模拟的群体数量)=2时,海岛棉 和陆地棉被分为明显的两组。当K=3时,分为三个明显的分组,海岛棉、陆地棉和 陆地棉半野生种。这个模拟结果与主成分分析的结果一致 , 也与进化树的分析结果一致。从这 三个方面 ,我们证明了海岛棉和陆地棉的遗传分化大 ,为海岛棉和陆地棉的独立 驯化提供了基因组证据。另外,当我们把陆地棉鉴定的 1 09个选择性区域 ,对应到海岛棉的同源区域 发现, 这些区域在海岛棉中并不受到选择 , 这也说明的海岛棉和陆地棉是独立驯 化的。海岛棉和陆地棉之间存在不对称的基因组渐渗现象 , 本研究利用“ 3-群体 检测法” (Myles

6、 et al.,2010;Reich et al.,2009) 进行全基因组检测 ,成功追踪 到海岛棉和陆地棉之间存在的渐渗 , 大约占了基因组的 0.2%,偏向于陆地棉到海 岛棉的渐渗 , 表明陆地棉可能比海岛棉包含更多的与环境适应性相关的遗传多样 性。通过分析还发现11个广泛的渐渗区域,这些区域与纤维品质相关的 QTL有一 定的重合,可能对棉花的环境适应性以及纤维品质和产量有一定的贡献。基因组 证据表明陆地棉半野生种到海岛棉的渐渗主要发生在海岛棉的北移过程中。这种渐渗可能大大改善了海岛型海岛棉的纤维品质和光周期特性 ,从而提高 了海岛棉的适应性。而且,通过海岛棉和陆地棉基因组渐渗的分析 ,

7、发现海岛棉的 驯化始于南美洲西北部的秘鲁和巴西,现在的海岛棉主要有埃及型、Pima型和中 亚型三种类型。陆地棉的驯化与选择。陆地棉栽培种的遗传多样性较低 , 在驯化过程中有非常大的遗传瓶颈,多样性只有半野生种的34.2%(A和D亚组分别32.4%和35.0%)。通过对陆地棉栽培种和半野生种全基因组范围的比较 , 我们发现 109 个的选 择性区域,约占基因组的3.4%。,其中选择信号较高或中度(n race/ n cultivar 值从15.4到39.6)的12个区域,At和Dt是受到共同选择的。结合35个不同组织器官的转录组测序 ,我们发现,这些选择性区域内有 76 个纤维发育和 115 个

8、种子萌发相关的基因相对高表达。其中 , 有两个选择信号较 强的区域(n race/ n cultivar=100.0) 分别在A6和D11染色体上。结合大量的QTL数据发现,D11上的选择性区域内主要是控制纤维长度的QTL,A6染色体上的选择性区域比较大(21.6 Mb),主要是控制纤维长度和衣分的 QTL这些结果为棉花遗传改良和研究多倍体作物的进化和驯化奠定了分子基础。多倍体化或基因组加倍是植物进化的重要动力。 异源四倍体棉花是研究植物 多倍化和基因进化的重要模式作物基因组加倍及复制事件是植物进化的重要动力。多倍体形成以后 , 大量重叠 基因 ( 又叫部分同源基因 ) 的功能和进化研究还不是

9、很透彻 , 总体上 , 复制后的基 因主要有三种命运 :无功能化 (假基因化 ) 、亚功能化和新功能化。在产量相关的杂种优势利用研究中,我们克隆了一个在杂种F1(湘杂棉2号) 以及母本(中棉所12号)、父本(荆8891)差异表达的ERF基因,其序列全长与已 报道的 GhERF1(Qiao et al.,2008) 有很高的相似性。通过染色体定位发现 , 这两 个基因是一对四倍体棉花的部分同源基因,属于AP2/EREBF基因家族的ERF亚家 族B3亚组,分别定位于A07和D07染色体上(陆可钰硕士学位论文),命名两个基 因分别为 GhERF1-7A/7D(GhERF1,GhERF1-7而且,Gh

10、ERF1-7A 基因定位到一个 与棉花铃数相关的QTL(陆可钰)。研究结果发现,这一对部分同源基因中的 GhERF1-7AS因在四倍体棉花中经 历了重叠基因的三种命运类型 :母本中棉所 1 2号的基因无功能化 ,在组织器官和 非生物逆境中的表达亚功能化 , 提高拟南芥单株果荚数目的新功能化。为研究多 倍体植物重叠基因的功能分化提供了很好的分子证据。GhERF1-7AS因在母本中棉所12号功能失活。通过克隆中棉所12号的 GhERF1-7AS因序列,我们发现在基因的ORF第121位有一个碱基“ A”的插入, 导致移码突变而提前终止。为了确认二倍体是否有突变 , 我们分别克隆了二倍体亚洲棉和雷蒙德

11、氏棉的 ERF1基因序列发现,二倍体并没有移码突变。因此,我们认为GhERF1-7AS因的 功能失活变异发生在异源四倍体棉花形成以后 ,而且在棉花的长期驯化中不断受 到选择。GhERF1-7AS因在不同的组织器官和逆境诱导中差异表达。GhERF1-7D在棉 花的非生物逆境响应中起主要作用,而GhERF1-7A在四倍体棉花形成以后发生了 一定程度的亚功能化和假基因化变异。而且,部分保留下来的GhERF1-7A基因还获得了新的功能,可能对棉花的单 株铃数增加起着重要的作用。在拟南芥中过表达GhERF1-7A可以显著增加拟南芥 的单株果荚数和种子产量。另外,GhERF1-7D基因可以改善棉花的非生物

12、逆境抗性,GhERF1-7A可以作为 一个改良作物产量的优异候选基因 , 为棉花的广适、高产育种提供基因资源 ; 而 且,GhERF1-7A乍为一对多倍体中的部分同源基因成员之一,在陆地棉半野生种 和栽培种中序列存在变异 ,我们对 524个棉花品种 ,包括 191 个半野生棉和 333 个栽培种进行了 GhERF基因的测序,发现GhERF1-7AS因的序列几乎没有变异, 很保守,而GhERF1-7AS因的移码突变现象普遍,在陆地棉的基因失活比例只有 25.5%(333个中有 85个有移码突变 ), 而半野生棉中比例高达 52.9%(191 个中有 101个有移码突变),表明GhERF1-7基因

13、在早期陆地棉中经历了大规模的假基因 化。现代栽培种的驯化鉴于人们对产量的追求使得GhERF1-7AS因移码突变的比例逐渐逐渐淘汰而下降。GhERF1-7AS因的序列和功能变异为研究多倍体部分同源基因的功能进化 和棉花驯化提供了重要例证。AP2/EREBP专录因子基因家族是植物中最保守、最 大的基因家族之一。在植物的生长发育和非生物逆境中起着重要作用。 在二倍体的雷蒙德氏棉和 四倍体的陆地棉 TM-1中分别有269个和504个AP2/EREBP基因。雷蒙德氏棉的269个基因主要可以划分为4个亚家族:包含两个AP2结构域 的AP2亚家族、包含一个AP2结构域和一个B3结构域的RAV亚家族,以及只包

14、含 一个AP2结构域的DRE序口 ERF亚家族,另外还有4个基因作为外类群。AP2/EREBP 家族的基因结构域相对保守 , 基因结构简单。这些基因在所有染色体上都有分布 ,但是分布不均匀 ,包含大量的重复基因。 本研究中共分析得到 73 个串联重复基因和 221对片段重复基因。这也是AP2/EREB基因家族基扩张的重要力量。其中,AP2/EREBP基因家族 的串联重复主要来自ERF亚家族B3亚组。通过RNA-sec数据分析发现,陆地棉TM-1中有504个基因至少在一个组织中 表达。另外,逆境诱导的基因表达分析发现,大约68%勺DRE序口 ERF基因受到逆 境诱导表达。其中,132个基因受到冷诱导 ,63个基因受到干旱诱导 ,还有94个基因受到高 温诱导。进一步,我们选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论