




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
By 山风海光 对水稻地方品种对水稻地方品种 14 个农艺性状的全基因组关联分析个农艺性状的全基因组关联分析 摘要 摘要 作物的地方品种能够适应各种农业气候条件 所以对地方品种农艺性状遗 传基础的解析 对全球粮食安全有着十分重要的意义 本研究通过对 517 个水稻 地方品种的测序 发现了 3 6M 的 SNPs 并且利用一种新的数据填补方法构建了 高密度的水稻基因组单体型 haplotype 图谱 同时对籼稻亚种的 14 个农艺性状 进行了全基因组关联分析 GWAS 通过 GWAS 鉴定到的座位平均能够解释约 36 的表型变异 有 6 个位点的峰值信号和之前鉴定到的基因位置非常靠近 本 研究为水稻的遗传研究和育种提供了重要的基础资源 并且证明结合二代测序的 GWAS 可以作为依赖双亲杂交的定位研究水稻复杂性状的一个强有力的补充策 略 引言 略 结果 结果 影响基因组测序和影响基因组测序和 SNP 的鉴定的鉴定 从大约 50 000 份原产于中国的水稻资源收集中 我们准备构建一个包括形 态 遗传和地理等方面多样性丰富的大样本 用于遗传研究 在本研究中 我们 从中共选出 517 份地方品种 并进行了全面的表型调查 参考在线方法 我们 使用 Illumina Genome Analyzer II 测序仪 采用条形码多重测序技术对这些地方品 种进行了大约一倍覆盖的测序 来对这些地方品种进行基因分型 三个额外的已 有准确的基因组序列的品种也被测序作为评价序列精度 补充资料 的内部参考 产生了超过 27 亿个 73bp 的配对末端标签序列 总体而言 所有用于分析 SNPs 的序列构成了对水稻基因组 508 倍的覆盖 读取的序列与水稻的参考序列进行比对以鉴定 SNP 我们对每个水稻品种通 过读取序列的比对建立一致的基因组序列 采用一系列的过滤标准 消除测序和 定位的错误 具体参看在线方法和补充附注 每个水稻品种所获得的共有序列 平均覆盖参考基因组的 27 4 从 12 0 到 46 7 获得的共有序列与 BAC 文 库序列和高覆盖Illumina的数据比对显示 该序列特异性达到99 9 补充表2 SNPs 的获取方式是基于共有序列与参考基因组之间的差异 排除单个唯一的 SNP 之后 SNP 获取的错误率降低到 2 7 补充图 2 和补充表 3 总计鉴别出了 3 625 200 个非冗余的 SNP 平均每 KB 有 9 32 个 SNPs 其中 87 9 的 SNPs 位于 最邻近的 SNP 的 0 2kb 之内 补充图 3A 约 78 的 SNP 被发现位于基因的间隔 区 余下的 SNP 最多的是在注释的基因的内含子中 其次是位于注释基因的编 码区和非编码区 补充图 3b SNP 的染色体分布如补充图 3c 所示 尽管我们 SNP 图谱是高密度的 但是 重复获得的比例 实际 SNPs 重复获得的比例 仅 为 20 1 这可能是由于低覆盖度测序中短的序列读取的不规则和水稻基因组的 复杂性和重复性导致的 为了了解检测到的SNPs潜在的功能作用 我们进一步分析了位于编码区的SNPs 一共有167 514个SNPs被发现位于25409个带有转录信息支持的注释基因上 RAP2 数据库 我们还发现3625个大效应的SNPs SNP代表的突变预测引起较大的影响 补充表4列出了注释的SNPs预测效果的类型 Among the annotated genes 107 genes were over 大效 外 可能 它们 群群体体 遗传 分别 鉴别 地方 种 neigh 于每 频率 因组 0 00 了至 和粳 分化 1 亚种 些亚 SNP 的非 基因 补 分分 曾认 我们 r represented 效应的变化 我们观察 能反映了定 们是已知与 体体结构和结构和地地 选定的 51 传距离决定 别属于栽培 别出 373 个 方品种的地 这可能是历 Fig 1 517 个地 hbor joining 树 每一个 SNP 我 率 颜色指数反 组水平平均 LD 衰 根据 SNPs 016 粳稻为 至少 80 的 粳稻地方品 化 筛查籼 10 个 S 种中 0 05 亚种特有的 Ps 与所有的 非同义 同义 因含有效应 补充表 6 然后 我 分析 PCA 认为 驱动中 们测试了纬 d for large e 化 这表明 到 有11个 向或随机选 抗病相关的 地地理分化 理分化 17 个中国水 的 Fig 1 培稻的两个亚 个典型的籼稻 地理分布比籼 历史上偶尔 地方水稻品种 树 红色 籼稻 我们确定了在所 应每个等位位 衰减速度 s 数据 所 为 0 0006 世界水稻品 品种的群体分 籼稻粳稻间频 SNP 几乎是 又有总计 标签可能会 的研究的 SN 义突变比例 应很大的完全 我们研究了亚 籼稻和粳 中国栽培稻 度分布差异 effect change 这些可能是 个基因家族非 选择 补充图 的 水稻地方品 由此产生 亚种 籼稻 稻地方品种 籼稻扩展的 尔发生的籼粳 种的多样性和 稻 蓝色 粳稻 所有地方品种中 点 SNP 的个数 所有采样品种 这些估计表 品种 且籼稻 分化指数 频率差异很 是固定的 计 127729 会反映以及 NPs 比起来位 P 0 0001 全分化的 S 亚种内的群 粳稻都有三 稻分化的首要 异 发现籼 By 山风海光 es 这些注释 是不正确的 非同义 同义 图4 这其中 品种的系统进 生的 neighb 和粳稻 ne 种和 131 个典 的更向北 补 粳亚种间杂 地理起源 稻 紫色 中间 中次要等位变异 数 c 从 373 种的序列多 表明 我们 稻地方品种 FST 约为 很大的所有的 等位基因频 3 5 个 及影响 强大 位于编码区 1 此外 在 SNPs 这可 群体结构 根 三个亚组 分 要元素是随 籼稻第 3 组比 释基因中 1 的基因注解 义突变的比 中包括编码 进化关系 bor joining eighbor join 典型的粳稻 补充图 5 杂交的结果 a 根据所有 间型 b 籼粳 异 然后计算出 份籼稻 红 和 多样性 们研究的地方 种的遗传多样 0 55 表明 的 SNPs 后 频率在一个 个 SNPs 是被 大的籼粳分化 区 P 0 被完全固定的 化 我们发 01 的比例非 因组中 我们 亚种分化相 bor joining 为 1 2 和 3 化的光周期 组 p 0 00 是过多代表 补充表5 P 0 01 构蛋白的基 NPs 计算得出 两个不同的 基部 我们能 图 1a 粳 中间类型地方 分的生殖隔 单匹配距离构 基因频率的比较 异在籼稻和粳稻 色 地方品种估算 0024 籼稻 遗传多样性代 高于粳稻 籼 在很强烈的群 现总计 367 95 而在另一 的 图 1b 发现完全分化 非常小 和较 们确定了 5 相关的基因有 树 以及主 图 2 之 期和温度的渐 001 或籼 表了 此 这 基因 出的 的群 能够 粳稻 方品 隔离 构建的 较 对 稻中的 算的基 稻为 代表 籼稻 群体 7081 一个 这 化的 较低 3 个 有关 主成 之前 渐变 稻 2 组 另外 亚组 略小 谱的 充图 0 6 Fig 2 a 色编 b c d e f 全全基基 定义 组水 到 0 从 1 导致 中相 位的 关性 群体 相对 水水稻稻 对5 P 0 5 这 稻亚种的地方品 方品种的 neighb 方品种的主成分 组地方品种的地 方品种的 neighb 种的主成分 PCA 地方品种的地理 平平的连锁不的连锁不平平 SNPs 数据 两两相关系数 和粳稻 LD 8 图 1C 超过 200kb 是 一步研究这两 补充图 8 值得注意的是 数为 0 01 论是局部还是 花传粉的亚 的的高密度单高密度单体体 方品种基因 靠北 图 2c P 0 0001 味着在籼稻 高于不同人 群分化 FST沿 一些区域具 这表明它们 品种的群体结构 bor joining 树 分 PCA 散点图 地理起源 bor joining 树 A 散点图 理起源 平平衡模式衡模式 据分析了籼稻 数 R2 下降 衰变率估计 这与以前 是一致的 这 两个亚种的 这大概会 是 籼稻和 这与在人 是整体的 LD 亚种间部分 体体型图谱型图谱的的 组的测序能 By 山风海光 c 在粳稻 图 2f 内部的分化 人群之间的值 沿着染色体 具有较高的 们可能包含地 构 通过 neighbor 从树上确定的 稻和粳稻地 降到其最大 计分别为 1 前的估计 栽 这可能是自 的全基因组 L 会导致在不 和粳稻的 LD 人类中观察 D 变化都很 分的生殖隔离 的的构建 构建 能够高精确 稻中看到了类 群体分化的 化处于中等 值 FST 0 1 体表现出极大 FST 粳稻的 地理适应所 r joining 树鉴别 的三个粳稻亚组 地方品种的 大值的一半时 23kb 和 16 栽培稻具有 自花授粉和一 LD 模式 LD 不同的基因组 衰减率跟整 察到的是显著 很小 籼稻和 离历史积累 确度鉴定大量 类似的模式 的度量 FST 水平 粳稻 12 两个 大的差异 的长度为 2 所需要的位点 别出的三个籼稻 组从 d f 采用彩 LD 水平 L 时染色体的 7kb 其中 有较长的 LD 一个相对较 D 在籼稻和 组区域出现 整个基因组 著不同的 和粳稻之间 的结果 量的SNPs 式 其第 3 组 T 籼稻的三 稻内的遗传分 个亚种的精细 补充图 6 和 2 1MB 籼稻 点 稻亚组从 a 到 c 彩色编码 LD 的衰减速 的长度 全基 的 R2分别下 衰减水平大 较小的有效种 和粳稻的基因 现不同的关联 组只有微弱的 在不同的人 间的差异可能 然而 基因 组比 三个 分化 细图 和补 稻为 c 用彩 速率 基因 下降 大约 种群 因组 联定 的相 人类 能是 因型 数据 未发 neig 们采 化一 率 所有 准确 缺失 和第 的单 Fig 对缺 后类 a b c d 值得 5 适用 14 个个 以及 GW 分 据集包含许 发展到可以 ghbor algorit 采用的KNN算 一些基因组 改进后的 有517个地方 确率超过98 失率又稍高 第二代测序 单体型图谱 3 群体和实群体和实验验 缺失基因型填补 类似于数据不缺 基因组区域 L 测序的错误率 测序的覆盖范 群体大小 个体 然后 我 得注意的是 准确率高 用于 LD 较短 个个性状的性状的全全 水稻的高 及较慢的 LD WAS 的性能 分蘖数和叶 许多未获取到 明确处理低 thm KNN 算法 探讨 组和群体参数 算法 用来 方品种的基 8 附表3 高的准确性 序技术 允许 谱 验验因素对基于因素对基于 K 补的特异性通过 缺失的基因型数 LD 的衰减变化 率 模拟介绍了 范围 来自低测 体被随机删除 我们审查了各 是 这种方法 高于 95 短的其他基 全全基因组关基因组关联联 高密度的单体 D 衰变速度 我们进行 叶角 产量 到的基因型 低覆盖的基 处理无参考 讨局部单体型 数 在线方法 来估算一倍 基因型填补 这需要超 补充图10 许比基于芯片 KNN 的填补方的填补方法法 过与 BAC 序列和 数据比例 灰色 化范围从150 kb 以 误率 拟序列被删除 群体较少的一 和实验因素对 D 为 10kb 时 我们的对低 使全基因组关 一物种的 G 艺性状的 GW 粒宽 粒长 做GWAS是不 数据 可用 图谱的缺失基 性和进一步发 文件 来提供 序未获得的 因型的缺失率 覆盖的水稻基 我们的方法 型显著低成本 通过特异性和 llumina 数据参 95 亮色显示 以 10kb 为间隔 系列模拟数据 对数据估算 时依然表现 低覆盖基因组 关联分析成 GWAS 的发展 WAS 表型可 长 粒重和 不足的 数 的填补模式 基因型似乎 发展了一种 供有效的填 的基因型数据 率从61 7 减 基因组测序 法 有效的 本的同时快 和填补率对估算 参照评估 充填 示了不同面板上 算性能的的影 良好 丢失 组测序的数 成为可能 强 展不是很顺 可以分为五 和小穗数 数据填补方法 式 k neares 乎是有效的 种算法 通过 填补准确率和 据 补充图 减少到2 9 序来获得如此 的结合填补策 快速建立高密 算性能进行了评 填率的确定采用 上使用的不同尺 影响 图 3 失的数据率低 数据估算方法 强烈的群体结 顺利 为了评 五类 形态特 籽粒品质 法尚 st 我 过优 和效 图9 此低 策略 密度 评价 用填补 尺度 3 低于 法也 结构 评估 特征 糊 By 山风海光 化温度 直链淀粉含量 着色 稃尖颜色 果皮颜色和颖壳颜色 和生理特性 抽穗期 耐旱性和落粒性 补充图 11 由于栽培稻两个亚种之间的种群分化非常强烈 我们没有采用贯穿两个亚种 的关联分析 我们进行了 373 个籼稻的 GWAS 基于测序的基因型数据在籼稻中 平均每 kb 含有 1 7 个 SNPs 较少的等位基因频率 0 05 同时使用了简单的模 型和压缩的混合线性模型 MLM 来鉴定关联信号 MLM 方法 它采用全基因 组的遗传相关性参与计算 大大降低了假阳性 如 quantile quantile 点图所示 图 4和补充图 通过压缩MLM在P值P 5 107是共发现了37个关联信号 表1 利用简单的模型 在 P 108时我们也鉴定出了强烈的关联信号 如果有过多的关 联 舍弃其它 选择各性状的五个最显著的信号 附表 7 我们总共确定了 14 个农艺性状的 80 个关联信号 所有性状两种模式的 Manhattan 散点图如补充图 12 23 显著关联的位点的详细信息总结在补充表 8 因 的差 位点 现他 六个性状 图 5 和补 差异 精度 点往往靠近 然后 我们 他们都表现 状的关联信号 补充文件 度都小于 26k 近已知基因 们直接通过 现出比峰值信 号靠近已报 虽然不同 kb 其中有 但不属于 过 PCR 扩增和 信号附近稍 By 山风海光 报道的通过 同位点的关联 有 1 3 个基 于 和测序分析 稍微弱的关联 突变体或者 联精度不同 因 值得注 析了三个已 联性 补充 者重组群体 同 这主要是 注意的是 知基因的相 充表 9 这 体确定的已知 是因为局部 GWAS 的峰 相关多态性 这些结果与在 知基 部 LD 峰值 性 发 在拟 南芥 体结 一个 点控 成分 整个 已知 24 产生 的数 Fig 4 a 体上 b c 芥中类似研 结构的结果 总之 数据 个极端的例 控制的性状 分 R2 0 5 个基因组上 知控制抽穗 虽然压缩 生稳固的有 数量性状位 籽粒宽度和籽粒宽度和抽抽 籽粒宽度简单 上 蓝色水平虚 籽粒宽度简单 谷粒宽度压缩 研究是一致 果 据显示 群体 子是抽穗期 状 我们发现 并与籼稻地 上巨大的关联 穗期的基因附 缩 MLM 方法 有统计意义的 位点 QTL 抽抽穗期的全基穗期的全基因因 单模型的 Manh 虚线表示的全基 单模型的 Quan 缩的 MLM 法 M 这可能是 体的结构在 期 开花时 现 抽穗期强 地方品种的 联峰 图 4e 附近 但这 法减少假阳 的效果 根 因因组关联分析 组关联分析 hattan 散点图 基因组显著性阈 tile quantile 点 Manhattan 散点 By 山风海光 复杂的caus 在多种显著的 时间 一个 强烈的与群 的纬度分布 e f 这些 这些信号在全 阳性数量 本上 GW 从全基因组扫 阈值 点图 点图 如同 a sal polymorph 的程度上扰 个受群体结构 群体结构和地 R2 0 3 因 些峰中 发现 全基因组水 图 4g h SA 并没有统 扫描得出负 Lo hisms有关多 扰乱了性状的 构强烈影响 地理分布关 因此 简单 现最恰当的 水平上并不能 但太多的 统计方案可 g10 转化的 P 值 多态性和复杂 的关联 图 响和许多微效 关联 与第一 单的模型会得 的信号处于三 能凸显 附 的结构使它不 可检测影响结 值 标注在每条 杂群 4 效位 一主 得出 三个 附图 不能 结构 条染色 d e f g h 解释 的 S 质和 关基 强的 的多 选 的位 于补 谷粒宽度压缩 抽穗期简单模 抽穗期简单模 抽穗期压缩的 抽穗期压缩的 我们进一 释大约 36 SNPs 高许多 和籽粒宽度 基因 上述 的关联 图 多个位点对 基 因 可 Fig 6 鉴定的 位点数目表示 补充资料 Tabl 缩的 MLM 法 Q 模型的 Manhat 模型的 Quantile 的 MLM 法 Ma 的 MLM 法 Qu 一步考察了 1 的表型变异 多 六个性 度 图 4a d 的六个已知 5 和补充文 对表型变异作 可 以 加 深 的 14 个农艺 示在竖条的顶 le 7 从两种 Quantile quant tan 散点图 e quantile 点图 nhattan 散点图 antile quantile 14 个农艺性 异 不同的 性状有一个或 我们观察 知基因 五个 文件 至于 作出贡献 本 深 我 们 对 性状的位点对 顶端 cMLM 得 种模式共有的 By 山风海光 ile 点图 图 图 如同 a 点图 性状的遗传 的表型从 6 或两个相对 察到控制这 个引起了相 于其他性状 本文发现的 对 这 些 性 对各个表型变 得出的位点列 的基因位点去 传建构 确定 至 68 对强的关联峰 这六个性状的 相关的表型 状 我们的结 的新位点是后 性 状 的 遗 变异的贡献率 列于 Table 1 除冗余 列于 定位点的 SN 图 6 这比 峰 这些是 的位点都有 这五个同 结果表明 后续研究具 遗 传 建 构 率 用于计算 从简单的模 于补充资料 T NP 峰值 平 比在人中 GW 是颜色 籽粒 有之前鉴定的 同时也显示了 相对效应较 具有吸引力的 构 的 理 解 算表型变异的 模型得出的位 Table 8 平均 WAS 粒品 的相 了最 较小 的候 解 贡献 位点列 Fig 5 值 负 L 基因 的基 LD a b c d e 讨讨论论 以用 的序 5 与之前鉴定 P 值最低的 Log10转化的 因组水平显著 基因 此前鉴 稃尖颜色 果皮颜色 糊化温度 直链淀粉含 籽粒宽度 f 籽粒长 论论 这些研究 用于高分辨 序列多态性 定的基因很近 SNP 两侧 0 P 值绘制在垂 著性阈值 每 鉴定的控制性 含量 长度 究表明 水稻 辨率的水平 性和高关联精 近的 显示很 0 5MB 区域 垂直轴上 坐 个面板的底部 性状的基因被标 稻地方品种 此外 对地 精度 尽管 By 山风海光 很强的关联信 其位置是由 坐标刻度每个 部显示 SNP 峰 标记出来 L 的 GWAS 可 地方水稻品 管在水稻中存 信号的基因组 由一个红色垂 个面板之间略 峰值两侧
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人买股合同样本
- 光伏发电安装用工合同样本
- 保安招聘服务合同标准文本
- 买房按揭贷款合同样本
- 公司前期租房合同样本
- 代理单位度合同标准文本
- 偿债合同样本
- 关于xps挤塑板购销合同样本
- epc合同样本深圳
- 保定劳务合同样本定制
- 类风湿关节炎病情活动度评价表(DAS28)
- A4纸笔记本横格线条打印模板
- 【施工组织设计】内容完整性和编制水平
- 2023公路桥梁钢结构防腐涂装技术条件
- (13)-2.7科学把握理想与现实的辩证统一
- Unit5Poems单元分析讲义高中英语人教版选择性
- 青岛版六年级数学上册 (完美的图形)教学课件(第1课时)
- 2022新能源光伏发电工程竣工决算报告模板
- 2023超星尔雅《创新创业》答案
- 110kV变电站短路电流计算书
- 船舶带缆知识学习
评论
0/150
提交评论