




已阅读5页,还剩123页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
i 密级: 论文编号: 中国农业科学院 学位论文 小麦族 A、 S、 D 二倍体种 全长 库 构建及 序列初步分析 , S , S 要 普通 小麦 ( 异源六倍体( 基因组庞大( 1010重复序列多(约 90),发掘、克隆小麦新基因意义巨大。全长 库中 绝大多数克隆不仅包含完整的阅读框架,还拥有 5和 3端的非编码区, 是进行功能基因组学研究的一条有效途径。 在引进、消化吸收的基础上,我们对 做了一些具体的改进,形成了一套简单易行的技术体系,建立了我们自己的全长 库构建技术平台。利用改进的 ,分别构建了 乌拉尔图小麦( A 基因组 , 拟斯卑尔脱 ( 基因组和 粗 山羊草( D 基因组 的全长 库 , 库容量达到了 106,重组率超过 95, 文库中 全长基因的比例分别为 70%、 70%。 基因功能注释表明, 在 得到的 2089 个基因中 , 有 1584 个基因为全长基因, 1346 个为小麦全长新基因,其中 A 基因组 569个 , S 基因组有 553 个 , D 基因组 468 个 。 密码子使用 的偏爱性是在生物长期进化历程中逐渐形成的,影响偏爱性的因素有多种 ,如G+C 含量 ,基因 表达水平,基因的长度 , 丰度等等。 我们以得到的 2089 个基因为考察对象,对小麦中密码子使用的偏爱性进行了分析,统计结果表明 A、 S、 D 三个基因组 间 密码 子使用偏 爱 性没有差别 ,但单个基因组中密码子使用偏爱性明显,如 用频率超过了 35 , 使用频率甚至超过了 45 ;另外 ,还 有 3 种密码子的使用频率超过了 30 , 12 种密码子的使用频率超过 20 。通过与水稻中密码子使用的偏爱性比较, 我 们发现在拥有 4 6 个 同义密码子 的 氨基酸 中 , 水稻和小麦在 优先使用密码子 方面 存在明显的不同,水稻中优先使用 密码子的末尾碱基倾向于 U 和 C,而小麦中则倾向于 G 和 C。 比较基因组学是基因组学研究的重要内容,通过进行不同层次的 基因 组比较,不仅可以了解不同物种的基因及基因组在结构、功能以及表达调节方面的差异,而且 有助于 揭示物种的起源 和进化 的动力。 我们利用分子进化的分析方法,以测序得到的 22个基因为考察对象,通过构建基因进化树来探索小麦 A、 S、 计结果表明,来自 A、 亲缘关系 普遍较近,而与 一结果在之后的 有数量多,分布广, 高度稳定, 适于快速、自动化 检测 ,应用前景广阔 等特点 ,因而倍受青睐。我们 以测序得到的 2089 个来自小麦不同基因组的基因序列为源序列,利用件,从 小麦 中检测到 1296 个 辟了一条通过单基因组测序发掘小麦 有效途径。在所得的 , 有 397 个自 A 基因组 , 322 个来自 420 个来 自 D 基因组 ;另外, A 和 D 基因组共同的 154 个, A 和 S, S 和 D, 和 D 基因组共有的 仅有 1 个 。分析表明小麦中碱基 平均变异率为 , 与 大豆中的研究结果( )非常接近,而与玉米中的研究结果 ( ) 相差较远。 关键词: 基因组供体 , 全长 库,单核苷酸多态性,密码子使用偏爱性,分子进化, 比较基因组学 is of in it . A. Up to a of 010 0) . As of DS of as is as an to in on we of we of s A, B, D of of of of in 0%, 0%, 584 346 in 089 569 553 68 is of of in a of as +C, of of We 089 in s no of in 5 , 5 ; in 0 2 0 。 in we In -6 of in , in . is of by at it to of We 2 of of on we of , D in , S, D is of 089 as 296 397 322 20 v of 54. , S , A, S in , to of ) , ). 录 第一章 引言 . 1 物功能基因组学的发展和小麦基因组研究 . 1 因组学的诞生和发展 . 1 物功能基因组研究的技术 . 2 麦基因组学研究现状 . 3 长 库构建与全长 . 4 通 库 . 4 减文库 . 4 一化 库 . 6 长 库 . 6 较基因组学与小麦染色体组研究 . 14 较基因组学研究方法 . 14 较基因组学在小麦基因组研究中的应用 . 15 子进化研究进展 . 16 统进化树 . 16 统进化树的构建方法 . 17 子进化与系统发育分析软件 . 19 统进化树的构建 . 20 子进化的发展与应用前景 . 21 子进化在小麦进化研究中的应用 . 22 码子使用偏爱性研究进展 . 22 通小麦 的分类和起源 . 23 麦的分类 . 23 通小麦的基因组起源 . 23 麦基因组起源研究方法 . 25 麦基因组起源研究的对象 . 25 核苷酸多态性研究进展 . 25 定义及特点 . 26 掘、检测 技术和方法 . 27 应用前景 . 29 第二章 论文设计 . 33 题依据 . 33 通小麦的起源 . 33 长 库在功能基因组学研究中的地位 . 33 麦 A、 S、 D 基因组间的比较研究 . 34 麦 掘存在的困难 . 34 究目的 . 34 期目标 . 34 术路线 . 35 第三章 小麦二倍体基因组供体种 全长 库构建与测序 . 36 料与方法 . 36 料 . 36 法 . 39 果分析 . 51 长 库构建结果 . 51 长新基因发掘及基因功能注释 . 55 麦 A、 S、 D 基因组密码子使用偏爱性分析 . 58 论 . 61 响 库全长比例的因素 . 61 长判定 . 62 长 库与小麦功能基因组研究 . 62 第四章 小麦 A、 S、 . 64 法 . 65 果与讨论 . 67 第五章 小麦 掘 . 72 掘流程 . 72 果与讨论 . 73 第六章 结论 . 79 附录 . 81 附录 . 81 附录 . 89 附录 . 99 参考文献 . 107 作者简历 . 121 中国农业科学院博士学位论文 第一章 引言 1 第一章 引 言 物功能基因组学的发展和小麦基因组研究 因组学的诞生和发展 现 螺旋结构,标志着分子生物学的诞生。在随后的半个世纪里,分子生物学得到了 迅猛的 发展,尤其在最近的 30 多年中,由于基因克隆技术 的 出现和不断改进,人们克隆了许多重要 基因。限于技术和认识 制约 ,以往许多研究主要集中在一个或几个基因上。随着生物学 、 工程学 和计算机科学的 发展,高通量测序技术的涌现,人们开始通过全基因组测序来研究生物 遗传物质的 组成 和 结构 ,由此诞生了基因组学( (2001)。 基因组学的概念最早由美国 科 学家 1986 年提出的。它涵盖的研究内容相当广泛, 包括全基因 作图(包括遗传图谱,物理图谱和转录图谱),核苷酸序列分析,基因定位和基因功能分析等。根据基因组学的研究内容可以将其分为结构基因组学和功能基因组学两个部分,前者 是 基因组分析的早期阶段,以建立生物基因组高分辨率的遗传、物理和转 录图谱 为目的;后者则是利用前者提供的序列信息,系统地研究基因的功能, 以高通量、大规模实验方法以及统计和计算机分析为特征。随着人类基因组计划的完成和多种模式生物全基因组测序的结束,科学家们的 研究中心由对基因组的序列分析转移到从整体水平对功能的研究上, 基因组研 究也从研究基因组的结构阶段过渡到功能基因组研究阶段,即后基因组 时 代 ( 。 拟南芥基因组计划的实施标志着植物基因组的诞生,其全基因组测定的完成是植物学发展史上的一个里程碑( et 2001)。随着双子叶模式植 物拟南芥和单子叶植物水稻全基因组测序的完成,植物基因组研究也进入 功能分析时期, 标志着植物功能基因组学的诞生。 植物基因组学研究已经受到各国科学家及政府机构的重视,在新一期的五年计划中,美国国家自然基金 委 斥资 1 亿美元用于资助这方面的研究。欧盟国家基因组研究协助网投资 欧元用于加强植物基因组研究。植物基因组研究在我国也非常受重视,以北京基因组研究所为首发起的 籼稻 全基因组测序为植物基因组研究做出了巨大贡献 (et 2003),目前已经启动以研究中草药基因组的 神农计划 更是前途无量。国际上有 很多生物公司也非常注重植物基因组研究,如司等。正是这些盈利性公司的参与和竞争,大大加速了植物基因组研究的进程。 基因组学的诞生和发展与其它学科的发展密不可分,是一门多学科相互交叉、渗透的 大科学 。基因组学的发展也带动了其它相关学科的产生和发展,生物信息学就是其中的一个代表。广义的生物信息学是使用数学、物理和信息科学的观点、理论和方法来研究生命现象 , 组织、分析呈指数增长的生物学数据。生物信息学的一个重要内容 是 通过开发各种相关的软件,对日益增长的核酸或蛋白质序列进行 收集、整 理,加工、提取其中最本质,最规律的东西,并反作用于生物 基因组研究,对基因可能的结构和功能进行预测和分析。因此 , 生物信息学的方法已经成为功能基因组学研究方法的重要组成部分。 中国农业科学院博士学位论文 第一章 引言 2 物功能基因组研究的技术 功能基因组学是一个崭新的研究领域,其研究方法也正在不断发展和自我完善。根据研究方式的不同。可以将植物基因组研究方法分为两类,一类建立在实验的基础上,通过具体的实验 研究基因组的功能;另一类建立在生物信息学分析的基础上,它通过对 已有的信息的整理,分析,提取其中规律性的东西 ,用于 其它 生物 基因组研究上。 以 实验为基础的方法主要包括以下几种: 入 /转座子标签法,基因表达序列分析技术、表达序列标签技术、生物芯片、蛋白质组学和 扰技术。 1) 座子标签技术是利用转座子或 为生物诱变剂,通过它们对目的基因的插入失活而实现对目的基因的标记,根据基因和表型间的相互关系确定基因的功能 (李伟等2000) 。 2) 基因表达序列分析技术 在植物功能基因组研究 中常用的主要是 签技术。 常为 300 500核酸序列,是 库随机测序得到的 段,由于 自基因的编码区 段,所以它所反映的是生物在某一特定条件下表达状况。该方法借助高通量测序技术来了解生物特定组织,特定器官,特定时期的基因表达信息。 3) 生物芯片技术 生物芯片包括 片和蛋白质芯片两种类型。 片是根据核酸分子杂交 的 原理设计而成的,它按照特定的排列方式将大量的基因探针或基因片段固定在特定的载体上,通过杂交检测基因的表达状况。蛋白质芯片类似于 片,不同的是它是将蛋白质或多肽固定在载体上。其检测原理类似于抗原抗体间的免疫学反应。 4) 蛋白质组学研究 基因是遗传物质的携带者,而生物功能的执行者却是 蛋白质,后者有其自身的活动规律,所以仅仅从基因的角度来研究基因的功能是远远不够的。蛋白质组( 概念最早由澳大利亚 学的科学家 1995 年提出的,它 包括基因组表达产生的全部蛋白质及其存在方式。蛋白质组学是对不同 时间和空间发挥功能的蛋白质群体进行研究,从蛋白质水平来探索蛋白质的作用方式、功能机理、调节调控以及蛋白质群体间的相互作用。由于蛋白质存在多样性、可变性和复杂性的特点,同时还存在低表达蛋白质难以检测等特点,所以研究起来相对较困难。 5) 扰技术是最近几年 兴起的一种功能基因组学研究方法,已经在植物功能基因组学研究中得到应用。其基本原理是内源或外源的 生物体内形成双链 , 经 1 23小干扰 NA 后者与 导沉默复合体结合,借助 导向作用,对底物进行特异性降解,使细胞中 水平下降,达到沉默基因的目的。 生物信息学 方法在功能基因组研究中已经得到广泛应用。我们常用的 n), x)以及根据保守 结构域 和直系同源簇 进行的比对都是建立在生物信息学基础之上的, 通过未知基因与已知基因 的比较,推测、 确定基因的功能。目前 , 由于拟南芥功能基因组 已经研究 得比较深入,所以许多人以它作为比较 的 模板 。随着单子叶模式生物水稻基因组研究的进一步深入, 以 单子叶植物 为 研究 对象 科学家们将会有更多的选择余地 。 中国农业科学院博士学位论文 第一章 引言 3 麦基因组学研究现状 小麦为世界 上种植面积最广的 大粮食作物 (占作物种植总面积的 17) , 是世界上 40人口的主要粮食来源, 然而由于小麦基因组庞大 (010),重复序列多( 约 90%),小麦基因组研究远远落 后于基因组较小的模式植物,这与小麦在世界粮食生产中的地位极不相称 。虽然水稻作为单子叶植物的模式生物已经完成全基因组测序,但研究表明它与小麦之间存在很大的差异,只有深入研究小麦基因的结构和功能,才能使小麦科学取得突破性进展,进而促进小麦的生产。 由于小麦在世界粮食生产上的特殊经济地位,世界上从事小麦生产的发达国家都十分重视小麦基因组学研究特别是功能基因组研究。目前的研究主要集中在 发, 菌人工染色体)文库构建,基因组测序和全长 究四个方面。 1998 年正式启动的的国际小麦族 划( ST ,得到了大量的 列, 为小麦功能基因组研究奠定了基础 。 目前 小麦 量 为552,245 条,(引自 , 2004),成为禾本科作物中 列 数量 最多的作物。小麦 划的实施为发掘小麦新基因提供了便利条件,但由于 列一般都比较短,仅有 300 500我们提供的信息有限,仅借助小麦 列,实现大批量的基因功能分析还有一段距离。 构建高质量的 库 是进行重要基因克隆的一项重要的基础性工作。目前美国、法国、澳大利亚、英国、加拿大等国都在从事小麦 构建工作,我国也构建了六倍体小麦和乌拉尔图小麦的 库。 通过构建 库,实现对小麦基因富集区的克隆,为小麦基因组测序奠定基础。 2003 年 8 月召开的 国际小麦基因组大会 将小麦基因 组研究分为三个阶段, 其中前两个阶段( 2004 2008) 主要 以 构建精细物理图谱 为主 ,第三个阶段( 2008 2010) 开始 实施小麦染色体上基因富集区的测序计划 。小麦基因组计划的启动 对小麦基因组研究的深入开展无疑是很大的促进 ( ) ,但 测序 计划 从 实施 到 完成还需要 等六年的时间 , 这显然 不能满足科学家们对小麦研究的需求 。 构建小麦全长 库是小麦基因组研究的重要内容。 通过构建全长 库可以不通过全基因组测序而获 得大批表达基因的全长,对小麦这样的超大基因组作物来说,是一种特别经济有效的方法。全基因组测序的基因预测是通过计算机软件来实现的,由于人们对植物体内基因的拼接、修饰、加工过程缺乏足够的了解,目前基因预测的的正确性仅有 60左右,即使是小基因组植物(如拟南芥,水稻)也是如此,通过 库获得的基因可以避免这一错误。全长 的一个完整基因,与 比,可以提供更多的信息,并可以获得基因的旁侧序列。由于全长 有以上优越性,因此近年来世界上许多国家都开展了一全长 核心的基因 组研究,包括目前已经测序的生物,如人、小鼠、拟南芥、水稻等。目前,开展小麦全长 验室和美国的 司。由于全长 专利密切相关,因此目前获得的数据都未公开。 有关全长 库在植物功能基因组研究 中 的应用已经在单子叶模式植物水稻和双子叶模式植物拟南芥中得到证明( et 2003; et 2004; et 2004)。通过构建全长 库 , 可以跨越结构基因组研究的初 级阶段,直接进入功能基因组学研究的高级阶段。中国农业科学院博士学位论文 第一章 引言 4 因此,必须 抓住难得的契机, 构建小麦全长 库 , 开展小麦功能基因组研究 ,占领小麦功能基因组研究的先机 。 长 库构建 与全长 库是在基因组水平上研究某一生物特定器官,特定组织,特定的发育时期基因表达的前提和基础。根据 库的构建方法及文库的特点不同可以将其大致分为以下几类:普通库,差减 库,均一化 库,全长 库以及全长差减 /均一化 通 库 普通 0世纪 80年代初期( et 1980; et 1980),囿于选择标记、插入片段长度和多克隆位点的限制,最初构建的文库插入片段普遍比较小,文库筛选也非常困难。为此,前人在载体改进上做了很多工作, 载体的类型也 由最初的质粒载体发展到现今的噬菌体载体,文库的质量得到了大幅度的提高。但全长 以得到的大部分是基因片段,不利于后期基因结构功能的分析,尤其不适合当今大规模发掘新基因的要求。 减文库 减 文库的原理 差减文库( 称扣除文库,最早出现于上世纪 80 年代初期( et 1981)。其构建的原理是从两种遗传背景相同或大致相同,而功能不同的材料或经过不同处理的材料或植物的近等位基因系提取 反转录成 在一定条件下用远远过量但不含目的基因的 含有目的基因的 检测方 行杂交,选择性地除去部分共同的表达产物,收集未杂交目的产物,构建成 库。该方法的优点在于可以将 品中大 量相同的基因除去,使差异表达的基因得以富集。差减杂交是构建差减文库的核心,差减文库的质量如何很大程度上取决于杂交效率的高低。 减 库的构建方法 目前,根据差减杂交的策略可以将差减文库的构建方法分为以下几种:( 1)羟基磷灰石柱层析法( 该方法最早出现在 20 世纪 80 年代初期 ( et 1983),在差减杂 交研究的早期应用较多。其基本原理是基于羟基磷灰石对单链和双链的吸附能力不同。当将杂交后的混合物
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电影场记合同模板
- 二零二五版公司无偿使用车辆合同
- 属事业单位招聘面试资格二零二五年
- 天猫运营承包合作协议
- 卫生间改造施工方案计划
- 2025年记忆绵家居制品项目建议书
- 人教版七年级数学《整式的加减》教案
- 人教部编版四年级上册语文《女娲补天》教案
- 公司出游租车合同样本
- 借款分红合同标准文本
- 易制毒、易制爆化学品安全培训
- 美女金喜善写真集
- 入伍简历当兵简历.doc
- 前列腺癌临床路径(最全版)
- 国家旅游局新版团队出境旅游合同模板
- 4S店三表一卡标准模板
- 南京地铁四号线风井主体结构施工方案
- 高中生物竞赛 第九章 染色体畸变课件
- 四年级下册《小数的意义和性质》整理和复习
- 土壤污染修复技术对比分析
- 3万高炉转炉混合煤气柜技术规程
评论
0/150
提交评论