作物分子身份证构建软件idanalysis的设计与实现_第1页
作物分子身份证构建软件idanalysis的设计与实现_第2页
作物分子身份证构建软件idanalysis的设计与实现_第3页
作物分子身份证构建软件idanalysis的设计与实现_第4页
作物分子身份证构建软件idanalysis的设计与实现_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

作物分子身份证构建软件idanalysis的设计与实现

0总结【研究意义】黑龙江省是中国的主要大豆产区。1986年至2010年,共试验了275个大豆品种。1材料和方法1.1数据收集参试材料于2008年播种于黑龙江省农垦科研育种中心基地,选择40对引物对40个大豆品种进行分析,参考陈庆山等1.2分子标记多态度其中,行对应的是n个材料,列对应的是m个标记,其中,a定义S定义V标记多态度:在分子标记中,单标记或标记组合的全部类型,叫作标记多态型,标记多态型的个数,叫作标记多态度,用d表示。1.3相邻标记区分度相关系数计算作物分子身份证理论及逐步扩增法的算法由组陈庆山逐步扩增法的具体过程(图1):首先标记按照等位基因多少进行排序,计算相邻标记区分度相关系数,淘汰相关系数过高的引物。然后选择V在实际的执行过程中,为了降低运算量,每引入一个标记,都要计算各材料对应标记组合的等位基因频率,若频率为1,则对该材料从计算数组中剔除,加快了计算速度。1.4作物种质资源分子身份证编码作物分子身份证是针对作物种质资源或品种品系,基于作物分子标记的多态性检测手段,利用最简引物组合实现作物种质资源最大区分,并以类似于身份证的等位基因编码,作为标识和图形化的理论和技术。基于分子身份证的概念和构建算法,结合实际应用的需要,建立分子身份证的实现策略。策略共分4个部分:全库构建、部分构建、选择分析和分子身份证判定(ID判定)。1.4.1分子身份证的构建全库构建是分子身份证构建的基础,是基于数据库中的全部材料和标记信息,应用1.2、1.3算法,对全部材料进行分子身份证构建的策略。全库构建的基本步骤如下:步骤1:不符合标记的剔除。剔除标准首先标记的缺失太多(默认不超过5%)其次是标记间相似系数太高(默认不高于0.8);步骤2:有效标记数量判别。若标记充足则转入步骤3,否则转入步骤4;步骤3:执行算法,计算出材料(品种)分子身份证,包括标出特异性条带;步骤4:以标记集能区分的材料数最多为依据,计算出材料的分子身份证。1.4.2分子身份证的计算在全库构建的基础上,可选择性地对部分材料进行特异性引物条带的筛选和分子身份证的构建。部分构建以全库构建的材料、标记集为构建背景,选择部分材料以全部引物为标记利用算法进行分子身份证计算。部分构建的基本步骤如下:步骤1:从全部材料中选择部分材料集;步骤2:不符合标记的剔除。剔除标准首先标记的缺失太多(默认不超过5%)其次是标记间相似系数太高(默认不高于0.8);步骤3:执行算法,计算出部分材料分子身份证,包括标出特异性条带;步骤4:以标记集能区分的材料数最多为依据,计算出部分材料的分子身份证。1.4.3分子身份证编码后部分标记方法在全库构建的基础上,可选择部分标记对材料进行判别,主要用来考察部分标记(受关注的)在分子多态水平上区分材料的能力。由于选定了部分标记集,故算法上只需将供试材料的分子身份证编码标出即可。选择分析的结果可能会锁定唯一分子身份证的材料,也可能有多个共享一个分子身份证的材料,还可能由于缺失导致的具有不完全身份证的材料等几种可能。选择分析的基本步骤如下:步骤1:从全部标记中选择部分标记集;步骤3:将结果进行分类显示,唯一识别材料、分组识别材料和不确定材料。1.4.4基于库的构建在全库构建的基础上,选择几个标记,对待测材料进行基于选定标记的电泳试验,将电泳带型数字化,在全库构建的背景下,基于所选定标记计算该待测材料与其他材料间的相似度,判别该材料的类别归属,从而达到品种识别和品种鉴定的目的。分子身份证判定分析步骤如下:步骤1:选定背景标记集;步骤2:测定待测材料的带型;步骤3:在该标记集下,计算待测材料与数据库中全材料的相似度,以判别该材料的归属。2结果2.1数据库设计及软件开发分子身份证软件依据分子身份证的实现策略设计功能及界面(图2),软件功能包括:数据库浏览及更新、全库构建、部分构建、输入构建、选择分析和ID判定等功能。2.1.1ows软件环境分析分子身份证软件应用Microsoft公司VisualBasic6.0进行程序开发,软件在开发时充分考虑到使用的兼容性问题,软件可以在Windows9X/me/2000/XP/winVista/win7等大部份Windows的32位或64位操作系统下运行,软件的运行对计算机硬件环境要求不高,Intel奔腾CPU/512M内存/1G硬盘空间及以上机型都可运行。如果构建的标记及材料数量过多时,运算时间会相应增加,要想达到理想的运算效率,计算机的硬件配置不应过低。分子身份证软件首发版本为IDAnalysis1.0,软件登记号:2007SR11870a,通过应用完善了软件的功能及操作界面,目前版本为IDAnalysis4.1,软件具有功能丰富、界面友好(图3)、操作简单等优点,一步即可达到以往需要多个软件联合使用才能完成的任务。软件可以获得方式:发送索取软件的邮件给作者qshchen@126.com或访问“大豆设计网”站进行下载。2.1.2主栽大豆品种分子身份证编码标记统计是将电泳胶图上的目标条带数字化的过程,具体原则是根据扩增片段的分子量由大到小依次按1、2、3、4……N的顺序进行记录。其中,0表示零等位基因(即该泳道由于基因片段丢失而无带),-1表示该品种数据由于试验操作造成缺失,-2表示该泳道出现杂合带型。图3为黑龙江省主栽大豆品种分子身份证构建试验中所获得的一张比较理想的电泳图,以此图为例阐明标记统计原则。利用40对SSR引物对40份大豆品种进行电泳分析,共获得1600个标记数据,将标记整理成软件可识别的文本文档(图4)。数据文本的第1行第1个位置表示数据矩阵大小,其中“40/40”表示该数据文本中的数据矩阵为40行40列,第一个40表示有40个材料,第二个40表示有40对引物。向右接着是引物信息,引物需要用加引号,矩阵大小及引物间加一半角空格,以换行符结尾。例如“40/40”“Satt516”“Satt338”“Satt573”。从第2行开始每行表示1个材料,从左向右第1个位置表示材料名称,中英文皆可,但要加用引号,向右接着是该资源使用40对不同引物的电泳标记数据,资源名及带型标记间加一半角空格,以换行符结尾。例如:“合丰25”1133。2.1.3数据库合并功能分子身份证构建的基础是数据,数据是由引物和材料组成的二维标记矩阵集。由于数据缺失、引物更新和材料的变化而导致标记集数据的动态变化,而数据的改变进一步决定了分子身份证的构建也是动态可变的。因此软件设计开始时就考虑到由于对缺失数据的补充、新品种材料的更新,高多态性引物的加入等问题而导致数据集更新的麻烦。为解决数据集更新的麻烦,软件开发了数据库合并功能(图5)。可以根据引物和材料的列表对多个数据集进行整合,并可以对其发生改变的等位基因进行校验和提示,这样有利于整合最新的研究结果,开发全部材料最合适的分子身份证。合并后的数据结果以文本形式输出(图5),由结果文件可知,合并后的新数据集是由6份材料及4对引物组成,其中合并前二个数据集有1个差异数据,差异数据为“东农46,Satt516”,在a集中标记是1,在b集中标记是3,结果还显示了合并到新数据集中的材料、引物的数量及名称。2.2软件认证2.2.1分子身份证构建将40对引物对40份大豆品种的标记数据导入软件,具体如下:打开分子身份证软件,点击快捷工具栏的第三个图标“全库构建”,即可打开全库构建窗口(图6)。点击文件下拉菜单-打开-浏览到数据文件-打开,导入数据文件,点击“IDanalysis”按钮即可完成分子身份证构建。构建完的数据会显示在窗口的数据显示区,点击窗口文件下拉菜单-输出-浏览文件保存位置-命名文件名-保存,结果文件以文本形式保存。文件内容共分4部分,第1部分指明分析时的参数;第2部分指明不符合引物信息;第3部分指明特异引物信息;第4部分给出引物组合及每个材料的分子身份证的编号(图6)。由分子身份证构建结果可知,在40对引物对40个大豆品种的分子身份证构建中:共有13对引物由于缺失过多,不符合标准被剔除,剔除引物为Sat_111、Sat_218、Satt231、Satt685、Satt514、Satt551、Satt077、Satt358、Satt424、Satt100、Satt838、Satt893和Satt891。共有7对引物由于与其他引物相似系数过高,不符合标准被剔除,剔除引物为Satt253、Satt192、Satt417、Sat_229、Satt127和Satt496。在分析的40个品种中,共有5个品种具有7个特异等位基因,因此,可以通过这些特异等位基因直接确定需要鉴定的品种,通过计算仅需要7对引物即可区分40个大豆品种,引物组合为Satt398、Satt380、Satt453、Satt288、Satt244、Sat_092和Satt206,例如北豆3号在该引物组合下的分子身份证编号为2411343。2.2.2开-观看数据文件部分构建的具体操作如下:打开分子身份证软件,点击快捷工具栏的第四个图标“部分构建”,即可打开部分构建窗口(图7)。点击文件下拉菜单-打开-浏览到数据文件-打开,导入数据文件。从材料栏里选择一些材料到目标材料栏内,点击“IDanalysis”按钮即可完成部分材料的分子身份证构建。同时为了方便用户使用,软件还提供“输入构建”窗口,在该窗口中将材料的选择方式变为人工输入,其他功能相同。构建完的结果文件内容共分3部分,第1部分指明不符合引物信息;第2部分指明特异引物信息;第3部分给出引物组合及被选择的部分材料的分子身份证的编号(图7)。2.2.3分子身份证号码ID判定的具体操作如下:打开分子身份证软件,点击快捷工具栏的第七个图标“ID判定”,即可打开ID判定窗口(图8)。点击文件下拉菜单-打开-浏览到数据文件-打开,导入数据文件。在“引物及ID”栏内输入引物名称及分子身份证编号,其格式为“Satt338,Satt369,Satt453:314”,点击“PossibleGP”按钮即可计算出由引物组合以及身份证编号所确定的唯一材料名称。有些时候可能需要考察部分受关注的引物在分子多态水平上区分材料的能力。此时可以使用“选择分析”功能,其结果可能是被唯一区分的材料,也可能是多个共享一个分子身份证的材料,或是由于缺失导致的具有不完全身份证的材料等几种可能。3讨论3.1标记多态性和材料容量缩减关于寻找最优引物组合,可以采用贪婪算法,穷举法等多种方法。贪婪算法关于标记多态度排序,在计算中可以看出,调整标记的顺序会直接影响结果,因此,可根据单个标记等位基因多态性大小进行排序,使区分能力较强的标记更早出现,这样就使标记组合的区分度迅速增加,从而加快算法搜索速度。关于材料容量缩减,每次有新标记引入都会重新计算当前标记多态型下的每个材料条带码频数,而有部分材料在新标记入选前等位基因组合频率已经为1,达到了区分目的,没有重新计算的必要。因此,可以将被区分开的材料从计算的数据集中删除,逐步缩减材料容量,达到加快算法目的。3.2web应用程序技术在作物上的应用到目前该软件已经在大豆、水稻、花生、玉米、高粱、真菌、木耳等多种作物上得到广泛应用相比VB程序语言,Java技术具有简单、完全面向对象、属于解释执行语言、安全性高、可移植性强、执行性能高、多线程以及动态性等优点3.3分子身份证的开发分子身份证软件构建核心目标是为了利用最优引物对组合完成对目标材料群体的唯一性区分,如果具有较为完善的品种资源数据库系统,便可以解决资源的鉴定,育种材料的分析和候选审定材料的创新性判定等很多现实存在的棘手问题。在软件数据库开发方面,可以基于研究对象特性开发的各类特殊分子标记来构建分子身份证。在标记开发方面,可以针对研究资源的特性,设计独特的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论