




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、MEGA软件的使用Mega是一款操作十分简便的遗传学分析软件,其界面十分友好,即使初学者也很易上手。1、数据的录入及编辑Mega软件能够接受多种数据格式,如FASTA格式、Phylip格式、PAUP数据格式等等。而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序。首先,打开Mega程序,有如下图所示的操作界面:单击工具栏中的“File”按钮,会出现如下图所示的菜单:从上图可以看出,下拉菜单有“Open Data”(打开数据)、“Reopen Data”(打开曾经打开的数据,一般会保留新近打开的几个数据)、“Close Data”(关闭数据)、“Export Data”(导出
2、数据)、“Conver To MEGA Format”(将数据转化为MEGA格式)、“Text Editor”(数据文本编辑)、“Printer Setup”(启动打印)、“Exit”(退出MEGA程序)。单击“Open Data”选项,会弹出如下菜单:浏览文件,选择要分析的数据打开,单击“打开”按钮,会弹出如下操作界面:此程序操作界面,提供了三种选择数据选择:Nucleotide Sequences(核苷酸序列)、Protein Sequences(蛋白质序列)、Pairwise Distance(遗传距离矩阵)。根据输入数据的类型,选择一种,点击“OK”即可。如果选择“Pairwise D
3、istance”,则操作界面有所不同;如下图所示:根据遗传距离矩阵的类型,如果是下三角矩阵,选择“Lower Left Matrix”即可;如果是上三角矩阵,选择“Upper Right Matrix”即可。点击“OK”按钮,即可导入数据。如果是核苷酸数据,则读完之后,会弹出如下对话框:如上图,如果是编码蛋白质的核苷酸序列,则选择“Yes”按钮;如果是不编码蛋白质的核苷酸序列,则点击“No”按钮。之后,会弹出如下操作窗口:此作界面的名称是“Sequence Data Explorer”,在其最上方是工具栏“Data”、“Display”、“Highlight”等,然后是一些数据处理方式的快捷按
4、钮,在操作界面的左下方是每个序列的名称。显示序列占了操作界面的绝大部分,与第一个序列相同的核苷酸用“.”表示,发生变异的序列则直接显示。2、遗传距离的计算点击Mega操作主界面的“Distances”按钮,会弹出一个下拉菜单。如下图所示:从上图易知,此菜单包括如下选项:“Choose Model”(选择模型,即选择计算遗传距离的模型)、“Compute Pairwise”(计算遗传配对差异)、“Compute Overall Mean”(计算包括所有样本在内的平均遗传距离)、“Compute With Group Means”(计算组内平均遗传距离)、“Compute Between Grou
5、ps Means”(计算组间平均遗传距离)、“Compute Net Between Groups Means”(计算组间平均净遗传距离)、“Compute Sequence Diversity”(计算序列分歧度)。“Compute Sequence Diversity”选项包括四个子菜单:“Mean Diversity Within Subpopulations”(亚群体内部平均序列多态性)、“Mean Diversity for Entire Population”(整个人群平均序列多态性)、“Mean Interpopulaional Diversity”(群体内部平均序列多态性)、“C
6、oefficient of Differentiation”(遗传变异系数)。点击“Choose Model”选项,会弹出如下操作界面:从上述操作界面可以看出,通过此对话框可以选择计算遗传距离的模型等。“Data Type”显示数据的类型:Nucleotide(Coding)(编码蛋白质的DNA序列)、Nucleotide(不编码蛋白质的DNA序列)、Amino Acid(氨基酸序列)。通过“Model”选项可以选择,计算遗传距离的距离模型。点击“Model”一行末端的按钮会弹出一选择栏。如上图所示,对于非编码的核苷酸序列Mega程序提供了八种距离模型:“Number of Differenc
7、e”(核苷酸差异数)、“P-distance”(P距离模型)、“Jukes-Cantor”(Jukes和Cantor距离模型)、“Kimura 2-Parameter”(Kimura双参数模型)、“Tajima-Nei”(Tajima和Nei距离模型)、“Tamura 3-parameter”(Tamura 三参数模型)、“Tamura-Nei”(Tamura和Nei距离模型)、“LogDet(Tamura kumar)”(对数行列式距离模型)。对于编码的核苷酸序列,其遗传距离模型如下图所示:如上图所示,对于编码蛋白质的DNA序列,Mega程序提供了一下几种模型:“Nei-Gojobori M
8、ethod”,“Modified Nei-Gojobori Methoed”、“Li-Wu-Luo Method”、“Pamilo-Bianchi-Li Method”、“Kumar Method”。其中Nei-Gojobori方法和修正的Nei-Gojobori方法都包含三种距离模型:“Number of Differences”、“P-distance”、“Jukes-Cantor”。对于氨基酸序列,Mega所提供的遗传距离模型如下图所示:如上图所示,对于氨基酸序列,Mega程序提供了一下六种遗传距离模型:“Number of Differences”(氨基酸差异数)、“P-distanc
9、e”(P距离模型)、“Poisson Correction”(泊松校正距离模型)、“Equal Input”(等量输入距离模型)、“PAM Matrix(Dayhoff)”(PAM距离矩阵模型)、“JTT Matrix(Jones-Taylor-Thornton)”(JTT距离矩阵模型)。在“Analysis Preference”操作界面中,“Pattern Among Lineages”仅提供了一个选项:“Same(Homogenous)”“,也就是说样本之间是有一定同源性的。“Rates among sites”提供了两个选项:“Uniform Rates”和“Different(Gam
10、ma Distributed)”。“Uniform Rates”意味着所有序列的所有位点的进化速率是相同的。选择“Different(Gamma Distributed)”,意味着序列位点之间的进化速率是不相同的,可以利用Gamma参数来校正,系统提供了四个数值可供选择:2.0、1.0、0.5、0.25;软件使用者也可以自行决定Gamma参数的大小。设置完毕后,在此界面中点击“OK”按钮,即可返回Mega操作主界面。选择主操作界面“Distance”中的“Compute Pairwise”选项,可以计算样本之间的遗传距离的大小,其操作界面如下图所示: “Data Type”显示数据的类型,图中
11、为“Nucleotide”。“Analysis”显示计算分分析的类型,图中为“Pairwise Distance Calculation”(配对差异距离计算)。“Compute”显示所要运行的对象,又两个选项:“Distance only”(仅计算遗传距离)和“Distance&Std.Err”(计算遗传距离和其标准误)。“Include Sites”显示利用哪些位点来计算,如果数据类型是不编码蛋白质的核苷酸序列,则全部参与计算,如果是编码蛋白质的核苷酸序列,则可以选择哪些位点(如密码子的第2位等)来参与运算。“Substitution Model”是替代的模型 ,在下边“Model”中可以进
12、行选择。“Substitutions to Inclued”选择哪些替代类型(如下图所示)被用于运算,d选项将转换和颠换全部包括在内,s选项仅包括转换,v选项仅包括颠换,R为转换和颠换的比值,L为所有有效的普通位点的个数。 “Pattern among Lineages”和“Rates among sites”上文已有介绍,不再详述。点击“Compute”按钮,即可开始计算。其显示运算结果的界面如下图所示:上图是计算出的各个样本之间的遗传距离的矩阵。在最下端的状态栏,显示的是所利用的遗传距离模型,如图中所示:Nucleotide:Kimura 2-parameter。“File”按钮共有四个下
13、拉菜单:“Show Input Data Title”(显示输入数据的标题)、“Show Analysis Description”(显示分析信息的描述)、“Export/Print Distance”(输出或打印距离矩阵)、“Quit viewer”(退出此操作界面)。“Display”按钮共有四个下拉菜单:“Show Pair Name”(显示配对序列的名字)、“Sort Sequence”(用何种方式对序列进行排序)、“Show Names”(显示序列的名字)、“Change Font”(改变字体)。“Sort Sequence”有两个选项:“Original”(按原先输入的顺序)和“B
14、y Name”(通过序列的名字)。点击“Average”按钮可以计算平均的遗传距离,此按钮提供了四个下拉菜单:“Overall”(所有样本之间的平均遗传距离)、“Within Groups”(组内平均遗传距离)、“Between Groups”(组间平均遗传距离)、“Net Between Groups”(组间平均净遗传距离)。在上述按钮下方还有六个按钮,如下图所示。点击第一个按钮可以使数据以下三角矩阵的方式显示;点击第二个按钮可以使数据以上三角矩阵的方式显示;选中第三个按钮可以显示配对的序列的名字,点击第四个按钮,可以减少数据小数点后的位数;点击第五个按钮,可以增加数据小数点后的位数;拖动第
15、六个按钮中的小竖条可以改变数据显示的宽度。点击“File”下拉菜单中的“Export/Print Distance”选项,会弹出如下图所示的对话框: “Output Format”选项可以确定输出数据的格式:“Publication”(一般格式)和“Mega”(Mega格式,把此数据保存可直接由Mega程序打开,进行构建系统发育书等遗传分析)。Decimal Places(小数位的大小),“Max Entries per line”(每一行最多能显示的数据的个数)。通过“Matrix”可以选择输出数据矩阵的方式:“Lower-left”(下三角矩阵)和“Upper-right”(上三角矩阵)。
16、点击“Print/Save Matrix”按钮,可以输出数,会弹出如下图所示的操作界面:在上图中的数据和文字可以直接进行拷贝,粘贴到文本文档或Microsoft Word文档中。在此操作界面中,首先显示数据文件的一些信息,如数据文件的标题、总的样本个数、核苷酸替代的距离模型等。然后是每个序列的名字,之后是序列之间的距离矩阵。将此距离矩阵保存,可以用Mega或其他系统发育分析软件来做系统树。点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute Overall Mean”选项,可以计算所有序列的所有位点的平均遗传距离,其操作方法和界面同“Compute Pairwise”
17、相仿。其运算结果如下图所示:点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute Within Group Means”选项,可以计算每个组组内的平均遗传距离,其操作方法和界面同“Compute Pairwise”相仿。其运算结果如下图所示:点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute between Group Means”选项,可以计算分组之间的平均遗传距离,其操作方法和界面同“Compute Pairwise”相仿。其运算结果如下图所示:点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute net be
18、tween Group Means”选项,可以计算分组之间的平均遗传距离,其操作方法和界面同“Compute Pairwise”相仿。其运算结果如下图所示:点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute Sequence Diversity”选项中的“Mean Diversity Within Subpopulations”,可以计算亚组之间的平均遗传距离,其操作方法和界面同“Compute Pairwise”相仿。其运算结果如下图所示:点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute Sequence Diversity”选项中的
19、“Mean Diversity for Entire Population”,可以计算整个群体的平均遗传距离,其操作方法和界面同“Compute Pairwise”相仿。其运算结果如下图所示:点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute Sequence Diversity”选项中的“Mean InterPopulation Diversity”,可以计算群体内部的平均遗传距离,其操作方法和界面同“Compute Pairwise”相仿。其运算结果如下图所示:点击Mega软件操作主界面的“Distances”下拉菜单中的“Compute Sequence Di
20、versity”选项中的“Coffient of Differentiation”,可以计算群体的变异系数,其操作方法和界面同“Compute Pairwise”相仿。其运算结果如下图所示:3、系统发育树的构建Mega程序构建系统发育树的功能很强大。它提供了四种构建系统发育树,还包括一些检验程序。这四种构建分子系统树的方法为:Neighbor-Joining(NJ,邻接法)、Minimum Evolution(ME,最小进化法)、Maximum Parsimony(MP,最大简约法)、Unweighted Pair Group Method With Arithmetic Mean(UPGMA
21、,算术平均的不加权对群法)。其中,NJ法和UPGMA法都属于距离法。其操作界面如下图所示:邻接法是距离法构建系统发育的常用方法,此方法基于最小进化原理,而不使用优化标准。邻接法中一个重要概念就是“近邻”。在谱系树上,如果两个分支之间只通过一个内部节点相连,那么这两个分支就被称为“近邻”。完全解析出的进化树是通过对完全没有解析出的“星型”进化树进行“分解”得到的,分解的步骤是连续不断地在最接近(实际上,是最孤立的)的序列对中插入树枝,而保留进化树的终端。于是,最接近的序列对被巩固了,而“星型”进化树被改善了,这个过程将不断重复。这种方法并不检验所有可能的拓扑结构,因此相对而言运算速度很快,也就是说,对于一个50个序列的进化树,只需要若干秒甚至更少。具体操作:输入数据,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预防医学概论试讲
- 美食烧烤特色食品演示模板
- (高清版)DB12 046.37-2011 产品单位产量综合能耗计算方法及限额 第37部分:炭黑
- 项目管理情况
- 2015年辽宁省朝阳市中考历史试卷(空白卷)
- 苏教版七年级上册生物知识点总结
- 环保行业废物处理与循环经济方案
- 企业信息化系统规划与实施作业指导书
- 2025船舶货物运输合同标准范本
- 上海中考语文知识点 中考落实的知识点
- 九月抽考电务作业指导书
- 儿童节约用水你我同行3月22日世界水日主题班会PPT
- YC/T 478-2013烟草商业企业卷烟物流配送中心安全管理规范
- GB/T 24456-2009高密度聚乙烯硅芯管
- 幼儿园惊蛰来了课件
- 转包违法分包等违法行为认定查处管理办法讲座课件
- PLM解决方案与NX培训教材课件
- 部编版六年级下册道德与法治全册优秀课件
- 【精选】方剂学解表剂练习题
- 法制宣传教育小报
- 上海西郊国际农产品展示直销中心贵州馆入驻方案
评论
0/150
提交评论