版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分子进化与系统发育分析第一页,共一百一十一页,编辑于2023年,星期五TreeofLife
重建所有生物的进化历史并以系统树的形式加以描述第一节关于分子进化简介第二页,共一百一十一页,编辑于2023年,星期五生物进化理论达尔文进化论:进化:变异的遗传自然选择:解释为何演变发生的机制种群中个体变异的遗传学基础:孟德尔遗传孟德尔豌豆实验:杂交的表现特征是基因表达的结果,而不是基因杂交遗传中性进化论:并非所有种群中保留下来的突变都由自然选择所形成;大多数突变是中性或接近中性,不妨碍种群的生存与繁衍。第三页,共一百一十一页,编辑于2023年,星期五研究生物进化历史的途径1.最确凿证据是:生物化石!——零散、不完整2.比较形态学、比较解剖学和生理学等:确定大致的进化框架——细节存很多的争议第四页,共一百一十一页,编辑于2023年,星期五分子进化1964年,LinusPauling提出分子进化理论;从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。
发生在分子层面的进化过程:DNA,RNA和蛋白质分子
基本假设:核苷酸和氨基酸序列中含有生物进化历史的全部信息。第五页,共一百一十一页,编辑于2023年,星期五分子进化的模式DNA突变的模式:替代,插入,缺失,倒位;
核苷酸替代:转换(Transition)&颠换(Transversion)
基因复制:多基因家族的产生以及伪基因的产生A.单个基因复制–重组或者逆转录B.染色体片断复制C.基因组复制第六页,共一百一十一页,编辑于2023年,星期五DNA突变的模式替代插入缺失倒位第七页,共一百一十一页,编辑于2023年,星期五核苷酸替代:转换&颠换
转换:嘌呤被嘌呤替代,或者嘧啶被嘧啶替代
颠换:嘌呤被嘧啶替代,或者嘧啶被嘌呤替代第八页,共一百一十一页,编辑于2023年,星期五基因复制:单个基因复制重组逆转录第九页,共一百一十一页,编辑于2023年,星期五基因复制:基因组复制酿酒酵母克鲁雄酵母研究结果:克鲁雄酵母中的同源基因数量与酿酒酵母相比为1:2第十页,共一百一十一页,编辑于2023年,星期五物种分类及关系:从物种的一些分子特性出发,构建系统发育树,进而了解物种之间的生物系统发生的关系——treeoflife
大分子功能与结构的分析:同一家族的大分子,具有相似的三级结构及生化功能,通过序列同源性分析,构建系统发育树,进行相关分析;功能预测
进化速率分析:例如,HIV的高突变性;哪些位点易发生突变?分子进化研究的目的第十一页,共一百一十一页,编辑于2023年,星期五第十二页,共一百一十一页,编辑于2023年,星期五基于16S/18S核糖体RNA序列比对得到的古细菌系统发育树生命三界:细菌(Eubacteria)古细菌(Archaebacteria)真核(Eukaryotes)第十三页,共一百一十一页,编辑于2023年,星期五TreeofLife:16SrRNA第十四页,共一百一十一页,编辑于2023年,星期五OutofAfrica53个人的线粒体基因组(16,587bp)人类迁移的路线第十五页,共一百一十一页,编辑于2023年,星期五同源性与相似性相似性(Similarity)序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占比例;定量描述;同源性(Homology)两个基因或蛋白质序列具有共同祖先的结论;定性判断;相似不一定同源,同源不一定相似。氨基酸序列相似性超过30%,很可能同源。第十六页,共一百一十一页,编辑于2023年,星期五两种同源物:即垂直方向的(orthology)与水平
方向的(paralogy)。直系同源(orthology)是比较基因组学中最重要的定义。直系同源的定义是:(1)在进化上起源于一个始祖基因并垂直传递(verticaldescent)的同源基因;(2)分布于两种或两种以上物种的基因组;(3)功能高度保守乃至于近乎相同,甚至于其在近缘物种可以相互替换;(4)结构相似;(5)组织特异性与亚细胞分布相似。第十七页,共一百一十一页,编辑于2023年,星期五鉴定直系同源的实际操作标准(practicalcriteria)为:
如基因组Ⅰ中的A基因与基因组Ⅱ中的A‘基因被认是直系同源,则要求:(1)A‘的产物比任何在基因组Ⅱ中所发现的其它基因产物都更相似于A产物;(2)A‘与A的相似程度比在任何一个亲缘关系较远的基因组中的任一基因都要高;(3)A编码的蛋白与A‘编码的蛋白要从头到尾都能并排比较,即含有相似以至于相同的模序(motif)第十八页,共一百一十一页,编辑于2023年,星期五旁系同源
(paralogy)基因是指同一基因组(或同系物种的基因组)中,由于始祖基因的加倍而横向(horizontal)产生的几个同源基因。
即两个基因在同一物种中,通过至少一次基因复制的事件而产生。常常具有不同功能。第十九页,共一百一十一页,编辑于2023年,星期五paralogsorthologs直系同源物vs.旁系同源物第二十页,共一百一十一页,编辑于2023年,星期五Orthologs&Paralogs
(直系同源与旁系同源)WormFlyHuman1Human2Yeast1Yeast2OrthologsParalogsGeneduplicationeventsSpeciationeventsParalogs第二十一页,共一百一十一页,编辑于2023年,星期五第二十二页,共一百一十一页,编辑于2023年,星期五直系与旁系的共性是同源,都源于各自的始祖基因。其区别在于:在进化起源上,直系同源是强调在不同基因组中的垂直传递,旁系同源则是在同一基因组中的横向加倍;在功能上,直系同源要求功能高度相似,而旁系同源在定义上对功能上没有严格要求,可能相似,但也可能并不相似(尽管结构上具一定程度的相似),甚至于没有功能(如基因家族中的假基因)。旁系同源的功能变异可能是横向加倍后的重排变异或进化上获得了另一功能。第二十三页,共一百一十一页,编辑于2023年,星期五同源物种类Ortholog(直系同源物):两个基因通过物种形成的事件而产生,或源于不同物种的最近的共同祖先的两个基因,或者两个物种中的同一基因,一般具有相同的功能。Paralog(旁系同源物):两个基因在同一物种中,通过至少一次基因复制的事件而产生。常常具有不同功能。Xenolog(异系同源物):由某一个基因水平转移事件而得到的同源序列。水平转移的基因功能主要根据在前后宿主中变化而确定,然而功能却常常相似。第二十四页,共一百一十一页,编辑于2023年,星期五异源基因或水平转移基因xenologousorhorizontallytransferredgenes第二十五页,共一百一十一页,编辑于2023年,星期五序列同源性模型中的进化假设所有的生物都起源于同一个祖先;序列不是随机产生,而是在进化上,不断发生着演变;基本假设:序列保守性结构保守性注意:反之未必序列保守性结构保守性第二十六页,共一百一十一页,编辑于2023年,星期五第二节密码子偏好及分析
密码子(codon):在随机或者无自然选择的情况下,各个密码子出现频率将大致相等;
密码子偏好:各个物种中,编码同一氨基酸的不同同义密码子的频率非常不一致;
可能的原因:密码子对应的同功tRNA丰度的不同-Anticodon第二十七页,共一百一十一页,编辑于2023年,星期五标准密码子第二十八页,共一百一十一页,编辑于2023年,星期五大肠杆菌RNA聚合酶第二十九页,共一百一十一页,编辑于2023年,星期五大肠杆菌RNA聚合酶(2)
密码子偏好非常明显;例如
同为编码Leu的同义密码子CUA和CUG,二者出现的次数显著不等,CUA(1次),CUG(141次);
再如:编码Arg的四个密码子CGU,CGC,CGA,CGG,出现次数分别为:89,46,1,0.
提示:对应CGG的同功tRNA可能不存在!第三十页,共一百一十一页,编辑于2023年,星期五tRNA&Anticodon
每一个密码子,对应一个tRNA;tRNA通过Anticodon来识别codon,联系mRNA和氨基酸序列的合成;
密码子的使用偏好:由密码子对应的tRNA的进化及丰度来决定。第三十一页,共一百一十一页,编辑于2023年,星期五碱基出现的频率1.假如:每个核苷酸位点上的替代是随机发生的,则A,T,C,G出现的频率应该大致相等。2.实际情况:DNA受到自然选择的压力,各个位点的碱基出现频率并不相等。3.需要解决的问题:A.每个位点上受到什么样的选择压力?B.各个位点的碱基频率反映了什么样的规律?4.表征/统计的方法:计算G+C的含量,并进行比较第三十二页,共一百一十一页,编辑于2023年,星期五同义替代vs.非同义替代64个密码子,编码20个氨基酸GTTGTCGTAGTGCGTCGC脯氨酸P组氨酸H四倍简并二倍简并TGGTGC色氨酸W半胱氨酸C同义替代非同义替代第三十三页,共一百一十一页,编辑于2023年,星期五DNA序列突变对氨基酸序列的影响
同义(沉默)替代(synonymous/silentsubstitution)仍然为同义密码子的核苷酸替代如:TATTAC
TyrTyr
非同义替代(nonsynonymoussubstitution)导致产生非同义密码子的核苷酸替代如:TATAAT
TyrAsn
无义突变(nonsensemutation)导致产生终止密码子的核苷酸突变如:TATTAA
TyrSTP问题:假设所有密码子以同一概率出现,上述三种突变的比例?
25%,71%,4%第三十四页,共一百一十一页,编辑于2023年,星期五分子进化的理论自然选择理论:阳性选择:促进有益突变;定向选择:固定有益的等位基因;平衡选择:保持多态性;阴性选择(净化选择):清除有害突变;中性理论:阳性选择:少有;阴性选择:普遍存在;中性进化:普遍存在;第三十五页,共一百一十一页,编辑于2023年,星期五分子进化的理论1.阳性选择,适应性进化,达尔文进化:DNA分子显著出现非同义替代,改变编码蛋白质的氨基酸组成,并产生新的功能;2.阴性选择,净化选择:DNA分子的同义替代显著,较少改变蛋白质的氨基酸组成,其原来的功能高度保守;3.中性进化:同义替代与非同义替代比例相当,突变不好不坏,不改变或轻微改变蛋白质的功能。第三十六页,共一百一十一页,编辑于2023年,星期五基因的编码区和非编码区基因的DNA由编码区(Codingregion)和非编码区(Non-codingregion)构成;编码区可以转录信使RNA,进而调控蛋白质的合成;非编码区不能转录成信使RNA,但是它可以调控遗传信息的表达;原核基因:编码区全部编码蛋白质;
真核基因:编码区分为外显子和内含子,只有外显子能编码蛋白质;第三十七页,共一百一十一页,编辑于2023年,星期五分子进化选择压力
进化选择压力:A.编码区:阳性选择1%(决定物种形成、新功能的产生);阴性选择19%(较少改变蛋白质的氨基酸组成,其原来的功能高度保守);中性进化80%(突变不好不坏)。B.非编码区:~100%的中性进化第三十八页,共一百一十一页,编辑于2023年,星期五编码区:密码子1.对于同义的密码子,第一位少部分可以允许不同,例如,编码Ser的六个密码子:TCT,TCC,TCA,TCG,AGT,AGC2.第二位必须相同3.第三位绝大多数可以不同
近似随机;4.因此:A.第一位:阴性进化占大部分,中性进化占小部分B.第二位:阴性进化C.第三位:阴性进化占小部分,中性进化占大部分第三十九页,共一百一十一页,编辑于2023年,星期五密码子偏好的应用及计算
基本假设:在高表达的基因中,密码子的选择,更倾向于使用“优化”的同义密码子
推论1:给定一个物种的一些高表达的基因,我们可以估算优化的同义密码子的分布
推论2:接着,我们可以对给定的一个未知基因的序列进行密码子分布的分析,预测该基因的表达量!
推论3:对于一个表达量很低的基因,我们是否能够通过将少量的密码子改变成优化密码子,从而显著提高基因的表达量?第四十页,共一百一十一页,编辑于2023年,星期五RSCU相对同义密码子使用度(relativesynonymouscodonusage,RSCU)
定义:观测到的某一同一密码子的使用次数,除以“期望”的该密码子出现次数编码第i个氨基酸的第j个密码子的出现次数编码第i氨基酸的同义密码子的数目编码第i个氨基酸的第j个密码子的RSCU值第四十一页,共一百一十一页,编辑于2023年,星期五密码子相对适应度
Therelativeadaptivenessofacodon
编码第i个氨基酸的第j个同义密码子的“相对适应性”:
即该同义密码子的观察值,除以编码该氨基酸的同义密码子的最大值第四十二页,共一百一十一页,编辑于2023年,星期五大肠杆菌&酵母第四十三页,共一百一十一页,编辑于2023年,星期五CAI:密码子适应指数
CodonAdaptationIndexL为基因中所使用的密码子数CAI值介于0~1之间,该值越大表示偏性越强;CAI值一般用来预测种内基因的表达水平,以及预测外源基因的表达水平。不同物种CAI的计算依赖于各自的参考数据集。第四十四页,共一百一十一页,编辑于2023年,星期五大肠杆菌和酵母:部分基因的CAI第四十五页,共一百一十一页,编辑于2023年,星期五异源基因:在其他物种中的CAI第四十六页,共一百一十一页,编辑于2023年,星期五第三节氨基酸序列的进化演变
分子进化的分析:基于氨基酸序列的分析早于DNA序列
优势:氨基酸序列更为保守,对年代跨度大的进化分析有帮助;数学模型较DNA远为简单p距离:p-distance
泊松校正,d距离第四十七页,共一百一十一页,编辑于2023年,星期五P-distance:利用DNA序列数据计算遗传距离
两条蛋白质序列之间的氨基酸差异数为nd,序列的氨基酸数目均为n,则P距离:不同物种的血红蛋白α链中差异氨基酸的数目及比例:(长度:140aa)所有的插入/缺失均删除第四十八页,共一百一十一页,编辑于2023年,星期五PC:泊松校正
序列差异的百分比(p)与分歧时间t的关系:t较短的时候,回复突变较少,两者大致成线性关系;当t较大时,回复突变增多,二者成非线性关系基本假设:令r为某一位点每年的氨基酸替代率,并假设所有位点的r都相同
在时间t年之后,每个位点替代的平均数为:rt
给定一个位点,氨基酸替代数k(k=0,1,2,3,…)的可能性遵循泊松分布,即
因此,某一位点氨基酸不变的概率为第四十九页,共一百一十一页,编辑于2023年,星期五泊松距离
祖先序列未知:不知道当前的序列从何演化而来
解决方案:对两条已经有t年分化的序列,一条序列某位点无替代的概率为:,两条序列同源位点均无替代概率为:
此概率可用1-p估计:q=1-p;两个序列间每个位点氨基酸替代总数(d=2rt):d=-ln(1-p),即泊松距离第五十页,共一百一十一页,编辑于2023年,星期五P-距离vs.泊松距离p距离和泊松校正(PC)距离随分歧时间变化的关系第五十一页,共一百一十一页,编辑于2023年,星期五第四节分子系统发育分析1.系统发育树:分子进化树/分子进化分析2.通过进化树的构建,分析分子之间的起源关系,预测分子的功能。3.建树方法:A.最大简约法(MaximumParsimony)B.距离法(distance-basedmethods)C.最大似然性法(MaximumLikelihood)D.贝叶斯(Bayesian)推断
第五十二页,共一百一十一页,编辑于2023年,星期五祖先节点/树根内部节点/分歧点,该分支可能的祖先结点分支/世系末端节点
ABCDE代表最终分类,可以是物种,群体,或者蛋白质、DNA、RNA分子等系统发育树:术语第五十三页,共一百一十一页,编辑于2023年,星期五TaxonATaxonBTaxonCTaxonD116遗传变化TaxonATaxonBTaxonCTaxonD时间TaxonATaxonBTaxonCTaxonD无意义分支图
进化树
时间度量树以上三种类型的系统发育树表示相同的分支状况,相同的进化关系系统发育树:三种类型遗传变化无意义时间遗传变化无意义以上三种类型的系统发育树表示相同的分支状况,相同的进化关系时间遗传变化无意义以上三种类型的系统发育树表示相同的分支状况,相同的进化关系时间遗传变化无意义分支图
进化树
时间度量树第五十四页,共一百一十一页,编辑于2023年,星期五树只代表分支的拓扑结构ABCDEFGFGCDEAB第五十五页,共一百一十一页,编辑于2023年,星期五通过外类群来确定树根根bacteriaoutgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea有根树外类群无根树,有根树,外类群通过外类群来确定树根有根树外类群通过外类群来确定树根有根树外类群通过外类群来确定树根有根树eukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea无根树第五十六页,共一百一十一页,编辑于2023年,星期五无根树和有根树:潜在的数目#Taxa无根树有根树31343155151056105945794510,395…30~3.58X1036~2.04X1038Taxa增多,计算量急剧增加,因此,目前算法都为优化算法,不能保证最优解第五十七页,共一百一十一页,编辑于2023年,星期五多序列比对(自动比对,手工校正)选择建树方法以及替代模型建立进化树进化树评估系统发育树重建分析步骤第五十八页,共一百一十一页,编辑于2023年,星期五1.最大简约法(maximumparsimony,MP)适用序列有很高相似性时2.距离法(distance)适用序列有较高相似性时3.最大似然法(maximumlikelihood,ML)可用于任何相关序列集合计算速度:距离法>最大简约法>最大似然法系统发育树重建的基本方法第五十九页,共一百一十一页,编辑于2023年,星期五1.最大简约法(MP)
根据信息位点提供的各序列间的替换情况,在所有可能的树中筛选含最小替换数的树的方法。理论基础为奥卡姆剃刀(Ockham)原则:计算所需替换数最小的那个拓扑结构,作为最优树。
在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树。
优点:不需要在处理核苷酸或者氨基酸替代的时候引入假设(替代模型)
缺点:分析序列上存在较多的回复突变或平行突变,而被检验的序列位点数又比较少的时候,可能会给出一个不合理的或者错误的进化树推导结果。第六十页,共一百一十一页,编辑于2023年,星期五信息位点:能将所有可能的树区别出来的位点。
信息位点是指那些至少存在2个不同碱基/氨基酸且每个不同碱基/氨基酸至少出现两次的位点。信息位点
(Sitesareinformative)第六十一页,共一百一十一页,编辑于2023年,星期五第六十二页,共一百一十一页,编辑于2023年,星期五上例Position5,7,9为信息位点;
基于position5的三个MP树:Tree1长度为1,Tree2&3长度为2Tree1最为简约:总长=4
Tree2长5;Tree3长6
计算结果:MPtree的最优结果为tree1第六十三页,共一百一十一页,编辑于2023年,星期五2.距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。再依据进化距离,分别依次将序列合并聚类,构建进化树。第六十四页,共一百一十一页,编辑于2023年,星期五简单的距离矩阵第六十五页,共一百一十一页,编辑于2023年,星期五由进化距离构建进化树的方法有很多,常见有:(1)Fitch-MargoliashMethod(FM法):对短支长非常有效(2)Neighbor-JoiningMethod(NJ法/邻接法):求最短支长,最通用的距离方法(3)NeighborsRelatonMethod(邻居关系法)(4)UnweightedPairGroupMethodwithArithmeticMean(UPGMA,非加权组平均法)通过距离矩阵建树的方法第六十六页,共一百一十一页,编辑于2023年,星期五(1)Fitch-Margoliash方法(FM法)=>D和E最接近!DEABCedm示例第六十七页,共一百一十一页,编辑于2023年,星期五分成三组:D,E,以及ABC(1)FM法示例第六十八页,共一百一十一页,编辑于2023年,星期五DE距离=d+e=10(1)D到ABC间的平均距离=d+m=32.7(2)E到ABC间的平均距离=e+m=34.7(3)(2)-(3)+(1)d=4,e=6DEABCedm第六十九页,共一百一十一页,编辑于2023年,星期五分成三组:C,DE,以及AB=>C最接近DE!第七十页,共一百一十一页,编辑于2023年,星期五c+g+(e+d)/2=19(1)c+f+(a+b)/2=40(2)(e+d)/2+(a+b)/2+f+g=41(2)(1)+(2)-(3)=>
c=9=>g=5第七十一页,共一百一十一页,编辑于2023年,星期五由:(a+b)/2+f+g+(d+e)/2=41得:f=20由:a+f+c=39得:a=10,则b=12第七十二页,共一百一十一页,编辑于2023年,星期五(2)N-J/邻接法与FM方法非常类似保证总的支长最短总支长:a+b+c+d+e=314/4=78.5第七十三页,共一百一十一页,编辑于2023年,星期五找到距离最近的两个点1.任意两个节点选为相邻序列的总支长计算公式:2.计算SAB,SBC,SCD,SDE…等数值3.该例中,SAB最小第七十四页,共一百一十一页,编辑于2023年,星期五把A、B看成一个新的复合序列,构建一个新的距离表,重复以上过程计算A,B的分支长度第七十五页,共一百一十一页,编辑于2023年,星期五d=e=10/2=5UPGMA法第七十六页,共一百一十一页,编辑于2023年,星期五c=19/2=9.5g=c-d=9.5-5=4.5第七十七页,共一百一十一页,编辑于2023年,星期五a=b=22/2=11AB(CDE)A-2239.5B--41.5(CDE)---第七十八页,共一百一十一页,编辑于2023年,星期五(AB)(CDE)(AB)-40.5(CDE)--f1+a=f2+c=40.5/2=20.25f1=9.25,f2=11.75第七十九页,共一百一十一页,编辑于2023年,星期五最大似然法(ML)最大似然法(maximumlikelihood,ML):最早应用于对基因频率数据的分析上
选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树;
在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率求最大值来估计枝长;
缺点:费时,每个步骤都要考虑内部节点的所有可能性
改进:启发式算法,分枝交换搜索等第八十页,共一百一十一页,编辑于2023年,星期五构建进化树的一般原则第八十一页,共一百一十一页,编辑于2023年,星期五1.可靠的待分析数据2.准确的多序列比对3.选择合适的建树方法:A.序列相似程度高,MP首先B.序列相似程度较低,ML首先C.序列相似程度太低,无意义4.一般采用两种及以上方法构建进化树,无显著区别可接受构建进化树的一般原则(2)第八十二页,共一百一十一页,编辑于2023年,星期五
选择一个或多个已知与分析序列关系较远的序列作为外类群;
外类群可以辅助定位树根;
外类群序列必须与剩余序列关系较近,但外类群序列与其他序列间的差异必须比其他序列之间的差异更显著。外类群(Outgroup)bacteriaoutgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaea外类群第八十三页,共一百一十一页,编辑于2023年,星期五进化树的可靠性分析单纯由预先获得的多序列比对结果数据所推导出的进化树有时并不一定可靠。改进办法:引进一些统计分析来寻找更优的进化树,检验结果的可靠性。最常见的就是bootstrap评估。第八十四页,共一百一十一页,编辑于2023年,星期五从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列;
重复上面的过程,得到多组新的序列;
对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性。一般Bootstrap的值>70,则认为构建的进化树较为可靠。自展法-进化树的可靠性分析BootstrapMethod第八十五页,共一百一十一页,编辑于2023年,星期五原始排列AlphaAACAACBetaAACCCCGammaACCAACDeltaCCACCAEpsilonCCAAAC
Bootstrap1AlphaACAAACBetaACCCCCGammaACAAACDeltaCACCCAEpsilonCAAAACBootstrap2AlphaAAAACCBetaAACCCCGammaCCAACCDeltaCCCCAAEpsilonCCAACCBootstrap3AlphaACAAACBetaACCCCCGammaCCAAACDeltaCACCCAEpsilonCAAAAC第八十六页,共一百一十一页,编辑于2023年,星期五第五节系统发育分析软件介绍软件说明PHYLIP免费的、集成的进化分析工具/phylip.htmlMEGA图形化、集成的进化分析工具,不包括ML/
PAUP商业软件,集成的进化分析工具
/PHYML最快的ML建树工具http://atgc.lirmm.fr/phyml/MrBayes基于贝叶斯方法的建树工具/MAC5基于贝叶斯方法的建树工具/software/mac5/第八十七页,共一百一十一页,编辑于2023年,星期五相关软件软件说明ClustalX图形化的多序列比对工具;构建N-J系统树http://bips.u-strasbg.fr/fr/Documentation/ClustalX/GeneDoc多序列比对结果的美化工具(可以导入fasta格式的文件,作图可用于发表)/biomed/genedoc/
BioEdit序列分析的综合工具
/BioEdit/bioedit.html
TreeView进化树显示工具http://taxonomy.zoology.gla.ac.uk/rod/treeview.html
第八十八页,共一百一十一页,编辑于2023年,星期五Phylip软件包介绍由华盛顿大学遗传学系开发,免费的系统发育分析软件包。目前最广泛使用的系统发生分析程序,主要包括以下几个程序组:分子序列组,距离矩阵组,基因频率组,离散字符组,进化树绘制组。访问及免费下载地址:/phylip.html第八十九页,共一百一十一页,编辑于2023年,星期五Phylip软件包介绍
Phylip包含了35个独立的程序,这些独立的程序都实现特定的功能,这些程序基本上包括了系统发生分析的所有方面。多种不同平台的版本(包括windows,Macintosh,DOS,Linux,Unix和OpenVMX)。
Phylip软件包的文档是非常详细的,对于每个独立的程序,都有一个独立的文档,详细的介绍了该程序的使用及其说明。第九十页,共一百一十一页,编辑于2023年,星期五Phylip软件包的应用1,根据你的分析数据,选择适当的程序如,你分析的是DNA数据,就在核酸序列分析类中选择程序(dnapenny,dnapars,dnamove,dnaml,dnamlk,dnainvar,dnadist,dnacomp
)2.选择适当的分析方法 如你分析的是DNA数据,可以选择简约法(DNAPARS),似然法(DNAML,DNAMLK),距离法等(DNADIST)。3.进行分析选择好程序后,执行,读入分析数据,选择适当的参数,进行分析,结果自动保存为outfile,outtree。第九十一页,共一百一十一页,编辑于2023年,星期五
outfile是一个记录文件,记录了分析的过程和结果,可以直接用文本编辑器(如写字板)打开。
outtree是分析结果的树文件,可以用phylip提供的绘树程序打开查看,也可以用其他的程序来打开,如treeview等。Phylip软件包的应用第九十二页,共一百一十一页,编辑于2023年,星期五现有8段protein序列:>P1MPRFAANLSMMFTEVPFIERFAAARKAGFDAVEFLFPYNYSTLQIQKQLE>P2MPRFEANLSMMFTEVPFAERFADARKAGFDAVEFLFPYCYSDLQIQCQLE>P3WPRFEANLSMMFTEVPFAERFADARKIGFDAEEFLFPYCYSDLQIQCQLE>P4MPCFAANLSMMFTEVPFIERFAAARKAGFDAVEFLFPYNYSTLQIQKQLE>P5MPRFEANLSMEFTAVPFIERFADARKAGFDAVEFLFPYCYSTLQIQKQLE>P6MPRFEANLSMMFTEVPFAERFADARKAGFDA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年专用汽车起重机租赁及维护一体化合同2篇
- 2024年江苏省安全员C证(专职安全员)考试题库
- 毕业生实习报告-15篇
- 学生学籍管理系统java课程设计
- 2024年度高端定制坯布织造与加工一体化服务合同范本2篇
- 2024年标准型机器人销售与购买合同一
- 幼儿园班级管理工作总结5篇
- 2024年幼儿园教师实习生就业协议书3篇
- 2024年度企业员工待岗轮休及员工职业素养提升协议3篇
- 个人自我鉴定(13篇)
- 针灸专业词汇英文对照
- 破裂强度标准
- 核心素养视域下小学数学命题的创新策略分析
- 行政复议申请书范本
- 有源光器件及无源光器件区别及基础
- 传热学第五版答案
- 制粒机内部结构图ppt课件
- 毕业设计(论文)基于汇编语言与接口技术的音乐盒设计
- 中小学校消防器材配备标准
- 【教案】 氯气的实验室制法教案
- 《7、Whose--is--this-》教案
评论
0/150
提交评论