




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章 分子进化分析(Molecular Evolution Analysis)第七章 分子进化分析内容 分子进化分析介绍 系统发育树重建方法 常用分子进化与系统发育分析的软件内容 分子进化分析介绍第一节 分子进化分析介绍进化:是一种不断改进的过程。“每个生物每时每刻都在为生存进行反复的斗争,如果在复杂多变的生存条件下该生物仍然能够不断改进自己,那么其将有较大的生存可能性,并被自然选择所保留。被自然选择保留下来的物种都倾向于繁殖其已经被改进的新的生命形式” -特种起源第一节 分子进化分析介绍进化:是一种不断改进的过程。18世纪之前,神创论和物种不变论。18世纪,相信物种是变化的。拉马克用环境作
2、用的影响、器官的用进废退和获得性的遗传等原理解释生物进化过程,创立了第一个比较严整的进化理论。1859年达尔文发表物种起源,论证了地球上现存的生物都由共同祖先发展而来,并提出自然选择学说以说明进化的原因,从而创立了科学的进化理论。 18世纪之前,神创论和物种不变论。20世纪30年代,综合进化论,综合了细胞遗传学、群体遗传学以及古生物学等学科的成就,进一步发展了进化理论。20世纪60年代末,分子进化中性学说,认为种内和种间大多数可见差异是适合度很小的随机突变的固定所决定的。 分子进化分析讲解生物学家:We have a dreamTree of Life: 重建所有生物的进化历史并以系统树的形式
3、加以描述生物学家:We have a dreamTree of L梦想走进现实:How?比较形态学和比较生理学:确定大致的进化框架 细节存很多的争议最理想的方法:化石! 零散、不完整梦想走进现实:How?比较形态学和比较生理学:确定大致的进化分子进化分析讲解梦想走进现实:How?第三种方案:分子进化 1964年,Pauling等提出分子进化理论: (1) 生命起源:有机分子由简单向复杂演变 (2) 生物进化:构成生物体的生物大分子如蛋白质、核酸的演变。 基本假设:核苷酸和氨基酸序列中含有生物进化历史的全部信息 意义:分子进化的研究可以为生物进化过程提供佐证,为深入研究进化机制提供重要依据。梦想
4、走进现实:How?第三种方案:分子进化 从物种的一些分子特性出发,构建系统发育树,进而了解物种之间的生物系统发生的关系 tree of life,物种分类 大分子功能与结构的分析:同一家族的大分子,具有相似的三级结构及生化功能,通过序列同源性分析,进行大分子功能预测 进化速率分析:例如,HIV的高突变性,哪些位点易发生突变?分子进化研究的目的 从物种的一些分子特性出发,构建系统发育树,进而了解物种之 Tree of Life: 16S rRNA真细菌 真核生物 古生菌 Tree of Life: 16S rRNA真细菌 真核生Out of Africa53个人的线粒体基因组(16,587bp)
5、人类迁移的路线非洲人相对其他大陆上的人类在基因上极为多样化随着距非洲距离越来越长,遗传多样性的衰退程度,正好沿着人类早期迁徙的路线慢慢增大。Out of Africa53个人的线粒体基因组(16,58分子进化分析讲解系统发育树:描述一组对象进化历史的一种图表。分类单元:用来构建系统发育树的对象。可以是基因、蛋白序列,或者是序列之外的数据(形态特征、酶切位点等)系统发育树是一种二叉树。由一系列节点(nodes)和分支(branches )组成,其中每个节点代表一个分类单元(物种或序列),而节点之间的连线代表物种之间的进化关系。一、系统发育树(Phylogenetic tree)系统发育树:描述一
6、组对象进化历史的一种图表。一、系统发育树(树的节点又分为外部节点(terminal node)和内部节点(internal node)。外部节点:代表实际观察到的分类单元。内部节点:又称为分支点,代表分类单元进化历程中的祖先。ABCDE分支/世系节点树的节点又分为外部节点(terminal node)和内部节1. 系统发育树的分类1.1 依据树是否有根可分为:有根树:从最早共同祖先(即根)开始,随着时间的连续分歧事件引起的一组相关对象的分歧每个分支的进化方向是确定的无根树:只表示分类单元之间的关系,不鉴别最早共同祖先不清楚内部分支的祖先物种是从哪里来的,进化方向不清楚1. 系统发育树的分类1.
7、1 依据树是否有根可分为:archaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteria outgrouprooteukaryoteeukaryoteeukaryoteeukaryote无根树archaeaarchaeaarchaeaMonophyletic group(单源支)Monophyleticgroup有根树系统发育树的种类: 有根树、无根树archaeaarchaeaarchaeaeukaryote 外围支条件:序列必须与剩余序列关系较近,但外围支序列与其他序列间的差异必须比其他序列之间的差异更显著如何确定树根?
8、引入外围支(Outgroup)辅助定位树根。选择外围支:bacteria outgroupeukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaeaMonophyletic group(单源支)Monophyleticgroup外围支Rooted by outgroup 外围支条件:序列必须与剩余序列关系较近,但外围支序列与其分子进化分析讲解1.2 依据进化关系可分为:基因树:用于确定大基因家族内基因或蛋白进化关系的树。物种树:代表一个物种或群体进化历史的系统发育树当不同物种的直系同源基因序列被用来确定物种之间的关系时,会用物种名标记分类
9、单元,树称为物种数。1.2 依据进化关系可分为:2. 系统发育树的表示方法有三种基本的表示方法:进化分支树(Cladogram):展示了分类单元之间的家系关系,但没有任何时间和分歧程度。即无支长信息。2. 系统发育树的表示方法有三种基本的表示方法:加性树(additive tree):除了展示家系关系,用分支长度度量进化分歧。分支长度的单位是任意的,与位点变异数成比例。等距离树: 除了加性树的属性外,它假设所有分支有同样的变异速率(分子钟)。加性树(additive tree):除了展示家系关系,用分二、系统发育树性质如果是一棵有根树,则树根代表在进化历史上是最早的、并且与其它所有分类单元都有
10、联系的分类单元。 如果找不到可以作为树根的单元,则系统发生树是无根树。 从根节点出发到任何一个节点的路径指明进化时间或者进化距离。二、系统发育树性质如果是一棵有根树,则树根代表在进化历史上对于给定的分类单元数,有很多棵可能的系统发生树,但是只有一棵树是正确的。系统发育分析的目标 寻找这棵正确的树对于给定的分类单元数,有很多棵可能的系统发生树,但是只有一棵第二节 系统发育树的构建 分子进化分析介绍 系统发育树重建方法 常用分子进化与系统发育分析的软件第二节 系统发育树的构建 分子进化分析介绍一 、系统发育树重建分析步骤多序列比对(自动比对,手工比对)选择建树方法及取代模型建立进化树进化树评估选择
11、数据(核酸/蛋白质,外围支)一 、系统发育树重建分析步骤多序列比对(自动比对,手工比对)二、系统发育树的构建从多重序列比对到构建进化树有多种算法,可分两大类:基于距离的方法首先通过各个序列之间的比较,根据一定的假设(进化距离模型)推导出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离。基于特征的方法不计算序列之间的距离,而是将序列中有差异的位点作为单独的特征,并依据这些特征来建树。二、系统发育树的构建从多重序列比对到构建进化树有多种算法,可基于距离的方法非加权分组平均法(UPGMA)最小近乎距离(ME)邻近法(NJ)基于特征的方法最大简约法(MP)最大似然法
12、(ML)Bayesian 计算速度距离法 最大简约法 最大似然法基于距离的方法1. 最大简约(MP)最大简约法(maximum parsimony)最早源于形态性状研究,现在已经推广到分子序列的进化分析中。 最大简约法的理论基础是奥卡姆(Ockham)原则,这个原则认为:解释一个过程的最好理论是所需假设数目最少的那一个。对所有可能的拓扑结构进行计算,计算出所需替代数最小的那个拓扑结构,作为最优树。 1. 最大简约(MP)最大简约法(maximum par1) 能将所有可能的树区别出来的位点2) 指那些至少存在2个不同碱基/氨基酸,且每个不同碱基/氨基酸至少出现两次的位点信息位点 (Sites
13、are informative)例: 1,2,3,4四条序列代表4个分类单元1) 能将所有可能的树区别出来的位点信息位点 (Sites 分子进化分析讲解上例Position 5, 7, 9为信息位点基于position 5的三个MP: Tree 1长4,Tree 2& 3长2同理,综合所有信息位点: Tree 1长4,Tree 2长5,Tree 3长6计算结果:MP tree的最优结果为Tree 1上例Position 5, 7, 9为信息位点1. 距离法又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则
14、是基于这个矩阵中的进化距离关系 计算序列的距离,建立距离矩阵通过距离矩阵建进化树1. 距离法又称距离矩阵法,首先通过各个物种之间的比较,根据简单的距离矩阵简单的距离矩阵由进化距离构建进化树的方法有很多,常见有: Fitch-Margoliash Method(FM法):对短支长非常有效 Neighbor-Joining Method (NJ法/邻接法): 求最短支长,最通用的距离方法 Unweighted Pair Group Method (UPGMA法)通过矩阵建树的方法由进化距离构建进化树的方法有很多,常见有:通过矩阵建树的方法示例:FM法示例:FM法分成三组:D, E及ABC。 计算距
15、离矩阵分成三组:D, E及ABC。分子进化分析讲解将DE合并,ABC单列,计算距离矩阵分成三组:C, DE及AB。计算距离矩阵将DE合并,ABC单列,计算距离矩阵分成三组:C, DE及A分子进化分析讲解分子进化分析讲解3. 最大似然法(ML) 选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。位置1位置2位置3SUM拓扑树AL(A1)L(A2)L(A3)Asum拓扑树BL(B1)L(B2)L(B3)Bsum拓扑树CL(C2)L(C3)L(C3)Csum似然值最大,即SUM最大的拓扑树则为最优树。3. 最大似
16、然法(ML) 选取一个特定的替代模型来分析给定的三、构建进化树的一般原则1. 可靠的待分析数据2. 准确的多序列比对3. 选择合适的建树方法:A. 序列相似程度高,MP(最大简约法)B. 序列相似程度较低,ML(最大似然法)C. 序列相似程度太低,无意义4. 一般采用两种及以上方法构建进化树,无显著区别可接受三、构建进化树的一般原则1. 可靠的待分析数据构建进化树的一般原则构建进化树的一般原则 进化树的可靠性分析: 自展法 (Bootstrap Method) (统计方法) 。从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列重复上面的过程,得到多组新的序列对这些新的序列进行建
17、树,再观察这些树与原始树是否有差异,以此评价建树的可靠性进化树的可靠性分析 进化树的可靠性分析: 自展法 (Bootstrap Me第三节 常用分子进化与系统发育分析的软件第三节 常用分子进化与一、常见的分子进化分析程序1. Phylip 由华盛顿大学遗传学系开发,是一个免费的系统发育分析软件包(版本3.69),可以通过以下地址下载。 /phylip.html2. PAUP* 最早是在苹果机上开发的具有菜单界面的进化分析软件,早先版本只有MP法,后续版本已经包括距离法和ML法,现今有mac,win,linux等多种版本,该软件不是免费软件。一、常见的分子进化分析程序1. Phylip软件名称网
18、址说明PHYLIP/phylip.htmlIt includes programs to carry out parsimony, distance matrix methods, maximum likelihood, and other methods on a variety of types of data, including DNA and RNA sequences, protein sequences, restriction sites, 0/1 discrete characters data, gene frequencies, continuous characters
19、 and distance matrices. PAUP/It includes parsimony, distance matrix, invariants, and maximum likelihood methods and many indices and statistical tests.Tree of Life/tree/program/program.htmlArizona大学开发的软件MEGA美国宾州州立大学Masatoshi Nei开发(It carries out parsimony, distance matrix and likelihood methods for
20、molecular data.)软件名称网址说明PHYLIPhttp:/evolution软件名称网址说明MOLPHYhttp:/www.ism.ac.jp/software/ismlib/softother.e.html#molphy日本国立统计数理研究所开发。(Carrying out maximum likelihood inference of phylogenies for either nucleotide sequences or protein sequences.)PAMLhttp:/abacus.gene.ucl.ac.uk/software/paml.html英国伦敦学院
21、Z. H. YANG开发。(A package of programs for the ML analysis of nucleotide or protein sequences.)PUZZLEftp:/fx.zi.biologie.uni-muenchen.de/pub/puzzle应用Quarter puzzling方法(一种最大简约法)构建系统发育树TreeViewhttp:/taxonomy.zoology.gla.ac.uk/rod/treeview.htmlA program for displaying trees on Apple Macs and Windows PCs.
22、It can draw rooted and unrooted trees, display bootstrap values, and supports the native font and graphics file formats of both Macs and PCs.phylogenyhttp:/www.ebi.ac.uk/phylogeny.htmlEBI的系统发育树分析软件软件名称网址说明MOLPHYhttp:/www.ism.a二、Phylip软件包介绍 Phylip包含了35个独立的程序,这些独立的程序都实现特定的功能,这些程序基本上包括了系统发生分析的所有方面。 Phy
23、lip有多种不同平台的版本包括Windows,Macintosh,DOS,Linux,Unix和OpenVMX)。二、Phylip软件包介绍 Phylip包含了35个独立 Phylip是目前最广泛使用的系统发生分析程序,主要包括以下几个程序组:分子序列组,距离矩阵组,基因频率组,离散字符组,进化树绘制组。分子序列组:蛋白质序列:protpars,proml,promlk, protdist核酸序列:dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacomp Phylip是目前最广泛使用的系统发生分析程序,主要包距离矩阵组:F
24、itch,kitsch,neighbor基因频率组:Gendist,contml离散字符组: Pars,mix,move,penny,dollop,dolmove,dolpenny,clique,factor进化树绘制组:drawtree,drawgram其他:restdist,restml,seqboot,contrast treedist,consense,retree距离矩阵组:Fitch,kitsch,neighbor分子进化分析讲解分子进化分析讲解分子进化分析讲解Phylip安装分析程序帮助文件Phylip安装分析程序帮助文件Exe文件夹内容Exe文件夹内容三、Phylip软件包的应
25、用1. 根据分析数据,选择适当的程序 如果分析的是DNA数据,就在核酸序列分析类中选择程序(dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacomp ) 如果分析的是离散数据,如突变位点数据,就在离散字符组里面选择程序。三、Phylip软件包的应用1. 根据分析数据,选择适当的2.选择适当的分析方法 如分析的是DNA数据,可以选择简约法(dnapars),似然法(dnaml,dnamlk),距离法等(dnadist)。3.进行分析 选择好程序后,执行,读入分析数据,选择适当的参数,进行分析,结果自动保存为outfile,o
26、uttree。2.选择适当的分析方法Outfile是一个记录文件,记录了分析的过程和结果,可以直接用文本编辑器(如写字板)打开。outtree是分析结果的树文件,可以用phylip提供的绘树程序打开查看,也可以用其他的程序来打开,如treeview。Outfile是一个记录文件,记录了分析的过程和结果,可构建核酸树的过程Alignment.phykitsch.exe fitch.exeneighbor.exednadist.exeDistdnapars.exeMPdnamlk.exednaml.exeMLouttreeoutfileTreeviewconsen-se.exeoutfileout
27、tree构建核酸树的过程Alignment.phykitsch.ex构建蛋白质树的过程Alignment.phykitsch.exe fitch.exeneighbor.exeprodist.exeDistprotpars.exeMPpromlk.exeproml.exeMLouttreeoutfileTreeviewconsen-se.exeoutfileouttree构建蛋白质树的过程Alignment.phykitsch.e(1).进入EXE文件夹,点击SEQBOOT软件,输入DNA8.phy文件名,回车后,输Y确认参数。并在Random number seed (must be odd
28、) ?的下面输入一个4N+1的数字如5, 程序开始运行,并在EXE文件夹中产生文件outfile.进化树的可靠性分析: 自展法 (Bootstrap Method) 四、实例:用Phylip 软件推导进化树(1).进入EXE文件夹,点击SEQBOOT软件,输入DNA分子进化分析讲解(2). 得到一个文件outfile,把文件outfile改名为infile, infile可用记事本打开,内容如下:(2). 得到一个文件outfile,把文件outfile改(3). 点击DNADIST(PRODIST for 蛋白序列)程序。输入M更改参数,输入D选择data sets, 输入100。输Y确认参数, 程序开始运行,并在EXE文件夹中产生outfile。 建树方法:距离矩阵法推测进化树(3). 点击DNADIST(PRODIST for 蛋白序(4). 将原先infile文件名改为infile1,再将outfile文件名改为i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论