浅谈系统发育分析及进化树制作_第1页
浅谈系统发育分析及进化树制作_第2页
浅谈系统发育分析及进化树制作_第3页
浅谈系统发育分析及进化树制作_第4页
浅谈系统发育分析及进化树制作_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、浅谈系统发育分析及进化树制作浅谈系统发育分析及进化树制作 郭勇晖 2012.11.6 人类偏肺人类偏肺病毒的确认病毒的确认 Phylogenetic analysis of ORFs of hMPV Phylogenetic analysis of SARS proteins. Unrooted phylogenetictrees were generated by clustalw 30 MAY 2003 VOL 300 SCIENCE:1399-1404 SARS新型冠状病毒 “新”在哪里? 2 分子系统发育分析分子系统发育分析 系统发育分析是研究物种系统发育分析是研究物种进化和系统分类进

2、化和系统分类 的一种方法,研究对象为携带遗传信息的的一种方法,研究对象为携带遗传信息的 生物大分子生物大分子序列,采用特定的数理统计算序列,采用特定的数理统计算 法来计算生物间的法来计算生物间的生物系统发生生物系统发生的关系。的关系。 并用并用系统进化树系统进化树来概括生物间的这种亲缘来概括生物间的这种亲缘 关系。关系。 3 系统发育进化树(系统发育进化树( Phylogenetic tree) 用一种类似树状分支的图形来概括各种生物之间的亲缘关系。用一种类似树状分支的图形来概括各种生物之间的亲缘关系。 系统进化树的主要构成:系统进化树的主要构成: 结点(结点(node):每个结点表示一个分类

3、单元(属、种群)。:每个结点表示一个分类单元(属、种群)。 进化分枝进化分枝(Clade): 是指由同一生物进化而来的单一系统群。是指由同一生物进化而来的单一系统群。 实体抽象为节点,实体间的进化关系抽象为连接实体抽象为节点,实体间的进化关系抽象为连接 研究对象:研究对象: 包括基因序列,基因组的排列方式,二级结构,编码的蛋白序列包括基因序列,基因组的排列方式,二级结构,编码的蛋白序列 及高级结构等及高级结构等 研究意义:研究意义: 通过序列同源性的比较进而了解基因的进化以及生物系统发生的通过序列同源性的比较进而了解基因的进化以及生物系统发生的 内在规律内在规律 分子系统发育的分子系统发育的核

4、心核心是是构建系统发育进化树构建系统发育进化树 分子系统发育分析分子系统发育分析 4 人人 猩猩 猩猩 狒狒 狒狒 外 群 分支 长度根 进化支 结 点 系统发育进化树示例系统发育进化树示例 n结点:表示一个分类单元。结点:表示一个分类单元。 n进化支:两种以上生物(进化支:两种以上生物(DNA序序 列)及其祖先组成的树枝。列)及其祖先组成的树枝。 n进化分支:进化关系的图形表示进化分支:进化关系的图形表示 n进化分支长度:进化分支长度: 用数值表示的进化枝的变化程度用数值表示的进化枝的变化程度 (遗传距离)(遗传距离) n距离标尺距离标尺: 生物体或序列之间差异的的生物体或序列之间差异的的

5、数字数字 尺度。尺度。 n根根:所有分类的共同祖先。:所有分类的共同祖先。 n外群:外群: 一个或多个无可争议的同源物种一个或多个无可争议的同源物种, 与分析序列相关且具有适当的亲缘与分析序列相关且具有适当的亲缘 关系关系 距离标尺距离标尺 一个单位 系统进化树系统进化树 0.5 5 系统进化树系统进化树 6 基因树和物种树基因树和物种树 基因树基因树(gene tree): 当一个系统进化树是根据某一个基因数据构建而来的当一个系统进化树是根据某一个基因数据构建而来的,称为基因称为基因 树树。因为这种树代表的仅仅是单个基因的进化历史。而不是它所。因为这种树代表的仅仅是单个基因的进化历史。而不是

6、它所 在物种的进化历史。在物种的进化历史。 物种树物种树(species tree): 反映物种之间真实进化关系的系统进化树被称为物种树反映物种之间真实进化关系的系统进化树被称为物种树。例如一。例如一 项关于植物进化的研究中,用了项关于植物进化的研究中,用了100个不同的基因来构建物种树。个不同的基因来构建物种树。 联系:联系: 虽然基因树不能等同于物种树虽然基因树不能等同于物种树, 但基因树的分支形式能够反映物但基因树的分支形式能够反映物 种的进化历史种的进化历史。病毒比较简单,遗传多态性较弱,一般而言结构病毒比较简单,遗传多态性较弱,一般而言结构 蛋白基因构建的基因树最能接近物种树表达的进

7、化关系。蛋白基因构建的基因树最能接近物种树表达的进化关系。 7 物种树物种树基因树基因树 8 人类偏肺人类偏肺病毒的确认病毒的确认 9 SARS“新”型冠状病毒 10 找到建树目的基因(基因组)找到建树目的基因(基因组) 进行多序列比对进行多序列比对 选择建树方法选择建树方法 建立进化树建立进化树 进化树评估进化树评估 系统发育树构建分析步骤系统发育树构建分析步骤 11 pDistance-based methods 基于距离的方法 Unweightedpair group method using arithmetic average (UPGMA) 非加权分组平均法 Minimum evo

8、lution(ME)最小进化方法 Neighbor joining(NJ)邻位归并法 pCharacter-based methods 基于特征的方法 Maximum parsimony(MP)最大简约法 Maximum likelihood method(ML)最大似然法 p计算速度 距离法 最大简约法 最大似然法 系统发育树构建的基本方法系统发育树构建的基本方法 12 p基于距离的方法 首先通过各个物种之间的比较,根据一定的假设(进化距离 模型)推导得出分类群之间的进化距离,构建一个进化距离矩 阵。进化树的构建则是基于这个矩阵中的进化距离关系。 p基于特征的方法 不计算序列间的距离,而是将

9、序列中有差异的位点作为单 独的特征,并根据这些特征来建树。 系统发育树构建的基本方法系统发育树构建的基本方法 13 系统发育树构建的分析过程系统发育树构建的分析过程 14 ClustalX () Modeltest&MrModeltest() PHYLIP MEGA PHYML PAUP BEAST Figtree () TreeView () 系统发育树构建的相关软件系统发育树构建的相关软件 15 用截然不同的距离矩阵法与简约法分析一个数据 集,如果能够产生相似的系统发生树,这样的树 可以认为是可靠的 用Bootstrap(自展法)检验 系统发育树构建的评估系统发育树构建的评估 16 从排列

10、的多序列中随机有放回的抽取某一列,构 成相同长度的新的排列序列 重复上面的过程,得到多组新的序列 对这些新的序列进行建树,再观察这些树与原始 树是否有差异,以此评价建树的可靠性 一般Bootstrap重复取样次数要大于100(一般文章 要求1000),根据每个分支在不同此取样时出现 的频率赋予该分支一个百分比。 如果严格根据统计学概念,该百分比要大于95 采认为该分支的较为可信。在实际应用中该值大 于75就认为可信,细菌等相似度更大的分类中 ,大于50%就可以认为可信。 BootstrapBootstrap自展法自展法 17 A.重新取样重新取样(100-1000 time). 12345 1

11、00 1 : ATCTGA 2 : ATCTGC 3 : ACTTAC 4 : ACCTAT 12345 100 1 : AATTTT 2 : AATTTG 3 : AACTTT 4 : AACTTT 11244 x 12345 100 1 : TTTATT 2 : TAACCG 3 : TAACCT 4 : TGGGAT 47789x 12345 100 1 : AGGTAT 2 : AGGACG 3 : AAAACA 4 : AAAGGC 15578x BootstrapBootstrap自展法自展法 18 B. 每组取样重建进化树每组取样重建进化树. 12345 100 1 : AATT

12、TT 2 : AATTTG 3 : AACTTT 4 : AACTTT 11244 x 12345 100 1 : TTTATT 2 : TAACCG 3 : TAACCT 4 : TGGGAT 47789x 12345 100 1 : AGGTAT 2 : AGGACG 3 : AAAACA 4 : AAAGGC 15578x Sp1 Sp2 Sp3 Sp4 Sp1 Sp2 Sp3 Sp4 Sp1 Sp2 Sp3 Sp4 BootstrapBootstrap自展法自展法 19 C. 计算各分支出现的可信度计算各分支出现的可信度 Sp1 Sp2 Sp3 Sp4 Sp1 Sp2 Sp3 Sp4

13、Sp1 Sp2 Sp3 Sp4 Sp1 Sp2 Sp3 Sp4 67% 100% In 67% of the data sets, the split between SP1+SP2 and the rest of the tree was found. BootstrapBootstrap自展法自展法 20 得到CA16 VP1序列,利用MEGA软件进行处理和分析序列: 1)用MEGA软件对多序列进行比对,建立MEGA软件构建进化 树的数据格式(两端对齐,fasta格式输出); 2)用N-J法构建基因进化树; 3)对所构建的进化树进行加工处理。 实例讲解:实例讲解: (建立肠道病毒(建立肠道

14、病毒CA16 VP1的基因树)的基因树) 21 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 22 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 23 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 24 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 25 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 26 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 27

15、实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 28 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 29 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 30 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 31 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 32 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 33 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 34 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 35 实例讲解:实例讲解:(建立肠道病毒(建立肠道病毒CA16 VP1的基因树)的基因树) 36 37 38 体会:体会: 1、用什么方法建树。 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论