版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、系统发育分析,封烁,引言,生物学家:We have a dream Tree of Life: 重建所有生物的进化历史并以系统树的形式加以描述。,引言,梦想走进现实:How? 最理想的方法:化石! 零散、不完整,引言,梦想走进现实:How? 比较形态学和比较生理学:确定大致的进化框架 细节存很多的争议,引言,梦想走进现实:How? 第三种方案:分子进化 1964年,美国进化生物学家 E. Zuckerkandl和 量子化学家Linus Pauling提出分子进化理论 基本假设 核酸和蛋白质序列中含有生物进化历史的全部信息 理论 分子进化速率恒定。 分子钟:物种的同源基因之间的差异程度与它们的共
2、同祖先的存在时间(即两者的分歧时间)有一定的数量关系。 发生在分子层面的进化过程:DNA, RNA和蛋白质分子,系统进化树的概念,所有生物都可以追溯到共同的祖先,生物的产生和分化就像树一样生长、分叉,以树的形式来表示生物之间的进化关系是非常自然的事。,系统发育的定义,系统发育(phylogeny),也叫系统发生,是指任何实体(基因、个体、种群、物种等)的起源和演化关系。 将进化论的原理拓展到核苷酸水平和蛋白质序列水平,通过多重序列比对,研究一组相关的基因或蛋白质,推断和评估不同基因间的进化关系。,分子进化的模式,1. DNA突变:替代,插入,缺失,倒位 核苷酸替代:转换 (Transition
3、) & 颠换 (Transversion) 2. 基因复制:多基因家族的产生以及伪基因的产生 A. 单个基因复制 重组或者逆转录 B. 染色体片断复制 C. 基因组复制,Thr Tyr Leu Leu ACC TAT TTG CTG,ACC TCT TTG CTG Thr Ser Leu Leu,替代,Thr Tyr Leu Leu ACC TAT TTG CTG,ACC TAC TTT GCT G Thr Tyr Phe Ala,插入,Thr Tyr Leu Leu ACC TAT TTG CTG,ACC TAT TGC TG- Thr Tyr Cys -,缺失,Thr Tyr Leu Le
4、u ACC TAT TTG CTG,ACC TTT ATG CTG Thr Phe Met Leu,倒位,DNA突变,核苷酸替代:转换 & 颠换,1. 转换:嘌呤被嘌呤替代,或者嘧啶被嘧啶替代 2. 颠换:嘌呤被嘧啶替代,或者嘧啶被嘌呤替代,基因复制:单个基因复制,重组,逆转录,基因复制:染色体片段复制,人,狒狒,基因复制:基因组复制,S. Cerevisiae (酿酒酵母),K. Waltii (克鲁雄酵母),研究结果:克鲁雄酵母中的同源基因数量与酿酒酵母相比为1:2,系统进化树及其构建,系统进化树的概念 系统进化树的种类 系统进化树的构建,系统进化树的概念术语,祖先节点/树根,内部节点/分
5、歧点,该分支可能的祖先节点,分支/世系:长度对应演化距离(如估计的演化时间),末端节点:代表最终分类,可以是物种,群体,或者蛋白质、DNA、RNA分子等,A,B,C,D,E,系统进化树的概念,直系同源(orthologs): 同源的基因是由于共同的祖先基因进化而产生的。 旁系同源(paralogs): 同源的基因是由于基因复制产生的。 用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。,旁系同源,直系同源,拓扑结构: 有根树: 反映时间顺序 无根树: 反映距离,系统进化树的种类 有根树、无根树,外围支,系统进化树的种类 标度树、非标度树,标度树:分支的长度表示变化的程度 非标度树
6、:分支只表示进化关系,支长无意义,一个单位,系统进化树的种类 物种树、基因树,物种树:代表一个物种或群体进化历史的系统进化树,两个物种分歧的时间为两个物种发生生殖隔离的时间 基因树:由来自各个物种的一个基因构建的系统进化树(不完全等同于物种树),表示基因分离的时间。,系统进化树的种类 物种树、基因树,系统进化树的种类 物种树、基因树,系统进化树的构建,构建系统进化树的步骤 构建系统进化树的方法 构建进化树的一般原则,构建系统进化树的步骤,多序列比对(自动比对,手工校正),选择建树方法以及替代模型,建立进化树,进化树评估,最经典和广为熟知的多序列比对软件是 clustalw 。 比对速度(Mus
7、cleMAFFTClustalWT-Coffee) 比对准确性(MAFFTMuscleT-CoffeeClustalW),MAFFT,构建系统进化树的步骤,较为精确的方法 L-INS-i 最准确的方法。适合于 output $ linsi input output G-INS-i 适合于序列长度相似的多序列比对。序列条数 output $ ginsi input output E-INS-i 适合序列中包含较大的非匹配区域。序列条数 output $ einsi input output 节约速度的方法 FFT-NS-i 减少迭代次数,最大迭代次数减为 2 。 $ mafft -retree
8、2 -maxiterate 2 input output $ fftnsi input output FFT-NS-2 最大迭代次数减为 0 。 $ mafft -retree 2 -maxiterate 0 input output $ fftns input output FFT-NS-1 此方法非常快速,适合 2000 条序列的多序列比对。 $ mafft -retree 1 -maxiterate 0 input output NW-NS-i 迭代过程中不进行 FFT aproximation $ mafft -retree 2 -maxiterate 2 -nofft input o
9、utput $ nwnsi input output NW-NS-2 $ mafft -retree 2 -maxiterate 0 -nofft input output $ nwns input output NW-NS-PartTree-1 3 个参数都设置为最不消耗时间的类型,适合于 10,000 到 50,000 条序列的比对。 $ mafft -retree 1 -maxiterate 0 -nofft -parttree input output,构建系统进化树的步骤,多序列比对(自动比对,手工校正),选择建树方法以及替代模型,建立进化树,进化树评估,模型预测: Jmodelte
10、st ProtTest,构建系统进化树的方法,1. 最大简约法 (maximum parsimony, MP) 适用序列有很高相似性时 2. 距离法 (distance) 适用序列有较高相似性时 3. 最大似然法 (maximum likelihood, ML) 可用于任何相关序列集合 计算速度: 距离法 最大简约法 最大似然法,构建系统进化树的方法 最大简约法(MP),理论基础为奥卡姆 (Ockham)原则:计算所需替代数最小的那个拓扑结构,作为最优树 在分析的序列位点上没有回复突变或平行突变,且被检验的序列位点数很大的时候,最大简约法能够推导获得一个很好的进化树 缺点:分析序列上存在较多的
11、回复突变或平行突变,而被检验的序列位点数又比较少的时候,可能会给出一个不合理的或者错误的进化树推导结果,构建系统进化树的方法 距离法,又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系 。,构建系统进化树的方法 距离法,简单的距离矩阵,由进化距离构建进化树的方法有很多,常见有: (1) Fitch-Margoliash Method (FM法): 对短支长非常有效 (2) Neighbor-Joining Method (NJ法/邻接法):求最短支长,最通用的距离方法 (3)
12、 Neighbors Relaton Method(邻居关系法) (4) Unweighted Pair Group Method (UPGMA法/非加权组平均法),构建系统进化树的方法 距离法,1.最大似然法(maximum likelihood, ML): 最早应用于对基因频率数据的分析上 2.选取一个特定的替代模型来分析给定的一组序列数据,在每组序列比对中考虑每个核苷酸替换的概率。 例如,转换出现的概率大约是颠换的三倍。在一个三条序列的比对中,如果发现其中有一列为一个C,一个 T和一个 G,我们就认为,C和 T所在的序列之间的关系很有可能更接近。 3.计算表示序列关系的每棵可能的树的概率
13、。 概率总和最大的那棵树最有可能是反映真实情况的系统发生树。 4.缺点:费时,每个步骤都要考虑内部节点的所有可能性 5.改进:启发式算法,构建系统进化树的方法 最大似然法(ML),1. 可靠的待分析数据 2. 准确的多序列比对 3. 选择合适的建树方法: A. 序列相似程度高,MP首先 B. 序列相似程度较低,ML首先 C. 序列相似程度太低,无意义 4. 一般采用两种及以上方法构建进化树,无显著区别可接受。,构建系统进化树的原则,进化树的可靠性分析,单纯由预先获得的多序列比对结果数据所推导出的进化树有时并不一定可靠。 改进办法:引进一些统计分析来寻找更优的进化树,检验结果的可靠性。 最常见的就是bootstrap评估。,从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列; 重复上面的过程,得到多组新的序列; 对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性。 至少进行100次重复取样。,进化树
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5年中考3年模拟试卷初中生物八年级下册期末素养综合测试(一)
- 高中语文《小二黑结婚(节选)》随堂练习(含答案)
- 苏少版四年级音乐教案下
- DB11-T 1945-2021 屋面防水技术标准
- 景观河道砖块运输服务协议
- 互联网金融服务居间协议
- 教育机构半包装修合同样本
- 保健用品居间合同样本
- 农产品冷链配送合同
- 家庭维修居间服务合同
- 易飞ERP月底存货财务成本一体化操作流程
- 农村小学英语口语教学研究课题结题报告ppt课件
- 级配砂石换填专项施工方案(可编辑)
- 模拟汽车运输振动测试指导书
- 零基预算在企业环境成本控制中的应用
- 采油树维护保养与操作
- 集油池施工方案Word版
- 卫生院工程施工组织设计方案
- 小学三年级上册道德与法治课件-3.做学习的主人(我和时间做朋友)-部编版(14张)ppt课件
- 玉米育种基地建设项目可行性研究分析报告
- 逻辑在高考语文中的运用
评论
0/150
提交评论