生物信息学概论的案例1ppt课件_第1页
生物信息学概论的案例1ppt课件_第2页
生物信息学概论的案例1ppt课件_第3页
生物信息学概论的案例1ppt课件_第4页
生物信息学概论的案例1ppt课件_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Biological Sequence Analysis 周杰 王莉Contents DB Searching the Blast family, pattern hunter, blat, etc. Sequence Alignment Clustalx, Tcoffee, mafft, ProsCons, etc. Sequence Pattern Analysis Sequence Logo, Codon Usage, etc. Protein Sequence Analysis ORF,funcntion,regulato

2、ry,strucuture,interaction,etc Phylogenetic analysis MEGA, PAUP, Phylip, Mrbayes, etc.Google ScholarEntrezBLASTSeedingMegaBlast 快速寻找高度相似的序列 主要特点: 比BLAST快数百倍 Large Word size Greedy algorithm输入输出格式 所有类blast程序都接受fasta格式序列文件 所有类blast程序都输出类似blast的结果文件。Fasta格式 seq1 CGGCGCTAGCATCGTACACGATCGACACACTGACATCGACA

3、CTAGCTAGCGATCGATCGATCGATGCTACTGACTGACTGATGCTGAC seq2 GATCGATCAGCACGAGCAGCAGCACGACTACTATGCAGTCGATCGTAGCTGACGTACTGATGCAGTCTGACTGATCGTAGCTACGACTACACTACGATC各种序列格式及转换READSEQREADSEQ!Sequence Alignment Software ClustalX (Windows) Tcoffee Mafft Proscons MUSCLE MAUVE, LAGAN, etc (Genome alignment) Progressiv

4、e AlignmentComparison CLUSTAL WIN/UNIX下图形界面,使用最广泛,适合短和不太多的序列。 Tcoffee 比CLUSTAL略精确一些,慢,不常用 Mafft 精度可调,较多500-10000条或较长序列5k-5000k aa/nt都可使用,UNIX下命令行界面。 Porscons 目前为止最为精确的对位软件,慢,UNIX下命令行界面。 MUSCLE 快,可对较长或较多的序列,WIM/UNIX下命令行界面。Why CLUSTALW?输入输出格式 所有序列对位程序都接受fasta格式序列文件 所有序列对位程序都输出fasta格式结果文件或者类似clustalw格式

5、的结果文件。Genome Alignment Tools MUMmer (2019) LAGAN, M-LAGAN (2019) MAUVE (2019) Rearrangement and InversionMAUVE序列模式分析 Sequence Logo Many othersProtein Sequence Analysis ORF Function Prediction 2nd, 3rd structural prediction、comparison Protein interaction predicion ORFORF Finder (demo)功能预测 第一步: databa

6、se search Blast然后尝试搜索各个数据库 找到最接近的蛋白,寻找它的注释和功能信息MPSS/mpss/Structure Prediction二级结构预测Tertiary Structure Predictionrussell.embl-heidelberg.de/gtsp/flowchart2.htmlProtein Structural ComparisonProtein Interaction Prediction 用蛋白序列搜索各大相互作用数据库 BIND, STRING, DIPPhylogenetic Analysis PHYLIP MEGA Tree

7、View PAUP* MrBayes PAML PHYML /phylip/software.htmlPhylipJoe Felsenstein “No Thanks to”特点 发布早,使用非常广泛 命令行driven 能够处理各种类型的数据 包括除Bayesian之外的几乎所有方法 模块化 可批量处理Flowchart文件格式 输入均为PHYLIP格式 输出进化树文件为newick格式(1,2),3),4);(1:1.0,2:2.0):1.0,3:2.0):1.0,4:1.0);MEGADemo timeTreeViewPA

8、UP* By David Swoffold 特点 包括几乎所有构树方法 Bayes方法,蛋白序列的ML方法除外 在Mac上有良好的图形界面 MP方法有非常完善的参数设定及选项,MP树的最佳选择 ML方法也比较完善结合Modeltest) 灵活的分析流程及参数设定,适合各种要求 100$文件格式 输入文件 NEXUS 输出文件 NEXUS, newickNEXUS format#NEXUSBEGIN DATA;dimensions ntax=5 nchar=664;format missing=?symbols=ABCDEFGHIKLMNPQRSTUVWXYZinterleave datatyp

9、e=DNA gap= -;matrixO.lichuanensis TGAAACTTTGGCTCTTTTTTAGGCATCTGCTTGGTCGCCCAO.rhodostigmatus TGAAACTTTGGCTCTCTTCTAGGCATCTGCCTAATTACCCAO.popei TGAAATTTTGGTTCTCTTCTTGGCATCTGCTTAGCCACCCAS.chintingenis TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCAS.boulengeri TGAAATTTCGGCTCATTATTAGGGGTATGTTTGGTAGCCCA;End;PAU

10、P*批处理脚本示例#nexusbegin PAUP;log file=hsearchl.log;set autoclose=yes;hsearch start=stepwise addseq=randomn reps=100 savereps=yes randomize=addseq rstatus=yes hold=1 swap=tbr multrees=yes;savetrees file=hsearch1.all.tre;filter best=yes permdel=yes;savetrees file=hsearch1.best.tre;log stop;end; MacClade

11、By the Maddison brothersMrbayes By John Huelsenbeck & Fredrik RonquistFeatures of Bayesian Method Handles complex models with many parameters Based on likelihood, statistically consistent Faster than ML method,can handle 50 taxon phylogeny Combine multiple types of data (DNA, protein,morphology, etc)文件格式 只接受NEXUS格式 只输出NEXUS格式用处 用来输入和编辑数据,生成NEXUS格式文件,供PAUP,MrBayes等程序使用 图形化显示和编辑进化树 性状进化分析 祖先性状重建PA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论