基因组数据分析PPT课件_第1页
基因组数据分析PPT课件_第2页
基因组数据分析PPT课件_第3页
基因组数据分析PPT课件_第4页
基因组数据分析PPT课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组数据注释和功能分析 11.通过序列比对工具 BLAST学习,了解蛋白编码基因的功能注释原理2.介绍多序列联配工具 ClustalX3.分子进化分析软件 MEGA4的基本知识,掌握系统发生树绘制的基本方法2序列比对的进化基础 序列比对的目的: 从核酸以及氨基酸的层次去分析序列的相同点和不同点,以推测他们的结构、功能以及进化上的联系 通过判断两个序列之间的相似性来判定两者是否具有同源性 相似性:直接的数量关系,如:序列之间相似部分的百分比 同源性:质的判断,两个基因在进化上是否曾有共同祖先的推断3BLAST 基本局部比对搜索工具 (Basic Local Alignment Search Tool) NCBI 上 BLAST 服务的网址 :/blast/ NCBI 的 BLAST 程序及数据库下载网址: /blast4选择物种选择 blast程序5Query SequenceAmino acid Sequence DNA SequencetBLASTxBLASTxBLASTntBLASTnBLASTpNucleotideDatabaseProteinDatabaseNucleotideDatabaseNucleotideDatabaseProteinDatabaseTranslated Translated6程序名 搜索序列 数据库 内容 备注blastp Protein Protein 比较氨基酸序列与蛋白质数据库使用取代矩阵寻找较远的关系,进行 SEG过滤blastn Nucleotide Nucleotide 比较核酸序列与核酸数据库寻找较高分值的匹配,对较远的关系不太适用blastx Nucleotide Protein 比较核酸序列理论上的六框架的所有转换结果和蛋白质数据库用于新的 DNA序列和ESTs的分析,可转译搜索序列tblastn Protein Nucleotide 比较蛋白质序列和核酸序列数据库,动态转换为六框架结果用于寻找数据库中没有标注的编码区,可转译数据库序列tblastx Nucleotide Nucleotide 比较核酸序列和核酸序列数据库,经过两次动态转换为六框架结果转译搜索序列与数据库序列7与核酸相关的数据库与蛋白质相关的数据库8选择数据库序列或目标序列的 GI号以文件格式上传9配对与错配空位罚分10PSI-BLAST:位点特异迭代 11打分矩阵:PAM 30PAM 70BLOSUM80BLOSUM62BLOSUM4512选择打分矩阵( scoring matrix)The PAM family Based on global alignments The PAM1 is the matrix calculated from comparisons of sequences with no more than 1% divergence. Other PAM matrices are extrapolated from PAM1.The BLOSUM family Based on local alignments. BLOSUM 62 is a matrix calculated from comparisons of sequences with no less than 62% divergence. All BLOSUM matrices are based on observed alignments; they are not extrapolated from comparisons of closely related proteins. 13进行比对的数据库图形化结果14The Expect value (E) is a parameter that describes the number of hits one can “expect“ to see just by chance when searching a database of a particular size.1516上机实习 1:网上运行 blastx和 blastn(NCBI blast网址:/BLAST/)lesson.seq.screen.Contig34 TTTTTTTTTTTTTTTTTAGTGCCAGTTTTTTTTTTTATTTGTAAAGCTCTGCCATAAACTTCTAGCGTGTGCCAATGGTCACCTGCCACACTCGCACCAGGTTGTCCGTGTAGCCAGCAAACAGAGTCTGGCCATCAGCAGACCAGGCCAGGGAGGTGCACTGGGGTGGTTCTGCCTTGCTGCTGGTACTGATAACTTCTTGCTTCAGTTCATCTACAATGATCTTTCCCTCTAAATCCCAGATCTTGATGCTGGGGCCTGTGGAGCACACAGCCAGTAGCGGTTAGGGCTGAAGCACAGGGCGTTGATGATGTCCCCACCATCTAGCGTGTAAAGGTGTTTGCCTTCGTTGAGATCCCATAACATGGCCTGGCCATCCTTGCCTCCAGAAGCACAGAGGGATCCATCTGGAGAGACAGTCACCGTGTTCAGATAGCCTGTGTGGCCAATGTGGTTGGTCTTCAGCTTGCAGTTAGCCAGGTTCCATACCTTGACCAGCTTGTCCCAGCCACAGGAGACGATGATAGGGTTGCTGCTGTTGGGCGAGAAGCGGACACAAGACACCCACTCTGAGTGGCTCTCATCCTGGACAGTGTATTTGCACACACCCAGGGTATTCCATAGCTTGATGGTTTTATCTCGAGATCCAGAGACAATCTGCCGGTTGTCAGAGGAGAAGGCCACACTCAGCACATCCTTGGTATGGCCCACAAATCGCCTCGTGGTGGTGCCCGTTGTGAGATCCCAGAAGGCGCAGGGTTCCATCCCAGGAGCCTGAGAGGGCAAACTGGCCATCTGAGGAGATAACCACATCACTAACAAAGTGGGAGTGACCCCGCAGAGCACGCTGTGGAATTCCATAGTTGGTCTCATCCCTGGTCAGTTTCCACATGATGATGGTCTTATCTCGAGAGGCGGAGAGGATCATGTCCGGGAACTGCGGGGTAGTAGCGATCTGGGTTACCCAGCCGTTGTGGCCCTTGAGGGTGCCACGAAGGGTCATCTGCTCAGTCATGGCGGCGGCGAGAGCGTGTTCGCTGCAGCGACGAGGATGGCACTGGATGGCTTAGAGAAACTAGCACCACAGTCGACC1.对 contig34进行网上 blastn(演示),2.blastx(自行操作)比对17本地运行 BLAST 下载 (/blast/download.shtml ) 安装(安装到 C:) 数据库的格式化( formatdb) 程序运行 ( blastall)1819双击安装到 D盘产生三个文件夹bindatadoc将 db,in复制到Blast/bin文件夹下bin含可执行程序 (将数据库及需要比对操作的数据放入该文件 );data文件夹含打分矩阵及演示例子的序列数据信息;doc文件夹含关于各子程序的说明文档。 20数据库的格式化formatdb命令用于数据库的格式化:formatdb option1option2option3 formatdb常用参数-i database_name 需要格式化的数据库名称-p TF 待格式化数据库的序列类型(核苷酸选 F;蛋白质选 T;默认值为 T)例: formatdb -i db -p T 对蛋白质数据库 “db”进行格式化21程序运行blastall命令用于运行五个 blast子程序 :blastall option1option2option3 blastall常用参数四个必需参数-p program_name, 程序名,根据数据库及搜索文件序列性质进行选择;-d database_name,数据库名称 , 比对完成格式化的数据库;-i input_file, 搜索文件名称;-o output_file, BLAST结果文件名称;2个常用参数-e expectation,期待值 ,默认值为 10.0,可采用科学计数法来表示,如 2e-5;-F filter? 过滤低复杂性序列,默认为 T,默认低复杂性序列不参加比对;例: blastall -p blastx -d db -F F -i in -o out -e 2e-5 22blast部分参数 :23上机实习 2:本地运行 blastx 进入 DOS命令行提示符状态 ( “ 运行 ” cmd) 进入 C盘 “ cd ” 进入包含序列数据的 bin目录下 “ cd Blastbin” 察看目录下内容 “dir” 格式化数据库 db “ formatdb i db p T” 运行 blastx“blastall p blastx i in d db o out” 察看结果 more out.txt输入 数据库类型: F/TBlast程序 序列输入 数据库 结果输出2425输入 “cd ”- 回车回到安装目录 C盘输入 “cd blastbin”- 回车到达 blas

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论