信息生物学课件_第1页
信息生物学课件_第2页
信息生物学课件_第3页
信息生物学课件_第4页
信息生物学课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

现代生物学实验技术

生物信息与数据处理本课件在安装微软雅黑字体后有最好效果【详细说明见jiaoan.htm】机房注意事项不得做课堂以外的事情,一经发现,立刻驱逐并记录通报。严禁随意设置、升级系统。将自己产生的垃圾带走;爱护机房设备。有问题通报老师。部分鼠标不好使,下面垫张白纸就可以了。注意脚不要踢到下面的线。仔细阅读教案,提问前先在本教案上找答案。2电脑操作相关事项登录开机自动进入Ubuntu系统(Linux的一个版本)后,输入用户名"owner"和密码"buxudong!"登录。复制教案(可选)点击菜单栏上的“Places/HomeFolder”打开文件查看器(;相当于Windows的资源管理器),如果没有看到jiaoan.ppt(或jiaoan.htm)文件,按照下列步骤复制。3本课目录生物数据查询分子进化与系统分析5一、生物数据查询6网上查资料Google(“谷歌”)

7查中文生物文献9查英文生物文献PubMed()可编程10关键词的选择不是特殊情况,尽量使用名词原形,不使用复数、所有格等尽量使用专业用语,不使用the,of,and,research等常用词作为关键词为了减少遗漏,使用尽可能少而精的关键词11PubMed查询结果(2)–综述文章保存搜索结果查看该文摘要13增加搜索选项14精确使用PubMed查找(高级搜索)标签(tag)字段(field)关键词(keyword)操作符(operator)检索条件(searchterms)15查找帮助(2)17NCBI美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation)前身是NIH所属的一个研究所的计算生物学研究室,1988年独立为NCBI,形式上属于国家医学图书馆(NationalLibraryofMedicine/NLM)管理着许多著名数据库,如GenBank、Medline、dbSNP、COG、OMIM等提供Entrez、BLAST等服务

18国际核苷酸序列数据库联盟InternationalNucleotideSequenceDatabaseCollaboration(INSDC)包括GenBank [美]EMBL [欧]DDBJ [日]每天这三个数据库作数据同步操作在任何一个数据库操作(查找、投递数据等)是等效的19GenBank结构GenBank包括三个子数据库CoreNucleotidedbESTdbGSS其中CoreNucleotide还分为更小的BLAST数据库nrhtgswgsenv_nt21GenBank查询(1)已知收录号(accessionnumber)的情况选数据库输入收录号查询结果摘要点击查看详细结果不知收录号时,如要搜索人体中的解旋酶,可以在下拉框中选择“Nucleotide”后,输入“helicaseANDhuman[orgn]”(不要输入引号)22作业【作业一般性的要求参见附录一,本作业具体的要求见下。】题目用PubMed搜索你感兴趣的课题相关的序列或

综述文献(review)。要求将搜到的文献/序列的基本信息(文献包括标题、杂志名、卷、期、页码、时间、作者,注意不要摘要;序列只要简单注释)上交。文献总篇数/序列总条数限制在20以内。如果超过20不列出超出的部分,只列出实际的总数。在步骤中说明你选择关键词和限制条件的理由。23FASTA序列格式也叫Pearson格式简单使用最多例子(单序列)>NameofthesequencectgcgagNcgcgcgatgatagMMM-NNNnnnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUUUURRRrrrrrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVvvvcgtaggcagccgcc“-”表示间隔25多序列FASTA>sequence1,E.colictgcgagNcgcgcgatgatagMMM-NNNngnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUgaURRRrrrtrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVagvcgtaggcagccgcc>sequence2,B.subtilisctgcgagNcgcgcgatgatagctgactNntnatganncgcggcgagcatgtagcatgctagctgtcgcgagcactUctURRRrrrcrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVcgvcgtaggcagccgcc>sequence3,B.nattoctgcgagNcgcgcgatgatagMcgatcccnatgannncgcggcgagcatgtagcatgctagctgtcgcgagcactUggURRRrrrggrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVaavcgtaggcagccgcc26如何用PubMed找蛋白(BLAST第一步)选Protein输入关键词选一个蛋白29blastp(1)–BLAST主页点此进入blastp起始页30blastp(2)–blastp起始页在这里输入要搜索的蛋白质的收录号(accessionnumber)或序列点此开始搜索如果要限制搜索的物种(如水稻),可在"Organism"处输入"Oryzasativa"(水稻的拉丁名)31点此看结果blastp(3)–提交后页面32blastp(4)–结果页(1.基本信息)33blastp(5)–结果页(2.比对图)34blastp(6)–结果页(3.高分序列)35blastp

(7)–结果页(4.高分序列详细结果)consensus36比对(MEGA)37比对38比对39建树(MEGA)关闭比对窗口后自动弹出对话框40建树41作业【作业一般性的要求参见附录一,本作业具体的要求见下。】搜索你所感兴趣的蛋白及其同源物的序列(序列不超过20条),分析这些序列之间的进化关系,建立系统树。将树输出为(;相当于另存为)Newick格式,将输出的nwk文件的内容(例子见下)复制在作业正文内(不要贴图)。并对结果进行解释。

【Newick树例子】((gi|42673|emb|CAA23618.1|_recA_gene_pr...,gi|86449963|gb|ABC96175.1|_RecA_prote...)0.18,(gi|37362719|gb|AAQ91336.1|_RecA_Esche...,gi|86449965|gb|ABC96176.1|_RecA_prote...)0.21,gi|86449967|gb|ABC96177.1|_RecA_prote...);42附录一作业一般性的要求请严格按照要求(包括一般性和具体要求)做作业,这些要求将作为打分的重要依据。任选以上作业之一上交。作业要包括详细完成步骤,其中的所有引用或用到的网页/文献请注明网址或出处。作业请在第8周(4月19日)之前在上交。43附录二常见问题集什么是文件的扩展名?怎样才能看到扩展名?扩展名是文件名末尾点号(.)后面的部分,如文件"实验报告.doc"的扩展名是doc。缺省情况下,WindowsXP会(Linux一般不会)隐藏已知的文件扩展名。要想看到扩展名,打开资源管理器,点击菜单项"工具/文件夹选项",选择"查看"标签,去掉"隐藏已知文件类型的扩展名"复选框即可。什么是纯文本文件?什么是二进制文件?纯文本文件一般也叫文本文件。一个简单的判断文本文件的方法:用记事本(Windows下)或gedit(Linux下)打开这个文件,能够阅读的为纯文本文件,不能阅读的为二进制文件。另一个方法,由扩展名判断。常见的纯文本文件有:文本文件(txt)、网页文件(htm,html)等;常见的二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论