生物信息学实验指导书_第1页
生物信息学实验指导书_第2页
生物信息学实验指导书_第3页
生物信息学实验指导书_第4页
生物信息学实验指导书_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学实验指导书生物技术教学部 谭军 编重庆邮电学院生物信息学院2005年08月20日前 言生物信息学是上世纪90年代初人类基因组计划(HGP)以来,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。本实验指导书中的8个实验均设计为综合性开放实验,面向生

2、物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障,包括采用mail服务器和Linux帐号管理等进行实验过程管理和支持。限选生物信息学及试验的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。目 录前言 1目录 2实验一 熟悉生物信息学网站及其数据的生物学意义 3实验二 应用BLAST进行序列比对 4实验三 应用ClustalX(W)进行多序列联配 5实验四 ESTs分析 6实验五 应用Primer3设计RACE引物 7实验六 ORF预测 8实验七 蛋白

3、质结构功能分析 9实验八Emboss工具包的熟悉和使用 10实验一 熟悉生物信息学网站及其数据的生物学意义实验目的:培养学生利用互联网资源获取生物信息学研究状况和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式和其中重要的生物学意义。实验原理:利用互连网资源检索相关的国内外生物信息学相关网站:如NCBI、SANGER、TIGR、KEGG、SWISSPROT、Ensemble、中科院北京基因组研究所、北大生物信息学中心等,下载其中的相关数据,如fasta、genbank格式的核酸和蛋白质

4、序列、pathway等数据,理解其重要的生物学意义。实验内容:1浏览和搜索至少10个国外和至少5个国内生物信息学相关网站,并描述网站特征;2下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;3讨论各网站适合做何种生物信息学研究的平台,并设计一个研究设想。实验报告:1各网站网址及特征描述;2代表性数据的下载和生物学意义的描述;3讨论:这些生物信息学相关网站的信息资源,可以被哪些生物信息学研究所利用。参考书目:生物信息学概论罗静初 等译,北京大学出版社,2002;生物信息学手册郝柏林 等著,上海科技出版社,2004;生物信息学实验指导胡松年 等著,浙江大学出版社,2003。实验二 利用

5、BLAST进行序列比对实验目的:了解BLAST及其子程序的原理和基本参数,熟练地应用网络平台和Linux计算平台进行本地BLAST序列比对,熟悉BLAST结果的格式和内容并能描述其主要意义,同时比较网上平台和本地平台的优缺点。实验原理:利用试验一下载的核酸和蛋白质序列,提交到NCBI或者其他拥有BLAST运算平台的网页上,观察其基本参数设定库文件类型,并得到计算结果;同时在本地服务器上学会用formatdb格式化库文件,并输入BLAST命令进行计算,获得结果文件。实验内容:1向网上BLAST服务器提交序列,得到匹配结果;2本地使用BLAST,格式化库文件,输入命令行得到匹配结果;3对结果文件进

6、行简要描述,阐述生物学意义。实验报告:1阐述BLAST原理和比对步骤;2不同类型BLAST的结果及其说明;3讨论:不同平台运行BLAST的需求比较。参考书目和网页:生物信息学概论罗静初 等译,北京大学出版社,2002;生物信息学实验指导胡松年 等著,浙江大学出版社,2003; /Education/BLASTinfo/information3.html。实验三 利用ClustalX(W)进行多序列联配实验目的:掌握用Clustal X(W)工具及其基本参数,对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析,由此对这些物种的亲缘关系

7、进行判断,并且对这些序列在分子进化过程中的保守性作出估计。实验原理:首先对于输入的每一条序列,两两之间进行联配,总共进行n*(n-1)/2次联配,这一步是通过一种快速的近似算法实现的,其得分用来计算指导树,系统树图能用于指导后面进行的多序列联配的过程。系统树图是通过UPGMA方法计算的。在系统树图绘制完以后,输入的所有序列按照得分高低被分成n-1个组,然后再对组与组之间进行联配,这一步用的是Myers和Miller算法。实验内容:1明确软件所支持的输入文件格式,搜集整理出合适的数据;2在windows环境运行Clustal X,在Linux环境运行Clustal W;3实验结果及分析,用TRE

8、EV32或NjplotWIN95生成NJ聚类图。 实验报告:1整理好的符合Clustal的序列数据;2提交数据网页记录和各步骤记录;3提供聚类图和多序列联配图,并说明意义。参考书目:生物信息学概论罗静初 等译,北京大学出版社,2002;生物信息学实验指导胡松年 等著,浙江大学出版社,2003。实验四 ESTs分析实验目的:熟悉使用一系列生物信息学分析工具对测序得到的ESTs序列数据进行聚类处理,由此对获得表达基因的丰度等相关信息,并且对这些表达基因进行功能的初步诠释,为后续实验通过设计RACE引物获得全长基因,以及进一步的功能注释和代谢途径分析做好准备。实验原理:首先用crossmatch程序

9、去除ESTs原始序列中的载体成分和引物成分,然后用phrap生成congtig和singlet,用blast程序进一步将有同源性的contig和singlet进行功能聚类,最后通过blast对聚类获得的cluster进行功能注释。在实验过程中将用到一些本实验室写好的perl程序用于连接各数据库和工具软件。实验内容:1运行crossmatch程序,并用perl程序处理结果获得ESTs序列;2运行phrap程序,并用perl程序提取congtig和singlet;3运行blastn和blastx程序,用perl程序分别获得cluster和初步功能注释结果。实验报告:1实验各步骤记录和中间结果文件;

10、2说明各perl程序在ESTs处理过程中的作用;3举例简要说明结果文件中数据的生物学意义。参考书目:生物信息学概论罗静初 等译,北京大学出版社,2002;基因表达序列标签(EST)数据分析手册胡松年 等著,浙江大学出版社,2005。实验五 利用Primer3设计RACE引物实验目的:熟悉PCR引物设计工具Primer3的网络计算平台和Linux运算平台,了解Primer3的一些基本参数,能够根据实验需要选择相应的引物设计平台设计PCR引物。实验原理:PCR实验是当代分子生物学的基本实验之一,由于目标序列和实验目的的不同,相应设计引物的要求也不一样。本实验延续ESTs分析结果,对于其中需要获得全

11、长的基因进行RACE引物的设计,即5和3RACE引物,配合接头序列设计单向引物,并模拟练习通过连接获得全长的基因CDS序列。最后设计已知全长基因序列的PCR扩增引物。实验内容:1从网站下载并安装Primer3;2分别在网上和Linux运算平台设计 5和3RACE引物;3拼接全长CDS序列,并设计扩增引物。实验报告:1实验各步骤使用的数据、运算平台、结果文件记录;2比较不同引物设计平台和不同PCR实验的差别;3讨论:如何应用Primer3为基因芯片实验设计克隆大规模序列。参考书目和网页:生物信息学概论罗静初 等译,北京大学出版社,2002;生物信息学实验指导胡松年 等著,浙江大学出版社,2003

12、; /cgi-bin/primer3/primer3_www.cgi。实验六 ORF预测实验目的:了解ORF预测的作用,能够运用ORF分析软件Getorf,并能用这些程式进行简单的分析。实验原理:通过序列的ORF预测,为建立cDNA文库,差减杂交得到均质化文库,cDNA序列测定,生物信息学分析,同源性比较,功能预测做必要的准备。实验内容:1、从上述网站下载最新版Getorf,并参考以下网站所介绍的方法安装:http:/bioweb.pasteur.fr/seqanal/interfaces/getorf.html.2、熟悉Getorf软件的主要的功能

13、、输入文件的格式、以及相关参数的作用等。3、利用Getorf进行简单的分析,记录分析步骤和结果。实验报告:要求实验报告阐述实验步骤,简介Getorf的功能,记录实例分析结果,记录实验中出现的问题和解决方案,以及实验的总结。参考书目和网页:生物信息学概论罗静初 等译,北京大学出版社,2002;生物信息学实验指导胡松年 等著,浙江大学出版社,2003; http:/bioweb.pasteur.fr/seqanal/interfaces/getorf.html。实验七 蛋白质结构功能分析实验目的:掌握蛋白质一级、二级和三级结构分析的一些工具,了解与蛋白质功能分析相关的数据库,如:SwissProt

14、蛋白质序列数据库、PDB结构数据库等。实验原理:现有的蛋白质功能分析工具和平台都是根据已知的蛋白质结构进行注释分类、总结结构规律建立参考数据库,并以此作为预测未知蛋白质结构和功能的依据。实验内容:1、熟悉与蛋白质分析相关的数据库资源,如SwissProt蛋白质序列数据库、PDB结构数据库、PROSITE。2、利用PredictProtein对蛋白质序列进行分析。3、利用SSPRED对蛋白质序列进行分析。4、比较两种方法得到的结果。5、利用swiss-model对蛋白质序列进行三维结构预测。实验报告:要求实验报告详细阐述实验步骤,结果,及其对实验的总结。参考书目和网页:生物信息学概论罗静初 等译

15、,北京大学出版社,2002;生物信息学实验指导胡松年 等著,浙江大学出版社,2003; http:/www.embl-heidelberg.de/predictprotein/predictprotein.html;http:/www.dl.ac.uk/CCP/CCP11/DISguISE/structure_prediction/sspredmsu.html;/swissmod/SWISS-MODEL.html。实验八 Emboss工具包的熟悉和使用实验目的:了解Emboss工具包中的各软件功能,会用Emboss中的分析工具分析序列的相关特征,熟悉Emboss工具包中常用应用软件的使用,并能用这些软件进行简单的序列分析。实验原理:欧洲分子生物学开放软件系统(Emboss)最初是为英国测序中心用户开发的一个序列分析综合软件包,包括一系列应用程序,例如EST聚类分析、序列模体快速搜索、核算序列模式分析、密码子使用分析、基因识别工具、蛋白质序列模体识别等。Emboss系统可从网址ftp:/ /pub/EMBOSS/获取。 实验内容:1、从上述网站下载最新版Emboss,并参考以下网站所介绍的方法安装:2、熟悉Emboss系统,了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论