生物信息学实验指导书-新版本_第1页
生物信息学实验指导书-新版本_第2页
生物信息学实验指导书-新版本_第3页
生物信息学实验指导书-新版本_第4页
生物信息学实验指导书-新版本_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生 物 信 息 学实 验 指 导 书重庆邮电大学生物信息学实验指导书生物信息教学部 谭军 编重庆邮电大学生物信息学院前言 生物信息学是上世纪90年代初人类基因组计划(HGP)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。本实验指导书中的8个实验均设

2、计为综合性开发实验,面向生物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。限选生物信息学及实验的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。实验一 熟悉生物信息学网站及其数据的生物学意义实验目的:培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了

3、解不同的数据文件格式和其中重要的生物学意义。实验原理:利用互联网资源检索相关的国内外生物信息学相关网站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因组研究所、北大生物信息学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathway等数据,理解其重要的生物学意义。实验内容:1. 浏览和搜索至少10个国外和至少5个国内生物信息学相关网站,并描述网站特征;2. 下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;3. 讨论各网站适合做何种生物信息学研究的平台,并设计一个研究设想。实验报告:1. 各网

4、站网址及特征描述;2. 代表性数据的下载和生物学意义的描述;3. 讨论:这些生物信息学相关网站的信息资源,可以被那些生物信息学研究所利用。参考书目: 生物信息学概论 罗静初 等译, 北京大学出版社, 2002; 生物信息学手册 郝柏林 等著, 上海科技出版社, 2004; 生物信息学实验指导 胡松年 等著, 浙江大学出版社, 2003。实验二 利用BLAST进行序列比对实验目的:了解BLAST及其子程序的原理和基本参数,熟练地应用网络平台和Linux计算平台进行本地BLAST序列比对,熟悉BLAST结果的格式和内容并能描述其主要意义,同时比较网上平台和本地平台的优缺点。实验原理:利用实验一下载

5、的核算和蛋白质序列,提交到NCBI或者其他拥有BLAST运算平台的网页上,观察其基本参数设定库文件类型,并得到计算结果;同时在本地服务器上学会用formatdb格式化库文件,并输入BLAST命令进行计算,获得结果文件。实验内容:1. 向网上BLAST服务器提交序列,得到匹配结果;2. 本地使用BLAST,格式化库文件,输入命令行得到匹配结果;3. 对结果文件进行简要描述,阐述生物学意义。实验报告:1. 阐述BLAST原理和比对步骤;2. 不同类型BLAST的结果及其说明;3. 讨论:不同平台运行BLAST的需求比较。参考书目: 生物信息学概论 罗静初 等译, 北京大学出版社, 2002; 生物

6、信息学实验指导 胡松年 等著, 浙江大学出版社, 2003; /Education/BLASTinfo/information3.html。实验三 利用ClustalX(W)进行多序列联配实验目的:掌握用Clustal X(W)工具及其基本参数,对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析,由此对这些物种的亲缘关系进行判断,并且对这些序列在分子进化过程中的保守性做出估计。实验原理:首先对于输入的每一条序列,两两之间进行联配,总共进行n*(n-1)/2次联配,这一步通过一种快速的近似算法实现,其得分用来计算指导树,系统树图能用于

7、指导后面进行的多序列联配的过程。系统树图是通过UPGMA方法计算的。在系统树图绘制完以后,输入的所有序列按照得分高低被分成n-1个组,然后再对组与组之间进行联配,这一步用Myers和Miller算法实现。实验内容:1. 明确软件所支持的输入文件格式,搜集整理出合适的数据;2. 在Windows环境运行Clustal X,在Linux环境运行Clustal W;3. 实验结果及分析,用TREEV32或Njplotwin95生成NJ聚类图。实验报告:1. 整理好的符合Clustal的序列数据;2. 提交数据网页记录和各步骤记录;3. 提供聚类图和多序列联配图,并说明意义。参考书目: 生物信息学概论

8、 罗静初 等译, 北京大学出版社, 2002; 生物信息学实验指导 胡松年 等著, 浙江大学出版社, 2003。实验四 ESTS分析实验目的:熟悉使用一系列生物信息学分析工具对测序得到ESTs序列数据进行聚类处理,由此对获得表达基因的丰度等相关信息,并且对这些表达基因进行功能的初步诠释,为后续实验通过设计RACE引物获得全长基因,以及进一步的功能注释和代谢途径分析做好准备。实验原理:首先用crossmatch程序去除ESTs原始序列中的载体成分和引物成分,然后用phrap生成congtig和singlet,用blast程序进一步将有同源性的contig和singlet进行功能聚类,最后通过bl

9、ast对聚类获得的cluster进行功能注释。在实验过程中将用到一些本实验室写好的perl程序用于连接各数据库和工具软件。实验内容:1. 运行CodonCode Aligner程序,并用它建立工程文件,导入例子文件夹里面的数据;练习对序列的各种查看方式。2. 使用CodonCode Aligner程序里的Clip Ends, Trim Vector, Assemble等功能,完成序列的剪切、去杂质、组装工作。实验报告:1. 实验各步骤记录和中间结果文件;2. 举例简要说明结果文件中数据的生物学意义。参考书目: 生物信息学概论 罗静初 等译, 北京大学出版社, 2002; 基因表达序列标签(ES

10、T)数据分析手册 胡松年 等著, 浙江大学出版社, 2005。实验五 利用Primer Premier5.0设计RACE引物实验目的:熟悉PCR引物设计工具Primer Premier5.0的一些基本功能,能够根据实验需要选择相应的引物设计方法设计PCR引物。实验原理:PCR实验是当代分子生物学的基本实验之一,由于目标序列和实验目的的不同,相应设计引物的要求也不一样。本实验延续ESTs分析结果,对于其中需要获得全长的基因进行RACE引物的设计,及5和3RACE引物,配合接头序列设计单向引物,并模拟练习通过连接获得全长的基因CDS序列。最后设计已知全长基因序列的PCR扩增引物。实验内容:1. 从

11、网站下载并安装Primer Premier5.0;2. 从 GenBank 中任意获取一个 DNA 序列,设计出该序列的合适引物;实验报告:1. 实验各步骤使用的数据、运算平台、结果文件记录;2. 比较不同引物设计平台和不同PCR实验的差别;参考书目: 生物信息学概论 罗静初 等译, 北京大学出版社, 2002; 生物信息学实验指导 胡松年 等著, 浙江大学出版社, 2003 /cgi-bin/primer3/primer3_www.cgi。实验六 ORF预测实验目的:了解ORF预测的作用,能够运用NCBI提供的在线分析服务ORF Finder,并能

12、用它进行开放阅读框简单的分析。实验原理:通过序列的ORF预测,为建立cDNA文库,差减杂交得到均质化文库,cDNA序列测定,生物信息学分析,同源性比较,功能预测做必要的准备。实验内容:1. 从/projects/gorf/访问 ORF Finder服务;2. 熟悉ORF Finder的界面、输入文件的格式、以及相关参数的作用等;3. 利用ORF Finder进行简单的分析,记录分析步骤和结果。实验报告:1. 阐述实验步骤、简介ORF Finder的功能;2. 记录实例分析结果(包含输出的图形化结果),并对结果进行一定解释,记录实验中出现的问题

13、和解决方案;3. 讨论:ORF实验的意义,对实验做出总结。参考书目: 生物信息学概论 罗静初 等译, 北京大学出版社, 2002; 生物信息学手册 郝柏林 等著, 上海科技出版社, 2004; 生物信息学实验指导 胡松年 等著, 浙江大学出版社, 2003;http/bioweb.pasteur.fr/seqanal/interfaces/getorf.html。实验七 蛋白质结构功能分析实验目的:掌握蛋白质一级、二级和三级结构分析的一些工具,了解与蛋白质功能分析相关的数据库,如:SwissProt蛋白质序列数据库、PDB结构数据库等。实验原理:现有的蛋白质功能分析工具和平台都是根据已知的蛋白

14、质结构进行注释分析、总结结构规律建立参考数据库,并以此作为预测未知蛋白质结构和功能的依据。实验内容:1. 熟悉与蛋白质分析相关的数据库资源,如SwissProt蛋白质序列数据库、PDB结构数据库、PROSITE;2. 利用PredictProtein对蛋白质序列进行分析;3. 利用swiss-model对蛋白质序列进行三维结构预测。实验报告:1. 阐述实验步骤;2. 记录实验结果;3. 对实验进行总结。参考书目: 生物信息学概论 罗静初 等译, 北京大学出版社, 2002; 生物信息学实验指导 胡松年 等著, 浙江大学出版社, 2003; http:/www.embl-heidelberg.d

15、e/predictprotein/predictprotein.html;/swissmod/swiss-model.html。实验八 perl程序的安装、编写、调试实验目的:培养学生能在windows和Linux两种平台安装perl解释器、编写perl程序以及debug和运行的能力,熟悉perl语言基本语法,学会熟练编写和运用perl程序进行基础生物信息学研究。实验原理:Perl语言是一门通用的脚本语言,具有强大的字符串处理功能,是生物信息学研究的强大帮手,学会了perl语言,就能方便地处理生物信息学研究中遇到的各种字符串文本,促进研究的快速进行。实验内容:1. 下载perl程序在Windows和Linu

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论