模块六生物信息学_第1页
模块六生物信息学_第2页
模块六生物信息学_第3页
模块六生物信息学_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、模块六 生物信息学1. 实验目的通过对生物信息数据库的讲授,使学生能够理解掌握生物信息学基本概念、原理以及方法。要求学生在完成本章的学习和实验后,能够理解能够独立应用生物信息学的一些工具软件进行初步的生物信息分析。使学生能独立地对生物数据进行分析和处理应用,掌握数据库的种类、功能,文献查找方法,序列比对和Primer Primier 5设计引物的方法。2. 实验内容(1)分子生物学数据库:GeneBank;EMBL;DDBJ;PubMed,了解数据库中常用的数据、工具。(2)序列比对:利用ClastW对相似序列进行同源性比对分析(3)相似序列的数据库搜索:Blastn;Blastp;Blast

2、x;tBlastn(4)生物信息学单机软件介绍:Primer Primier 53. 实验步骤(1)数据库介绍核酸序列是了解生物体结构、功能、发育和进化的出发点。国际上权威的核酸序列数据库有三个,分别是美国生物技术信息中心( NCBI ) 的GenBank/Web/Genbank/index.html),欧洲分子生物学实验室的EMBL-Bank(简称EMBL,http:/www.ebi.ac.uk/embl/index.html),日本遗传研究所的DDBJ(http:/www.ddbj.nig.ac.jp/)。三个组织相互合作,各数据库中的数

3、据基本一致,仅在数据格式上有所差别,对于特定的查询,三个数据库的响应结果一样。这三个数据库是综合性的DNA 和RNA序列数据库,其数据来源于众多的研究机构和核酸测序小组,来源于科学文献。用户可以通过各种方式将核酸序列数据提交给这三个数据库系统。数据库中的每条记录代表一个单独、连续、附有注释的DNA 或RNA片段。孟德尔人类遗传(OMIM),三维蛋白质结构的分子模型数据库(MMDB),唯一人类基因序列集合(UniGene),人类基因组基因图谱,分类学浏览器,同国立癌症研究所合作的癌症基因组剖析计划(CGAP)。Entrez是NCBI的为用户提供整合的访问序列,定位,分类和结构数据的搜索和检索系统

4、。Entrez同时也提供序列和染色体图谱的图形视图。Entrez是一个用以整合NCBI数据库中信息的搜寻和检索工具。这些数据库包括核酸序列,蛋白序列,大分子结构,全基因组,和通过PubMed检索的MEDLINE。Entrez的一个强大和独特的特点是检索相关的序列,结构和参考文献的能力。杂志文献通过PubMed获得,PubMed是一个网络搜索界面,可以提供对在MEDLINE上的九百万杂志引用的访问,包含了链接到参与的出版商网络站点的全文文章。 BLAST是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。NCB

5、I提供的附加的软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。所有的NCBI数据库和软件工具可以从WWW或FTP来获得。NCBI还有E-mail服务器,提供用文本搜索或序列相似搜索访问数据库一种可选方法。dbEST:EST来源于mRNA,基因长度(300-400bp,数据长度足以分析编码的产物)或者全基因(已知),5端或3端的cDNA序列(EST),300-400bp single-pass sequence (可能有误,如果要求2kb)。dbSNP:每100-300bp有一个SNP。EPD(Eukaryotic Promoter

6、Database):启动子数据库。(2)搜索感兴趣的基因窗体顶端Search for 窗体底端(3)选取不同来源的碱基序列进行比对分析利用ClastW对相似序列进行同源性比对分析,将基因序列以文本格式保存,每条基因前用“”号加上基因标识表示。将该文本文件传至ClastW中进行同源性分析。找到保守性高的部分序列,利用Primer Primier Blastp:氨基酸序列检索蛋白质库。将待查询的蛋白质序列及其互补序列一起对蛋白质序列数据库进行查询;Blastn:核苷酸序列检索核苷酸库。将待查询的核酸序列及其互补序列一起对核酸序列数据库进行查询;Blastx:核苷酸序列,氨基酸序列,蛋白质库。先将待

7、查询的核酸序列按6种可读框架(逐个向前3个碱基和逐个向后3个碱基读码)翻译成蛋白质序列,然后将翻译结果对蛋白质序列数据库进行查询;tBlastn:先将核酸序列数据库中的核酸序列按6种可读框架翻译成蛋白质序列,然后将待查询的蛋白质序列及其互补序列对其翻译结果进行查询;tBlastx:先将待查询的核酸序列和核酸序列数据库中的核酸序列按6种可读框架翻译成蛋白质序列,然后再将2种翻译结果从蛋白质水平进行查询。(4)软件进行引物设计。引物设计:运行 Primer Primier 5,将保守性高的序列导入软件中,进行条件设定,运行程序,检查引物的可行性,生成报告单。本实验为设计性实验,要求学生学习生物信息

8、数据库及生物软件后,能够在数据库中查找感兴趣的基因;利用提供的序列进行同源性比对后,找到保守序列区,运用Primer Primier5软件设计引物。引物设计的原则:引物与模板的序列要紧密互补;引物与引物之间避免形成稳定的二聚体或发夹结构;引物不能在模板的非目的位点引发DNA聚合反应(即错配)。引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74,不适于Taq DNA聚合酶进行反应。引物所对应模板位置序列的Tm值在72左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm4(G+C)2(A+T),在Oligo软件中使用的是最邻近法(th

9、e nearest neighbor method)。Tm值:50的引物和互补序列表现为双链DNA分子时的温度。引物序列在模板内应当没有相似性较高,尤其是3端相似性较高的序列,否则容易导致错配。引物3端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。引物3端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3端使用碱基A。引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。5端序列对PCR影响不太大,因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论