生物信息学软件技巧市公开课一等奖百校联赛特等奖课件_第1页
生物信息学软件技巧市公开课一等奖百校联赛特等奖课件_第2页
生物信息学软件技巧市公开课一等奖百校联赛特等奖课件_第3页
生物信息学软件技巧市公开课一等奖百校联赛特等奖课件_第4页
生物信息学软件技巧市公开课一等奖百校联赛特等奖课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学软件及使用技巧第1页内容概要一.生物信息学概念二.生物信息学软件主要功效介绍分析和处理试验数据和公共数据,加紧研究进度,缩短科研时间提醒、指导、替换试验操作,利用对试验数据分析所得结论设计下一阶段试验用计算机管理试验数据寻找、预测新基因及预测其结构、功效蛋白高级结构预测第2页生物学软件部分常见功效使用技巧PCR引物设计DNA、蛋白质序列同源分析及进化树构建ContigExpress----DNA序列片断拼接DNA模拟电泳主要生物数据库介绍生物信息学服务第3页一.生物信息学概念第4页生物信息学概念:

生物信息学是一门新兴交叉学科,它将数学和计算机知识应用于生物学,以获取、加工、存放、分类、检索与分析生物大分子信息,从而了解这些信息生物学意义。第5页二.生物信息学软件主要功效介绍第6页生物信息学软件主要功效分析和处理试验数据和公共数据,加紧研究进度,缩短科研时间提醒、指导、替换试验操作,利用对试验数据分析所得结论设计下一阶段试验试验数据自动化管理寻找、预测新基因及其结构、功效蛋白质高级结构及功效预测(三维建模,当前研究焦点和难点)第7页功效1.分析和处理试验数据和公共数据,加紧研究进度,缩短科研时间核酸:序列同源性比较,分子进化树构建,结构信息分析,包含基元(Motif)、酶切点、重复片断、碱基组成和分布、开放阅读框(ORF),蛋白编码区(CDS)及外显子预测、RNA二级结构预测、DNA片段拼接蛋白:序列同源性比较,结构信息分析(包含Motif,限制酶切点,内部重复序列查找,氨基酸残基组成及其亲水性及疏水性分析),等电点及二级结构预测等等当地序列与公共序列联接,结果扩大第8页网上数据库利用(结果扩大)IRACE(基因拉长功效)BLAST同源序列检索ENTREZSYSTEM(集成信息检索系统)第9页ENTREZ集成检索示意图第10页VectorNTISuit同源比较—主窗口第11页VectorNTISuit同源比较—进化树第12页Antheprot5.0DotPlot点阵图第13页PeptoolLite---DotPlot点阵图第14页DNASIS2.5蛋白二级结构预测第15页DNASIS2.5RNA二级结构预测第16页DNASIS2.5tRNA二级结构预测第17页RNAStructure3.5RNA二结构预测第18页Omiga2.0ORFMap第19页DnaStar之Protean对氨基酸亲疏水性

分析:helicalwheel图第20页功效2.提醒、指导、替换试验操作,利用对试验数据分析所得结论设计下一阶段试验

用软件设计PCR引物,测序引物或杂交探针,设计克隆策略,构建载体,做模拟电泳试验,即模拟核酸内切酶或内肽酶对对应底物分子切割后电泳行为。蛋白跨膜区域分析,信号肽潜在断裂点预测。第21页VectorNTISuit5.5模拟电泳第22页GeneConstructionKit2.0模拟电泳第23页Winplas2.6质粒构建第24页OLIGO5.0PCR引物设计第25页Atheprot5.0预测蛋白跨膜区域第26页Antheprot5.0预测信号肽断裂点第27页功效3.用计算机管理试验室数据及文件资料试验室结果储存,管理和申报工作从网络数据库取得序列文件(由ENTREZ集成检索系统所得数据文件能够进入EndNote或者ReferenceManager储存管理)或资料文件管理软件:EndNote,ReferenceManager第28页ReferenceManager9界面第29页功效4.用计算机预测新基因及其结构和功效对CDS(CodingSequence)蛋白编码区预测准确率已到达90%以上对整个基因结构预测存在一定难度

PWM(位置权重矩阵)算法 由物化原理技术开发,侧重于找基因表示系统和核酸相互作用位点。给信号序列各个位置每种可能出现核苷酸分配一个分数,将各位置分数相加后得出该序列作为潜在作用位点分数。第30页DNASIS2.5对蛋白编码区预测

A.(CodonBias)第31页DNASIS2.5对蛋白编码区预测

B.(RareCodon)第32页DNASIS2.5对蛋白编码区预测

C.(ORFList)第33页DNASTAR之GeneQuest预测CDS第34页功效5.蛋白高级结构预测该项技术算法十分复杂,还未成熟。PDB及MMDB数据库当前依然禁止收录软件预测出来蛋白高级结构模型。X射线晶体学技术和多维核磁共振技术是当前人们认识蛋白高级结构主要伎俩,但两种技术都有不足之处。前者要求必需得到高标准蛋白晶体,后者对分子量大于3万大蛋白不能测定。所以理论模拟和结构预测显得十分主要。序列与结构关系根源在于“蛋白质折叠问题”,这是近期研究关注焦点。第35页当前应用蛋白质结构预测算法同源预测(一级结构决定高级结构)结构与结构相对比(DALI算法)当前最先进结构预测方法: 结构类识别(foldrecognition)先建立一个已知结构类数据库(foldlibrary),将待测序列“穿过”该数据库组成座标,并依据事先确定物理限制,逐一位置移动(threading,sequence-structurealignment),并用一个函数(sequence-structurefitnessalignment)判断序列与结构类符合程度,找出未知序列在目标结构上能量最优和构象最稳固比对位置。对计算机要求很高。第36页Cn3D2.5显示1EQFA链三维结构第37页RasMol2.7显示1EQFA链三维结构第38页PDB与MMDB结构图比较第39页三.生物学软件部分常见功效

使用技巧第40页PCR引物设计第41页引物设计标准

首先引物要跟模板紧密结合,其次引物与引物之间不能有稳定二聚体或发夹结构存在,最终引物不能在别非目标位点引发高效DNA聚合反应(即错配)。第42页围绕这几条基本标准,设计引物需要考虑很多原因,如引物长度(primerlength),产物长度(productlength),序列Tm值

(meltingtemperature),ΔG值(internalstability),引物二聚体及发夹结构(duplexformationandhairpin),错误引发位点(falseprimingsite),引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。第43页引物设计关键点普通引物长度为16-23bp,惯用长度为18-21bp,过长或过短都不适当。引物3’端碱基普通不用A,因为A在错误引发位点引发效率相对比较高,而其它三种碱基错误引发效率相对小一些。引物GC含量普通为45-55%,过高或过低都不利于引发反应。上下游引物GC含量不能相差太大。引物所对应模板序列Tm值最好在72℃左右,当然因为模板序列本身组成决定其Tm值可能偏低或偏高,可依据详细情况灵活利用。

第44页ΔG值反应了引物与模板结合强弱程度,也是一个主要引物评价指标,普通情况下,在Oligo5.0软件ΔG值窗口中,引物ΔG值最好呈正弦曲线形状,即5’端和中间部分ΔG值较高,而3’端ΔG值相对较低,且不要超出9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可预防错误引发。分析其原理,引物与模板应含有较高结合能量,这么有利于引物与模板序列整合,所以5’端与中间段ΔG值应较高,而3’端ΔG值影响DNA聚合酶对模板DNA解链,过高则不利于这一步骤。第45页可能错误引发位点决定于引物序列组成与模板序列组成相同性,相同性高则错误引发率高,错误引发引发率普通不要高过100,最好没有错误引发位点,如此能够确保不出非目标产物假带。引物二聚体及发夹结构能量普通不要超出4.5,不然轻易产生引物二聚体带而且会降低引物浓度从而造成PCR正常反应不能进行。对引物修饰普通是增加酶切位点,应参考载体限制酶识别序列确定,经常对上下游引物修饰序列选取不一样限制酶识别序列,以有利于以后工作。

第46页关于引物自动搜索和评价分析推荐使用自动搜索软件:PrimerPremier5.0推荐使用引物评价软件:Oligo5/6实际操作示例>>>>>第47页DNA、蛋白质序列同源分析及

进化树构建第48页相同性与同源性相同性是指一个很直接数量关系,比如部分相同或相同百分比或其它一些适当度量。可进行本身局部比较。 如DotPlot(点阵序列比较)同源性指从一些数据中推断出两个基因或蛋白质序列具而共同祖先结论,属于质判断。 如Alignment(同源性分析)第49页推荐软件相同性分析

PeptoolLite同源性分析VectorNTISuit6---AlignX实际操作示例>>>>>第50页Contig

Express----DNA序列

片断拼接第51页推荐软件DNA序列片断拼接VectorNTISuit6---ContigExpressProject实际操作示例>>>>>第52页DNA模拟电泳第53页一点体会DNA模拟电泳含有一定试验预示功效,模拟电泳不能作为试验结果或依据实际操作示例>>>>>第54页主要生物数据库介绍第55页三大数据库NCBI(美国)DDBJ(日本)http://www.ddbj.nig.ac.jpEBI(欧洲)http://www.ebi.ac.uk/index.html第56页其它主要数据库酵母基因组数据库(SGD)酵母蛋白质数据库(YPD)拟南芥数据库(AtDB)医学数据库(OMIM)线虫数据库(ACEDB)第57页四.生物信息学服务第58页服务内容PCR引物、测序引物及杂交探针设计及评价

DNA,蛋白质序列同源分析及进化树构建

生物大分子二级结构模拟显示及基本序列分析第59页相关蛋白质亲疏水性,等电点,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论