基因工程核酸及蛋白分析_第1页
基因工程核酸及蛋白分析_第2页
基因工程核酸及蛋白分析_第3页
基因工程核酸及蛋白分析_第4页
基因工程核酸及蛋白分析_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第二章基因工程制药核酸及蛋白质分析生物技术制药BiotechnologicalPharmaceutics2本节讲解的主要内容1.掌握功能基因组的分析过程2.学会基因的ORF查找以及分析核酸及蛋白质分析有一段核酸片段,或者已知与某些代谢相关的mRNA,如何去分析?5DNAsequenceProteinsequenceProteinstructureProteinfunction基因组序列cDNA序列编码区预测CodonbiasGCContent限制性酶切位点基因结构分析选择性剪切转录调控因子序列比对功能注释KEGGGO系统发育树蛋白质序列翻译蛋白质理化性质二级结构预测结构域分析重要信号位点分析三级结构预测基因组功能分析核酸分析1.获得的序列进行同源性比较(归属物种,哪一类基因)

2.两两或几个比较(找差异,突变位点,保守区)DNAssist,DNAman,BioXM等3.开放阅读框(ORF寻找)

4.序列进化树(进化距离,cDNA/蛋白距离关系)DNAman,MEGA,PAUP等9基因开放阅读框/基因结构分析识别工具ORFFinder

NCBI通用BestORF

Softberry真核GENSCAN

MIT脊椎、拟南芥、玉米GeneFinder

Zhanglab人、小鼠、拟南芥、酵母FGENESH

Softberry真核(基因结构)GeneMark

GIT原核GLIMMER

Maryland原核Fgenes

Softberry人(基因结构)FgeneSV

Softberry病毒Generation

ORNL原核FGENESB

Softberry细菌(基因结构)GenomeScan

MIT脊椎、拟南芥、玉米GeneWise2

EBI人GRAIL

ORNL人、小鼠、拟南芥、果蝇10ORF识别:GENSCAN

结果返回到邮箱(可选)提交序列提交序列文件运行GENSCAN显示氨基酸或CDS序列序列名称(可选)是否显示非最优外显子选择物种类型蛋白质结构预测过程11ORF翻译实验数据蛋白质序列蛋白质理化性质和一级结构数据库搜索结构域匹配已知结构的同源蛋白?三维结构模型可用的折叠模型?同源建模有二级结构预测无串线法有从头预测无12一、蛋白质理化性质分析使用工具:Protparam二、跨膜区分析使用工具:TMpred三、二级结构分析使用工具:PredictProtein四、结构域分析使用工具:InterProScan五、蛋白质三级结构分析使用工具:SWISS-MODEL/SWISS-PdbViewer数据:C:\ZCNI\shixi4\protein.txt蛋白分析内容工具网站备注pldent

利用未知蛋白质的氨基酸组成确认具有相同组成的已知蛋白ComputepI/Mw

计算蛋白质序列的等电点和分子量ProtParam

对氨基酸序列多个物理和化学参数(分子量、等电点、吸光系数等)进行计算PeptideMass

计算相应肽段的pI和分子量SAPS

利用蛋白质序列统计分析方法给出待测蛋白的物理化学信息13蛋白质理化性质分析工具(a)-TypeImembraneprotein(b)-TypeIImembraneprotein(c)-Multipasstransmembraneproteins(d)-Lipidchain-anchoredmembraneproteins(e)-GPI-anchoredmembraneproteins14二、蛋白质跨膜区分析典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成;亲水残基往往出现在疏水残基之间,对功能有重要的作用;15蛋白质跨膜区特性跨膜蛋白序列“边界”原则胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸)胞外-内分界区:Trp(色氨酸)跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸)胞内-外分界区:Tyr(络氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)胞内末端:Lys(赖氨酸)和Arg(精氨酸)1617常用蛋白质跨膜区域分析工具工具网站备注DAS

用DenseAlignmentSurface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOP

由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUI

由Nagoya大学开发一个具有图形显示跨膜区的程序TMAP

基于多序列比对来预测跨膜区的程序TMHMM

基于HMM方法的蛋白质跨膜区预测工具TMpred

基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPred

是一个位于法国的蛋白质拓扑结构预测程序18三、蛋白质二级结构预测

基本的二级结构α螺旋,β折叠,β转角,无规则卷曲(coils)以及模序(motif)等蛋白质局部结构组件

分析方法:基于统计和机器学习方法进行预测Chou-Fasman算法PHD算法多序列列线预测基于神经网络的序列预测基于已有知识的预测方法(knowledgebasedmethod)混合方法(hybridsystemmethod)19工具网站备注BCMSearchLauncher

包括了常见的蛋白质结构分析程序入口,一般分析可以以此服务器作为起点HNN

基于神经网络的分析工具,含序列到结构过程和结构到结构处理Jpred

基于Jnet神经网络的分析程序,并采用PSI-BLAST来构建序列Profile进行预测,对于序列较短、结构单一的蛋白预测较好nnPredict

预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺旋NNSSP

基于双层前反馈神经网络为算法,还考虑到蛋白质结构分类信息PREDATOR

预测时考虑了氨基酸残基间的氢键蛋白质二级结构分析工具工具网站备注PredictProtein

提供多项蛋白质性质分析,并有较好准确性Prof

基于多重序列比对预测工具PSIpred

提供跨膜蛋白拓扑结构预测和蛋白profile折叠结构识别工具SOPMA

可以比较各种分析方法得到的结果,也可输出

“一致性结果”SSPRED

基于数据库搜索相似蛋白并构建多重序列比对20蛋白质二级结构分析工具(续)21四、结构域分析结构域是蛋白序列的功能、结构和进化单元分析方法序列比对单条蛋白质序列可以包含一个或多个结构域基本类型:

22α折叠β折叠α/β折叠α+β折叠23工具网站备注CDD

通过比较目标序列和一组位置特异性打分矩阵进行RPS-BLAST来确定目标序列中的保守结构域HAMAP

通过专家预测系统产生的微生物家族同源蛋白数据InterPro

蛋白质家族、结构域和功能位点的联合资源数据库,整合了多个数据库和工具的结果,并提供相应的链接Pfam

每个蛋白家族包含了多序列比对、profile-HMMs和注释文件ProDom

从SWISS-PROT/TrEMBL数据库中的非片段蛋白序列数据构成,每条记录包含一个同源结构域多重比对和家族保守一致性序列SMART

由EMBL建立,集成了大部分已知蛋白功能域数据,注释包括了功能类型、三维结构、分类信息蛋白质结构域数据库24工具网站备注TIGRFAMs

由TIGR实验室维护的蛋白质家族和结构域数据库PRINTS

蛋白质模体指纹数据库,提供了FingerPRINTScan、FPScan和GRAPHScan等指纹识别工具DOMO

同源蛋白结构域家族数据库,有多个镜像网站BLOCKS

收录了通过高度保守蛋白区域比对出的无空位片段eMOTIF

由斯坦福大学维护。从BLOCKS+数据库和PRINTS数据库中收集了生物功能高度保守的高特异性蛋白序列蛋白质结构域数据库(续)25五、蛋白质三维结构预测方法特点工具同源建模法(parativemodelling)基于序列同源比对,对于序列相似度>30%的序列模拟比较有效,最常用的方法SWISS-MODEL,CPHmodels

串线法/折叠识别法

(Threading/Foldrecognition)“穿”入已知的各种蛋白质折叠骨架内,适于对蛋白质核心结构进行预测,计算量大THREADER,3D-PSSM从头预测法(Abinitio/Denovomethods)基于分子动力学,寻找能量最低的构象,计算量大,只能做小分子预测HMMSTR/ROSSETA26蛋白质结构预测精度27常用数据库数据库网站备注PDB

主要的蛋白质三维结构数据库MMDB

NCBI维护的蛋白质结构数据库Psdb

从PDB和NRL-3D数据库中衍生出的数据库,含二级结构和三维结构信息3DinSight

整合了结构、性质(氨基酸组成、热力学参数等)、生物学功能(突变点,相互作用等)的综合数据库,FSSP

根据结构比对的蛋白质结构分类数据库SCOP

蛋白质结构分类数据库,将已知结构蛋白进行有层次地分类CATH

另一个有名的蛋白质结构和结构域主要结构分类库MODBASE

用同源比对法生成的模型结构数据库EnzymeStructure

从PDB数据库中整理已知结构的酶蛋白数据库HSSP

根据同源性到处的蛋白质结构数据库28模板搜索与比对工具网站备注PSI-BLAST

位置特异性叠代BLAST,可用来搜索远源家族序列FASTA3

位于EBI的序列比对工具SSEARCH

采用Smith/Waterman法来进行序列比对ClustalW

多序列比对工具,位于EBIT-Coffee

用多种方法(如ClustalW、DIalign等)来构建多序列比对Multalin

一个老牌的多序列比对工具Dali

三维结构比对网络服务器VAST

基于向量并列分析算法的三维结构比对工具SAM-T99

用HMM法搜索蛋白质远源同源序列29同源建模法工具网站备注SWISS-MODEL

完整建模程序,采用同源性鉴定来确定模板蛋白,用户也可以自定义模板进行分析CPHmodels

基于神经网络的同源建模工具,用户只需提交序列,无高级选项EsyPred3D

采用神经网络来提高同源建模准确性的预测工具3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论