蛋白质序列分析专家讲座_第1页
蛋白质序列分析专家讲座_第2页
蛋白质序列分析专家讲座_第3页
蛋白质序列分析专家讲座_第4页
蛋白质序列分析专家讲座_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学bioinformatics生物科学学院生物工程教研室蛋白质序列分析Analysisofproteinsequence生物工程教研室孙继政蛋白质序列分析专家讲座第1页经过预测蛋白质结构、功效特征分析,可为我们研究提供指导信息蛋白质序列分析专家讲座第2页8.1温故而知新Single-&three-letteraminoacidcodesGGlycine Gly PProline Pro A Alanine Ala VValine ValL Leucine Leu IIsoleucine IleMMethionine Met CCysteine CysFPhenylalanine Phe YTyrosine TyrWTryptophan Trp HHistidine HisKLysine Lys RArginine ArgQGlutamine Gln NAsparagine AsnEGlutamicAcid Glu DAsparticAcidAspSSerine Ser TThreonine ThrAdditionalcodesBAsn/Asp ZGln/Glu XAnyaminoacid蛋白质组成蛋白质序列分析专家讲座第3页蛋白质序列分析专家讲座第4页PrimarystructurethelinearsequenceofaminoacidsinaproteinSecondarystructureregionsoflocalregularityi.e.,

a-helices,b-strands,-sheets&-turns蛋白质结构层次蛋白质序列分析专家讲座第5页TertiarystructuretheoverallchainfoldthatresultsfrompackingofsecondarystructureelementsSuper-secondarystructurethepackingofsecondarystructureelementsintostableunitse.g.,b-barrels,babunits,Greekkeys,etc..蛋白质序列分析专家讲座第6页Quaternarystructurethearrangementofseparatechainswithinaproteinthathasmorethanonesubunit

e.g.,haemoglobin蛋白质序列分析专家讲座第7页多肽链在二级结构或超二级结构基础上形成三级结构局部折叠区是相对独立紧密球状实体,被称作结构域(domain)。结构域(domain)蛋白质序列分析专家讲座第8页在蛋白质中有些区域对于维持蛋白质结构和功效含有至关主要作用,进化过程中改变非常迟缓,这么区域称作蛋白质关键区域(coreregion)。关键区域(coreregion)结构与功效蛋白质序列分析专家讲座第9页蛋白质结构主要位点一些氨基酸残基对于一些结构稳定具相关键作用,这么关键角色在蛋白质中显得尤为主要,蛋白质序列分析专家讲座第10页8.2蛋白质序列同源分析同源蛋白:生物大分子序列是分子进化产物,从共同祖先序列进化而来蛋白质通常称为同源蛋白蛋白质同源分析:基于检测同源蛋白从而外推得到某特定蛋白一些特性方法称为蛋白质同源分析常有软件有:BLAST等PSI-BLAST和隐马尔可夫模型(HMMs)PSI-BLAST(迭代搜索)把查找到每一击中项作为第二次迭代查询序列得到更多进化关系,第二次及以后迭代不是对第一次输出每一序列执行BLAST,而是全部击中项形成序列轮廓(家族保守序列)进行BLAST搜索,查到收敛为止。蛋白质序列分析专家讲座第11页蛋白质同源分析进行蛋白质功效或结构预测依然存在困难相同与同源问题直系与旁系同源计算机程序自动生成功效注释不少是错误有序列会彼此相同,却不是进化关系或生物功效相近缘故蛋白质序列分析专家讲座第12页8.3蛋白质序列结构域及结合位点分析蛋白质进化过程并不都是从头开始,而是利用现有材料,经过改造,使其产生新功效,或者是把几个不一样系统整合到一起,形成更加好新系统。而这些现有材料,就是蛋白质序列中“模块”,他们对应蛋白质分子中主要结构或功效区域。这些区域在蛋白质家族中通常是保守。蛋白质序列分析专家讲座第13页①蛋白质序列二级数据库同一蛋白家族多序列联配能够用来推断结构、功效和家族关键氨基酸残基主要信息。所以,将蛋白质多序列联配结果储存在数据库存放就显得尤为主要了,存放这些信息数据库称为蛋白质二级数据库。经过对二级数据库中序列比对搜索,能够把一条新蛋白质序列分配到蛋白质家族中,从而预测蛋白质功效。保守残基出现原因是:维持某种功效或特定结构蛋白质序列分析专家讲座第14页多序列联配信息表示方法有很各种,包含联配本身、一致序列、保守残基和残基模式、序列轮廓和其它序列家族概率模型。Prosite数据库:基于多序列比较得到单一保守序列片段,或称序列模体Prints(蛋白质序列指纹图谱数据库)Blocks(蛋白质序列模块数据库)Profiles(序列概貌数据库)Pfam(蛋白质序列家族数据库)采取了隐马尔可夫模型Identify(蛋白质序列识别数据库)序列中多重保守片段蛋白质序列分析专家讲座第15页它们共同特点是都基于多序列比对,不一样之处是处理比对结果标准和方法各有特色蛋白质序列分析专家讲座第16页②蛋白质模式(proteinpatterin)数据库Prosite数据库:是第一个蛋白质序列二次数据库基于对蛋白质家族中同源序列多序列比对得到保守性区域,与生物学功效相关,酶活性位点、配体或金属结合位点等。它实际上是蛋白质序列功效位点数据库。可用来判断该序列包含什么样功效位点,从而推测其可能属于哪一个蛋白质家族。Prosite序列描述模式能够由正则文法描述。比如与丝氨酸蛋白酶家族相关两个序列模式以下:一类是提交一条未知蛋白质序列,经过搜索给出对应序列模式,一类是输入一个序列模式,针对特定数据库,如SwissProt、TrEMBL、PDB等,给出符合该序列模式蛋白质序列条目蛋白质序列分析专家讲座第17页蛋白质序列分析专家讲座第18页蛋白质序列分析专家讲座第19页蛋白质序列分析专家讲座第20页蛋白质序列分析专家讲座第21页给出关键功效机制相关少数几个主要残基,对于发觉远距离同源较有优势,不过有假阳性,指出了序列上特定位置处可能出现残基,但并没有对出现概率给予描述。蛋白质序列分析专家讲座第22页PRINTS和BLOCKS非常类似,都以一组无空位肽段来表示蛋白质家族,这些无空位肽段是经过对一组蛋白或蛋白质家族高保守区进行多序列联配而得。无空位片段在BLOCKS中称为blocks,在PRINTS中称为motifs(模体),在PRINTS中,代表一个蛋白质家族一组motifs被称为fingerprint(指纹),PRINTS和BLOCKShttp://www.bioinf.man.ac.uk/dbbrowser/PRINTS/

蛋白质序列分析专家讲座第23页蛋白质序列分析专家讲座第24页蛋白质序列分析专家讲座第25页/blocks/

蛋白质序列分析专家讲座第26页蛋白质序列分析专家讲座第27页PRINTS/BLOCKS库中motifs或blocks能够比Prosite序列模式覆盖更大序列区域,而且motifs/blocks在序列匹配中通常会考虑氨基酸替换矩阵问题。因而更为敏感(找出更多远距离关系)和愈加特异(出现更少假阳性)。蛋白质序列分析专家讲座第28页③蛋白质结构域与家族(proteindomainfamilies)

蛋白质结构域(proteindomain):必须是一个独立单元。是蛋白质中结构紧密(compact)、半独立单元(semi-independent)在三维结构上展现几何独立部分;是蛋白质三维结构中可自折叠稳定单元(stableunit),是可独立于序列剩下部分而折叠为特定三维结构那部分序列;是可重现功效和进化模块,是可定义单一明确功效部分蛋白质序列蛋白质序列分析专家讲座第29页这些模块化结构很可能反应了蛋白质进化方式。遗传事件能够造成结构域交换、结构域复制、结构域丢失和取得等。得到有特定功效新结构域可以使蛋白质非常快速地取得更加复杂新功效。蛋白质序列分析专家讲座第30页ProDom是一个蛋白质结构域家族数据库,它采取基于递归PSI-BLAST比对搜索算法基于SwissProt和TrEMBL蛋白质序列数据库自动构建产生蛋白质序列分析专家讲座第31页蛋白质序列分析专家讲座第32页蛋白质序列分析专家讲座第33页蛋白质序列分析专家讲座第34页sequenceprofiles和Prositeprofile

序列谱(sequenceprofiles)提供了一个方法,用来描述来自同一蛋白质结构域家族相关序列。它描述了观察到每个氨基酸可能性,以及在序列中每个位点处插入和缺失可能性蛋白质序列分析专家讲座第35页蛋白质序列分析专家讲座第36页蛋白质序列分析专家讲座第37页蛋白质序列分析专家讲座第38页蛋白质序列分析专家讲座第39页蛋白质序列分析专家讲座第40页HiddenMarkovmodels和Pfam

隐马尔可夫模型(HiddenMarkovmodels,HMMs)是描述蛋白质结构域家族序列最精细统计学方法蛋白质序列分析专家讲座第41页蛋白质序列分析专家讲座第42页蛋白质序列分析专家讲座第43页蛋白质序列分析专家讲座第44页④InterProScan综合分析当前已经出现了整合蛋白质结构功效域二级数据库综合性数据库及其搜索系统,如SMART、HITS(集成Prositepattern、Prositeprofile和pfam)和InterPro等。这里主要对InterPro做一个简单介绍。蛋白质序列分析专家讲座第45页蛋白质序列分析专家讲座第46页蛋白质序列分析专家讲座第47页8.4蛋白质序列理化性质分析蛋白质理化性质分析通常包含:蛋白质分子量、等电点(pI)、氨基酸组成、疏水性和亲水性分析等蛋白质序列分析专家讲座第48页①ComputepI/Mw蛋白质序列分析专家讲座第49页②ANTHEPROT

ANTHEPROT能够计算给出蛋白质序列氨基酸组成、疏水区、亲水区、跨膜区、等电点分析、Amphiphilicity分析、信号肽分析等等蛋白质序列分析专家讲座第50页8.5蛋白质序列基本性质分析蛋白质序列基本性质分析,普通包含蛋白质跨膜螺旋、卷曲螺旋、二硫键位置、翻译后修饰、信号肽与亚细胞定位、磷酸化位点分析等蛋白质序列分析专家讲座第51页COILS将输入序列与数据库中coiled-coils比较产生相同性分值。经过比较这个分值与球蛋白,卷曲螺旋蛋白分值分布,能够计算提交序列将会采取卷曲螺旋构象概率分值。蛋白质序列分析专家讲座第52页SignalP(http://www.cbs.dtu.dk/services/SignalP/)能够对革兰氏阳性菌,革兰氏阴性菌和真核生物蛋白质序列进行信号肽分析蛋白质序列分析专家讲座第53页TMHMM和TMpred

(http://www.cbs.dtu.dk/services/TMHMM/)用来预测跨膜螺旋。insulin蛋白质序列分析专家讲座第54页亚细胞定位与PSORTB

蛋白质必须在一定亚细胞器上才能正确行使其功效。同时也只有在相同或相近亚细胞位置上蛋白质间才会有相互作用。亚细胞位置异常蛋白质通常还会引发如癌症、老年痴呆症等疾病。蛋白质序列分析专家讲座第55页蛋白质磷酸化位点与DISPHOS

蛋白质翻译后修饰包含糖基化、磷酸化、蛋白质降解、S硝酸化、精氨酸甲基化和ADP核糖基化等等,是蛋白质行使正常生理功效所必需。众多蛋白质翻译后修饰方式中磷酸化是最常见、最主要一个共价修饰方式蛋白质序列分析专家讲座第56页8.6蛋白质序列功效注释伴随二维凝胶电泳等试验技术发展等蛋白质芯片上蛋白质组数据也在大量被获取。然而当前对这些新基因基因产物和蛋白质功效了解却相对落后。功效注释根本目标是建立基因型(genotype)与表型(phenotype)以及与环境间相互作用与联络为致病基因筛选、药品靶标筛选、基因表示谱数据分析、建立调控网络等提供关键信息。蛋白质序列分析专家讲座第57页①蛋白质功效描述蛋白质功效是一个多层次且含有复杂体系概念(multilevelandhierarchical),完整蛋白质功效注释需从生化、细胞、组织、发育进化、生理上分别进行描述蛋白质序列分析专家讲座第58页分子功效、细胞功效、表型功效等三个层次来描述蛋白质功效molecularfunction:蛋白质特殊绑定位点、催化活性和构象改变等cellularfunction:一定细胞环境下代谢路径、信号级联参加情况phonotypicfunction:生物体内表型,如是否患有疾病及其疾病病理等因为GeneOntologyConsortium工作,GO注释已成为当前功效功效注释事实标准,通常功效注释都会提供GO分类号蛋白质序列分析专家讲座第59页②蛋白质注释方法前蛋白质序列功效注释方法基本上是经过同源比对进行已知蛋白质功能注释信息传递,当前

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论