版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章-2蛋白质结构预测主讲人:孙啸制作人:刘志华东南大学吴健雄实验室1编辑ppt第七章-2蛋白质结构预测主讲人:孙啸1编辑ppt结构预测流程ProteinsequenceDatabasesimilaritysearchDoessequencealignwithproteinofknown3Dstructure?Proteinfamily,domain,clusteranalysisRelation-shiptoknownstructure?Structuralanalysis3DcomparativemodelingPredictedthreedimensionalstructureIsthereapredictedstructure?3Danalysisinlaboratoryyesnonono2编辑ppt结构预测流程ProteinDatabasesimilari第四节蛋白质三维结构预测1、同源模型化方法主要思想: 对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。依据:任何一对蛋白质,如果两者的序列等同部分超过30%,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。
3编辑ppt第四节蛋白质三维结构预测1、同源模型化方法3编辑p假设待预测三维结构的目标蛋白质为U(Unknown),利用同源模型化方法建立结构模型的过程包括下述6个步骤:(1)搜索结构模型的模板(T)(2)序列比对(3)建立骨架(4)构建目标蛋白质的侧链(5)构建目标蛋白质的环区(6)优化模型UT4编辑ppt假设待预测三维结构的目标蛋白质为U(Unknown),利用同构建目标蛋白质的侧链5编辑ppt构建目标蛋白质的侧链5编辑ppt预测结果准确率:对于具有60%等同的序列,用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%,则预测结果将接近于实验得到的测试结果。一般如果序列的等同部分大于30%,则可以期望得到比较好的预测结果。6编辑ppt预测结果准确率:6编辑ppt2、线索化方法(折叠识别方法)有很多蛋白质具有相似的空间结构,但它们的序列等同部分小于25%,即远程同源。对于这类蛋白质,很难通过序列比对找出它们之间的关系,必须设计新的分析方法。7编辑ppt2、线索化方法(折叠识别方法)7编辑ppt对于一个未知结构的蛋白质(U),如果找到一个已知结构的远程同源蛋白质(T),那么可以根据T的结构模板通过远程同源模型化方法建立U的三维结构模型。UT(远程同源)8编辑ppt对于一个未知结构的蛋白质(U),UT(远程同源一个远程同源模型化方法要解决三个问题:(1)检测远程同源蛋白质(T);(2)U和T的序列必须被正确地对比排列;(3)修改一般的同源模型化过程,以应用于相似度非常低的情况,即处理更多的环区,建立合理的三维结构模型。
如何解决第一个和第二个问题?基本思想是建立一个从U到已知结构T的线索,并通过一些基于环境或基于知识的势,评价序列与结构的适应性。至于最后建立三维结构模型则是非常困难的序列→结构比对9编辑ppt一个远程同源模型化方法要解决三个问题:序列→结构比对9线索化的主要思想:利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。10编辑ppt线索化的主要思想:10编辑ppt建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。线索化或者折叠识别的目标是为目标蛋白质U寻找合适的蛋白质模板,这些模板蛋白质与U没有显著的序列相似性,但却是远程同源的。
11编辑ppt建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技线索化方法一般有5个基本组成部分:(1)已知三维折叠结构的数据库;(2)一种适合于进行序列-结构比对的三维折叠信息的表示方法;(3)一个序列-结构匹配函数,该函数对匹配程度进行打分;(4)建立最优线索的策略,或者是进行序列-结构比对的策略;(5)一种评价序列-结构比对显著性的方法。12编辑ppt线索化方法一般有5个基本组成部分:12编辑ppt假设存在有限数目的核心折叠(corefolds)核心折叠实际上是构成蛋白质空间形状的基本模式。建立核心折叠数据库预测----建立线索U序列与数据库核心折叠比对取最佳核心折叠U结构模型13编辑ppt假设存在有限数目的核心折叠(corefolds)U序列与数一种基于序列与结构比对的最优线索化算法令:s1,s2,…,sn为蛋白质序列S的n个元素C1,C2,…,Cm为数据库中核心折叠C的m个核心区域 Cij为第i个核心区域第j个氨基酸位置
每一个核心区域由若干个氨基酸残基构成
14编辑ppt一种基于序列与结构比对的最优线索化算法14编辑ppt设t是一个从序列到核心折叠的线索,那么t说明了序列S的哪些元素si,sj,sk,…代表核心区域C1,C2,C3,…的起始位置。这实际上是一种从序列S到核心折叠C的比对令
代表核心折叠C中的环到序列S中空位的映射,显然
是通过线索化而确定的。15编辑ppt设t是一个从序列到核心折叠的线索,那么t说明了序列S的哪些元令f(t)是进行比对的得分函数,其定义如下:f(t)=g1(v,t)+g2(u,v,t)+g3(
,t) g1(v,t)评价氨基酸残基v所处的位置g2(u,v,t)评价残基u和v的相对位置,如果u和v键合,则得分高;g3(
,t)评价环区,根据环区的大小进行打分。
线索化问题: 对于给定的序列S和核心折叠C,选择一个线索t,使得f(t)的值最小,即寻找一个从S到C的最佳映射。16编辑ppt令f(t)是进行比对的得分函数,其定义如下:16编辑ppt3、从头预测方法在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法,即(直接)仅仅根据序列本身来预测其结构。17编辑ppt3、从头预测方法17编辑ppt从头预测方法一般由下列3个部分组成:(1)一种蛋白质几何的表示方法 由于表示和处理所有原子和溶剂环境的计算开销非常大,因此需要对蛋白质和溶剂的表示形式作近似处理。(2)一种势函数及其参数 通过对已知结构的蛋白质进行统计分析确定势函数中的各个参数(3)一种构象空间搜索技术构象空间搜索和势函数的建立是从头预测方法的关键18编辑ppt从头预测方法一般由下列3个部分组成:18编辑pptN端的氨基酸位于坐标系统的原点第二个氨基酸位于坐标的(1,0)或(1,0,0)处。H-P模型-[疏水(hydrophobic)-极性(polar)]
19编辑pptN端的氨基酸位于坐标系统的原点H-P模型-[疏水(hydr基于疏水残基之间的接触进行打分每一个H和H的接触(非相邻残基)对能量的贡献都为-1最优的构象就是所有可能的构象中具有最多H和H接触的那个构象图中的二维和三维构象的得分都是-320编辑ppt基于疏水残基之间的接触进行打分20编辑ppt绝对方向表示法:每一个位置上可选择的方向:上、右、左和下(U、R、L、D);而对于三维模型:上、右、左、下、后和前(U、R、L、D、B、F)。构象空间搜索(R,R,D,L,D,L,U,L,U,U,R) (R,B,U,F,L,U,R,B,L,L,F)21编辑ppt绝对方向表示法:构象空间搜索(R,R,D,L,D,L,U,L相对方向表示法:利用每个氨基酸残基主链的转动方向来表示每个位置上的残基的方向二维网格模型:每个残基位置上可选择的方向有三个左、右和前(L、R和F)三维网格模型:左、右、前、上和下(L、R、F、U、D)22编辑ppt相对方向表示法:22编辑ppt能量函数和优化需要考虑的相互作用疏水作用氢键二硫桥静电作用范德华力溶剂作用23编辑ppt能量函数和优化23编辑ppt分子力学方法——假设正确的蛋白质折叠对应于最低能量的构象分子力学势能是原子坐标的函数势能函数由多项组成 成键作用: 化学键的伸缩能(键长) 弯曲能(键角) 扭转能(二面角) 非成键作用: 范德华力 静电力 氢键分子力学中的势能参数的来源从头算(abinitio)和半经验计算结果氨基酸和小分子的实验观察结果24编辑ppt分子力学方法24编辑ppt
能量优化方法:梯度下降法 最陡下降法 共轭梯度法牛顿-拉普森方法
25编辑ppt能量优化方法:25编辑ppt分子动力学蒙特卡罗方法模拟退火方法遗传算法26编辑ppt分子动力学26编辑ppt基于势函数或者力场的结构预测方法在实际应用中存在许多问题,主要原因:我们还没有完全了解究竟是哪些力决定了蛋白质的折叠过程,同时这些力之间又是如何相互作用的力场参数不精确,没有对溶剂处理的好方法构象搜索过程容易陷入局部能量极小点自然折叠的蛋白质结构与一般蛋白质构象之间的能量差比较小研究蛋白质折叠的计算量非常大27编辑ppt基于势函数或者力场的结构预测方法在实际应用中存在许多问题,主4、预测方法评价对各种方法所得到的蛋白质结构预测结果需要进行验证,以确定预测方法是否可行,确定其适应面。验证的一种方法是取已知结构的蛋白质,对这些蛋白质进行模拟结构预测,并将预测结构与真实结构进行比较,分析两者之间的差距。
权威的评判机构,建立公共认可的蛋白质结构测试数据集。设立在马里兰生物技术研究中心的CASP就是这样一个系统(/casp4/)28编辑ppt4、预测方法评价28编辑ppt第五节蛋白质空间结构比较结构域对蛋白质进行序列比较,可以发现同源序列的保守区域。 但是对于结构域,通过序列比较,我们只能得到一部分信息。如果在结构这个层次上进行比较,可以发现更多的信息。蛋白质的结构比序列更加保守,通过比较蛋白质的空间结构,可以发现属于同一家族蛋白质的保守结构,可以发现特定的空间结构模式。这些模式由多个不相邻的序列片段组成,经过蛋白质折叠以后,这些一维不相邻的元素在三维空间中结合到一起,形成特定的功能位点,如酶的活性部位,蛋白质结合部位等。
29编辑ppt第五节蛋白质空间结构比较结构域29编辑ppt蛋白质结构比较有两个主要的任务:检测蛋白质的结构特征在已知两个蛋白质对应结构特征的条件下,寻找将两个蛋白质空间结构重叠的几何变换,进行三维结构的比对(alignment)。
30编辑ppt蛋白质结构比较有两个主要的任务:30编辑ppt如果用数学语言来描述,就是给定两个三维点集P={pi}和Q={qi}(i=1,2,…,n),寻找一个空间变换矩阵T,使得最小,即:这个问题可以用最小二乘法解决
31编辑ppt如果用数学语言来描述,就是给定两个三维点集P={pi}和Q空间点三元组几何变换
目标:寻找两个蛋白质空间点三元组重叠最多的几何变换。32编辑ppt空间点三元组几何变换
目标:32编辑ppt解决这个问题的直接算法是如下:(1)对于每一对空间点三元组(分别来自不同的蛋白质),计算能使这两个对象重叠的几何变换;(2)统计在各种变换中,能够同时重叠、或者基本重叠的空间点三元组个数,并作为对应变换的得分;(3)选择得分比较高的变换,改进这些变换,使其得分进一步提高。33编辑ppt解决这个问题的直接算法是如下:33编辑ppt基于几何哈希(geometrichashing)技术的三维结构比对方法34编辑ppt基于几何哈
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度产业园区厂房租赁与人才引进服务合同3篇
- 2025年度高校实习生就业保障服务劳动合同3篇
- 2025年个人房产测绘与房地产风险评估合同
- 2025版建筑装饰泥水劳务分包合同3篇
- 2025年度商铺租赁代理合同实施细则4篇
- 二零二五版木材加工企业知识产权保护合同4篇
- 2025年度环保型塑料模具设计与加工合同3篇
- 2025年度打印机租赁与远程运维服务合同4篇
- 二零二五年度房屋承建工程质量责任追究合同3篇
- 2025年度国际货物出口运输服务合同书4篇
- 卫生服务个人基本信息表
- 医学脂质的构成功能及分析专题课件
- 高技能人才培养的策略创新与实践路径
- 广东省湛江市廉江市2023-2024学年八年级上学期期末考试数学试卷(含答案)
- 2024年湖北省知名中小学教联体联盟中考语文一模试卷
- 安徽省芜湖市2023-2024学年高一上学期期末考试 生物 含解析
- 燃气行业有限空间作业安全管理制度
- JB T 7946.1-2017铸造铝合金金相
- 包装过程质量控制
- 通用电子嘉宾礼薄
- 赤峰市海业矿产有限责任公司福合元矿区铜钼矿2022年度矿山地质环境治理与土地复垦方案
评论
0/150
提交评论