![结构基序预测蛋白质功能_第1页](http://file4.renrendoc.com/view3/M03/12/10/wKhkFmYMj9CAZX4OAAC2ghds4ao933.jpg)
![结构基序预测蛋白质功能_第2页](http://file4.renrendoc.com/view3/M03/12/10/wKhkFmYMj9CAZX4OAAC2ghds4ao9332.jpg)
![结构基序预测蛋白质功能_第3页](http://file4.renrendoc.com/view3/M03/12/10/wKhkFmYMj9CAZX4OAAC2ghds4ao9333.jpg)
![结构基序预测蛋白质功能_第4页](http://file4.renrendoc.com/view3/M03/12/10/wKhkFmYMj9CAZX4OAAC2ghds4ao9334.jpg)
![结构基序预测蛋白质功能_第5页](http://file4.renrendoc.com/view3/M03/12/10/wKhkFmYMj9CAZX4OAAC2ghds4ao9335.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于结构基序预测蛋白质功能在类的合并上,主要有三种算法来确定类间的距离:单一连锁(single-linkage)、完全连锁(complete-linkage)和平均连锁(average-linkage)。这三种算法在定义类间的距离时分别取两类间的最小距离、最大距离和平均距离。前两种算法对边缘值太过敏感,对于未知的元素分布,一般采用平均连锁算法。
完全连锁(completelinkage),又称最远邻(furthestneightbour)方法。同样从相似度矩阵或距离矩阵出发,但定义距离为两类之间数据的最大距离。同样不考虑到类的结构。倾向于找到一些紧凑的分类。第2页,共41页,2024年2月25日,星期天以最小近邻法聚类为例最短距离聚类法具有空间压缩性,而最远距离聚类法具有空间扩张性。最短距离为dAB=da1b1,最远距离为dAB=dap2。
第3页,共41页,2024年2月25日,星期天表示了八种不同系统聚类方法计算类间距离的统一表达式
第4页,共41页,2024年2月25日,星期天CompositeStructuralMotifsofBindingSitesforDelineatingBiologicalFunctionsofProteins
汇报人:刘言第5页,共41页,2024年2月25日,星期天简介在原子水平上,我们都是通过蛋白质之间或蛋白质与其他分子之间相互作用来理解生物学过程的。
大部分蛋白质会同步或不同步的与很多分子相互作用。单原子离子,小分子到蛋白质、核酸和其他大分子第6页,共41页,2024年2月25日,星期天
众所周知,蛋白质相互作用的类型和蛋白质是否相互作用可以调节蛋白质的功能(血红蛋白与氧结合,与一氧化碳结合)。因此,我们不仅要确定个体蛋白的相互作用,也要考虑潜在的蛋白质相互作用,这些相互作用或许可以充分描述蛋白质的功能,也能从同源蛋白中区分它们的不同功能。第7页,共41页,2024年2月25日,星期天
Genomesequencetechnologies促使我们更加急迫的去发掘从序列信息预测蛋白质功能的有效技术。迄今为止,最常用于蛋白质功能预测的方法是annotationtransfer,它是基于一种蛋白质序列相似,功能相似的假设基础上的方法。然而,随着研究的逐步深入,这种方法在很多情况下却是不可靠的。第8页,共41页,2024年2月25日,星期天
蛋白质功能相似,并不仅仅是序列功能的相似。蛋白质序列折叠方式不同,会导致结构不同,从而影响功能。所以我们要更加精细的检查蛋白质功能的决定因素,而不是只单纯的考虑蛋白质序列相似性。第9页,共41页,2024年2月25日,星期天
结构信息可以为蛋白质功能预测提供更加准确的信息。
Todate,therehavebeenmanymethodsfordetectingpotentialligandbindingsitesbasedonstructuralsimilarityofproteins[14,16–22].Mostofthesemethodsaretargetedatpredictingproteinfunctionsatthelevelofligandbindingandcatalyticactivity.Therehavealsobeenmanystudiesonprotein-proteininteractioninterfacestounderstandbiologicalfunctionsofproteinsincellularcontexts。第10页,共41页,2024年2月25日,星期天然而,大部分研究都是针对于一些特殊的相互作用本身和不明确机理的相互作用如何调控蛋白质的生物学功能的。第11页,共41页,2024年2月25日,星期天文中思想为了明确原子水平上蛋白质相互作用的模式与其功能的关系,在这里我们采用一个非常详尽的all-against-allstructuralcomparisonsofbindingsitestructuresatatomiclevelusingallstructuresavailableintheProteinDataBank(PDB)。第12页,共41页,2024年2月25日,星期天1.Identificationofelementaryandcompositemotifs首先,我们找到PDBMLfile中所有有注释的生物学单元,然后从中提取出197690个蛋白质亚基(这些亚基均至少包含一个配体结合位点)这里,我们把一个亚基的配体结合位点定义为一个亚基的原子集(与配体原子的距离在5A之内)。然而我们不用已知的基于序列相似性的非冗余数据库,我们的冗余在相似结构聚类之后再清理。通过这种方式,确定在后续的分析中当结构冗余条件移除后高度相似的蛋白质结构差异或相同的氨基酸序列是否能够preserved。第13页,共41页,2024年2月25日,星期天KinjoAR,NakamuraH(2007)Similaritysearchforlocalproteinstructuresatatomicresolutionbyexploitingadatabasemanagementsystem.
All-against-allstructure用GIRAF结构搜索和排列程序比对410254小分子结合位点,346288蛋白质结合位点和20388核酸结合位点。完全连锁聚类后各自输出5869,7678和398簇(至少有十个成员)。我们把这些簇看做elementarymotifs.一个蛋白质亚基中所包含的全部的elementarymotifs的集称为亚基的compositemotif.因此两个亚基有共同的elementarymotifs可以推断他们有共同的compositemotif。第14页,共41页,2024年2月25日,星期天第15页,共41页,2024年2月25日,星期天2.Characterizationofcompositemotifs组成compositemotif的elementarymotifs的数目由1-20不等。第16页,共41页,2024年2月25日,星期天Tocharacterizethediversityofcompositemotifs,theaverageandminimumsequenceidentitieswerecalculatedforpairsofsubunitssharingthesamecompositemotifs.第17页,共41页,2024年2月25日,星期天我们通过把检验得到的两个不同的compositemotifs的相似性和最小序列一致性做一个函数。第18页,共41页,2024年2月25日,星期天3.Associationofcompositemotifsimilaritywithfunctionsimilarity第19页,共41页,2024年2月25日,星期天whenweusedonlytheUniProtfunctionsundertheBiologicalprocesscategorywhicharelessdirectlyrelatedtomolecularfunctions第20页,共41页,2024年2月25日,星期天第21页,共41页,2024年2月25日,星期天4.Examplesofcompositemotifssharingthesameelementarymotifandfoldbutwithdifferentfunctions
第22页,共41页,2024年2月25日,星期天5.Meta-compositemotifsforannotatingfunctions用一个compositemotif描述一个蛋白质亚基的特殊状态,这样每一个生物学过程都可以看作是一系列的相互作用模型。因此,compositemotif仅仅只能作为整个生物学过程中的点。为了对生物学过程有一个更加综合性的感官,我们把所有的与特殊功能有关系的compositemotifs分类定义成meta-compositemotifs。第23页,共41页,2024年2月25日,星期天第24页,共41页,2024年2月25日,星期天type-1:basedsolelyonBLASTE-valuecutoffof0.05
type-2:basedonsequenceidentitycutoffof100%第25页,共41页,2024年2月25日,星期天6.Networkstructureofmeta-compositemotifsinbiologicalprocesses
我们把所有的compositemotifs分类组合成meta-compositemotifs,更有利于对蛋白质功能进行分析而不是最开始简单的预测。第26页,共41页,2024年2月25日,星期天通过UniProtkeyword‘‘Transcription’’识别一个meta-compositemotif,然后找到节点部分。节点:
basedonrelationssuchascommonelementarymotifsorcommonsequences.第27页,共41页,2024年2月25日,星期天
Forexample,therearePDBentriesofhumancellulartumorantigenp53withorwithoutboundDNA(e.g.,PDB1UOL[58]and2AC0[59])whichsharethesameelementarymotifforzincbindingbuthavedifferentCompositemotifsdependingonthepresenceorabsenceoftheelementarymotifforDNAbinding.第28页,共41页,2024年2月25日,星期天第29页,共41页,2024年2月25日,星期天Toevaluatethepropertiesofnetworksofmetamotifs
第30页,共41页,2024年2月25日,星期天MaterialsandMethodsDatasetWehaveusedallthePDBentriesasofDecember29,2010(70,231entries),whichcontainedatleastoneligandbindingsite.Aligandbindingsiteofasubunitisdefinedasasetofatleast10atomsinthesubunitthatareincontactwithsomeatomsofaligandwithin5Aradius.第31页,共41页,2024年2月25日,星期天2.Similaritybetweenbindingsitestructures
Tocomparebindingsitestructures,weusedtheGIRAFstructuralsearchandalignmentprogramwithsomemodificationstoenablefasterdatabasesearchandflexiblealignments(unpublished).Afterall-against-allcomparisonsofbindingsites,elementarymotifsweredefinedascomplete-linkageclusterswithacutoffGIRAFscoreof15.第32页,共41页,2024年2月25日,星期天TheGIRAFscoreisdefinedasTheresultsofall-against-allcomparisonofbindingsitesandclassificationsaremadeavailablefordownloadat/giraf/cmotif/.第33页,共41页,2024年2月25日,星期天NAandNB分别是A、B原子中的结合位点数目。NA,B是两原子中配对比对结合的数目。Theweightw(xAa,xBa)forthealignedatompairsxAaandxBa.d(xAa,xBa)
isthedistancebetweentwoatomsinasuperimposedcoordinatesystem.阈值dc设定为2.5A。第34页,共41页,2024年2月25日,星期天结合位点的大小是影响GIRAF的初始值的主要因素。所以,在进行结合位点相似性与功能相似性的比对中我们采取了一个标准化的相似性测度使大小各异的结合位点能够以相同的比例尺进行测量。
normalizedsimilarityS(A,B)betweenthebindingsitesAandBisdefinedas
第35页,共41页,2024年2月25日,星期天3.FunctionsdefinedbyUniProtkeywords我们从PDB数据库中提取的每个亚基(均至少含有一个配体结合位点)在Uniprot数据库中均可找到注释。因此,我们要确定他们的关键词从而确定其在Uniprot中的entries。
Twosubunitswhoseassociatedsetsofkeywordsareexactlyidenticalaredefinedtohavethesamefunction.ThesimilaritybetweentwoUniProtfunctionsaredefinedbytheJaccardindexbetweenthesetsofkeywordsassociatedwiththefunctions.第36页,共41页,2024年2月25日,星期天4.Similaritybetweentwosets
GiventhesetsAandB,theirsimilarityisdefinedbytheJaccardindexJ(A,B):
compositemotifelementarymotifsfunctionUniProtkeywordsmeta-compositemotifcompositemotifsmeta-sequencemotif
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年自动平滑门项目可行性研究报告
- 2025年竹纤维家居服项目可行性研究报告
- 2025至2031年中国电池专用材料行业投资前景及策略咨询研究报告
- 2025年水管手推车项目可行性研究报告
- 2025年显微(细胞)电泳系统项目可行性研究报告
- 2025至2031年中国寻像器行业投资前景及策略咨询研究报告
- 2025至2031年中国商业印刷票据表格行业投资前景及策略咨询研究报告
- 2025至2031年中国儿童多用台行业投资前景及策略咨询研究报告
- 2025年免维护阀控式铅酸电池项目可行性研究报告
- 2025年U型收音机项目可行性研究报告
- NB-T 47013.1-2015 承压设备无损检测 第1部分-通用要求
- 初中历史 教材分析与教学策略 课件
- (完整word版)手卡模板
- GB/T 13912-2020金属覆盖层钢铁制件热浸镀锌层技术要求及试验方法
- 统编教学小学语文课外阅读《细菌世界历险记》导读课课件
- 幼儿剪纸-打印版
- 中小学2021年秋季开学第一课手心班会图文精品
- 高三英语阅读专项训练之说明文(含答案及部分解析)
- 中国移动CHBN试题题库大全(含答案)
- 医学课件:介入放射学(全套课件328张)
- 2022年同等学力人员申请硕士学位日语水平统一考试真题
评论
0/150
提交评论