版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
蛋白质分析和蛋白质组学proteinRNADNA1蛋白质分析和蛋白质组学proteinRNADNA1protein[4]Proteinfunction[3]ProteinlocalizationGeneontology(GO):--cellularcomponent--biologicalprocess--molecularfunction[1]Molecularbiology[2]Proteinfamilies2protein[4]Proteinfunction[3]视角3和4的介绍:
GeneOntology(GO)Consortium3视角3和4的介绍:GeneOntology(GO)CGeneOntology成立的背景Year19822005Numberofrecords60244,202,133GenBankEMBLDDBJPubMed:over15millioncitations4GeneOntology成立的背景Year1982200What’sinaname?GlucosesynthesisGlucosebiosynthesisGlucoseformationGlucoseanabolismGluconeogenesisAllrefertotheprocessofmakingglucosefromsimplercomponents5What’sinaname?GlucosesynthWhat’sinaname?ThesamenamecanbeusedtodescribedifferentconceptsAconceptcanbedescribedusingdifferentnamesComparisonisdifficult–inparticularacrossspeciesoracrossdatabases6What’sinaname?Thesamename本体(ontology)计算机科学对自然世界认知的形式化的表示,既是可被计算机表示,解释和利用的知识的形式化的研究—即本体。本体是结构化的领域知识,并可以被计算机解释和利用。实现对生命世界中这些概念理解上的共享,包括从不同的视角,不同的术语分类,不同的主体(人和机器)共享概念--概念化的规范GeneOntology(GO)协会致力于这样一项工程:编辑一组动态的而又可控的词汇来描述基因和基因产物(主要是蛋白质)不同方面的性质。7本体(ontology)计算机科学对自然世界认知的形式化的表Ontologiescanberepresentedasgraphs,wherethenodesareconnectedbyedges
Nodes=conceptsintheontologyEdges=relationshipsbetweentheconceptsnodenodenodeedgeOntologyStructure8Ontologiescanberepresented所有这些蛋白质能做什么?“功能”太有局限性。生物学家想知道:每个蛋白质能做什么,属于哪条细胞回路或者为什么细胞需要这个功能,以及在什么地方发生了这样的过程。9所有这些蛋白质能做什么?“功能”太有局限性。9GeneOntology的发起芽殖酵母基因组数据库(SGD)果蝇基因组数据库(drosophilagenomedatabase,简称FlyBase)小鼠基因组信息数据库;(mousegenomeinformationdatabase,简称MGD/GXD)
GO数据库不是以其自身为中心而是依靠外部数据库,这些外部数据库中收录的基因及其产物都将用GO定义的词汇进行注释。因此GO是与时俱进与相互合作的代表,它致力于统一基因及其产物注释的方式。YoucanvisitGOat.10GeneOntology的发起芽殖酵母基因组数据库(SGDGO(GeneOntology)structureGOisn’tjustaflatlistofbiologicaltermstermsarerelatedwithinahierarchy11GO(GeneOntology)structureGOHierarchicalstructure层次性:
isa:上一个概念包括下一个概念,下一个概念是上一个概念的实例。partof:下一个概念是上一个概念的一部分
树松树叶子PartofIsa12Hierarchicalstructure层次性:树松树TruePathRuleTruePathRule:如果下一代的术语可以用于描述此基因产物,其上一代术语也可以适用。已糖代谢和单糖合成己糖合成活性13TruePathRuleTruePathRule:如DAG有向无环(DAG)Simplehierarchies
(Trees)DirectedAcyclicGraphsOneormoreparentsSingleparent14DAG有向无环(DAG)SimplehierarchiesHowdoesGOwork?Whatdoesthegeneproductdo?Whereandwhendoesitact?Whydoesitperformtheseactivities?Whatinformationmightwewanttocaptureaboutageneproduct?15HowdoesGOwork?WhatdoestheGO:ThreeontologiesWheredoesitact?Whatprocessesisitinvolvedin?Whatdoesitdo?MolecularFunctionCellularComponentBiologicalProcessgeneproduct16GO:ThreeontologiesWheredoesMolecularFunction分子功能描述在分子生物学上的活性,如催化活性或结合活性。Setsoffunctionsmakeupabiologicalprocess.insulinbindinginsulinreceptoractivity17MolecularFunction分子功能描述在分子生物学CellularComponentwhereageneproductacts(细胞中的位置指基因产物位于何种细胞器或基因产物组中(如糙面内质网,核或核糖体,蛋白酶体等))18CellularComponentwhereageneBiologicalProcess生物学途径是由分子功能有序地组成的,具有多个步骤的一个过程。(细胞生长和维持、信号传导、嘧啶代谢或α-配糖基的运输)。celldivisiongluconeogenesis19BiologicalProcess生物学途径是由分子功能有BiologicalProcess20BiologicalProcess20lipocalin21lipocalin21以树状图形式显示的GO词汇之间的关系22以树状图形式显示的GO词汇之间的关系22Perspective3:Proteinlocalization23Perspective3:23proteinPerspective3:Proteinlocalization24proteinPerspective3:ProteinProteinlocalizationProteinsmaybelocalizedtointracellularcompartments,cytosol,theplasmamembrane,ortheymaybesecreted.Manyproteinsshuttlebetweenmultiplecompartments.Avarietyofalgorithmspredictlocalization,butthisisessentiallyacellbiologicalquestion.很多蛋白质不能被单一地确定存在于细胞一个固定位置上。例如膜联蛋白和小G蛋白家族就转移于胞质和膜之间(有时在胞质内,有时在膜上)。这种转移运动取决于是否有特定的细胞信号存在,例如钙离子。25ProteinlocalizationProteinsmhttp://psort.nibb.ac.jp26http://psort.nibb.ac.jp26/software/TMPRED.form.html27/softw2828Localizationof2,900yeastproteinsMichaelSnyderandcolleaguesincorporatedepitopetagsintothousandsofS.cerevisiaecDNAs,andsystematicallylocalizedproteins(Kumaretal.,2002).Seeforadatabaseincluding2,900fluorescencemicrographs.29Localizationof2,900yeastprPerspective4:
ProteinfunctionFunctionreferstotheroleofaproteininthecell.Wecanconsiderproteinfunctionfromavarietyofperspectives.30Perspective4:Proteinfunctio1.Biochemicalfunction(molecularfunction)RBPbindsretinol,couldbeacarrier例子:酶结构蛋白转运蛋白细胞中不存在没有任何功能的蛋白。311.BiochemicalfunctionRBPbin2.FunctionalassignmentbasedonhomologyRBPcouldbeacarriertooOthercarrierproteins增味剂结合蛋白是lipocalins的一个成员,也被认为是一个载体蛋白322.FunctionalassignmentRBPOth3.FunctionbasedonstructureRBPformsacalyxX射线晶体衍射显示RBP形成一个类似茶杯的结构,有一圈疏水氨基酸组成,充当一个配体结合位点333.FunctionRBPformsacalyxX射4.FunctionbasedonligandbindingspecificityRBPbindsvitaminA344.FunctionbasedonRBPbinds5.FunctionbasedoncellularprocessDNARNARBPisabundant,soluble,secreted355.FunctionbasedonDNARNARBP6.FunctionbasedonbiologicalprocessRBPisessentialforvision366.FunctionbasedRBPisessent7.Functionbasedon“proteomics”orhighthroughput“functionalgenomics”Highthroughputanalysesshow...RBPlevelselevatedinrenalfailureRBPlevelsdecreasedinliverdisease377.Functionbasedon“proteomiFunctionalassignmentofenzymes:
theEC(EnzymeCommission)systemEC号类别描述酶的数目子类的例子1.-.-.-氧化还原酶10031.1.-.-——作用于CH-OH基团1.2.-.-——作用于醛类或氧络集团2.-.-.-转移酶10762.1.-.-——转移—碳基团3.-.-.-水解酶11254.-.-.-裂解酶3565.-.-.-异构酶1566.-.-.-连接酶12638FunctionalassignmentofenzymFunctionalassignmentofproteins:ClustersofOrthologousGroups(COGs)39FunctionalassignmentofproteProteomics:HighthroughputproteinanalysisProteomicsisthestudyoftheentirecollectionofproteinsencodedbyagenome“Proteomics”referstoalltheproteinsinacelland/oralltheproteinsinanorganism Large-scaleproteinanalysis 2Dproteingels Yeasttwo-hybrid RosettaStoneapproach……40Proteomics:HighthroughputprClassicalbiochemicalapproachIdentifyanactivityDevelopabioassayPerformabiochemicalpurification Strategies:size,charge,hydrophobicityPurifyproteintohomogeneityClonecDNA,expressrecombinantproteinGrowcrystals,solvestructure41Classicalbiochemicalapproach4242Two-dimensionalproteingelsFirstdimension:isoelectricfocusing
Seconddimension:SDS43Two-dimensionalproteingelsFi44444545464647474848Evaluationof2Dgels(IEF/SDS)Advantages: Visualizehundredstothousandsofproteins ImprovedidentificationofproteinspotsDisadvantages: Limitednumberofsamplescanbeprocessed Mostlyabundantproteinsvisualized Technicallydifficult49Evaluationof2Dgels(IEF/SDSAffinitychromatography/massspecBaitproteinGST50Affinitychromatography/masssAffinitychromatography/massspecBaitproteinGSTAddyeastextractProteincomplexesbindMostproteinsdonotbind51Affinitychromatography/masssAffinitychromatography/massspecBaitproteinGSTEluteRungelMALDI-TOFIdentifycomplexes52Affinitychromatography/masssAffinitychromatography/massspecDataoncomplexesdepositedindatabaseshttp://www.bind.ca53Affinitychromatography/masss54545555Theyeasttwo-hybridsystemReportergeneBaitproteinDNABindingPreyproteinDNAactivationIsolateandsequencethecDNAofthebindingpartneryouhavefoundWewilllearnaboutitlaterwhenwestudyproteininteractionnetworks56Theyeasttwo-hybridsystemRepred=cellularrole&subcellularlocalizationofinteractingproteinsareidentical;blue=localiationsareidentical;green=cellularrolesareidentical57red=cellularrole&subcelluTheRosettaStoneapproachMarcotteetal.(1999)andothergroupshypothesizedthatsomepairsofinteractingproteinsareencodedbytwogenesinmanygenomes,butoccasionallytheyarefusedintoasinglegene.Byscanningmanygenomesforexamplesof“fusedgenes,”severalthousandprotein-proteinpredictionshavebeenmade.58TheRosettaStoneapproachMarcYeasttopoisomeraseIIE.coligyraseBE.coligyraseATheRosettaStoneapproach59YeasttopoisomeraseIIE.coliE罗赛塔石碑60罗赛塔石碑60GeneFusion(Rosettastonemethod)G1:G2:E.coliYeasttrpAtrpBTryptophansynthasesubunitsAandB,fusedinyeast.Itisbasedontheobservationthatsomeinteractingproteins/domainshavehomologsinothergenomesthatarefusedintooneproteinchain,aso-calledRosettaStoneprotein.61GeneFusion(RosettastonemetHowmany“genefusions”?3genomes88genefusions179genomes?fusionsMarcotteE.coli:6809Yeast:4550262Howmany“genefusions”?3genoprotein[1]Molecularbiology[4]Proteinfunction[2]Proteinfamilies[3]ProteinlocalizationGeneontology(GO):--cellularcomponent--biologicalprocess--molecularfunction63protein[1]Molecularbiology[4Perspective2:
Proteinfamily,domainsandmotifs为什么关注蛋白质家族?64Perspective2:
Proteinfamil基因重复65基因重复65蛋白质同源序列和家族在目前所有已知的数据库中均没有发现同源序列的蛋白质。
它的其他性质(如跨膜区结构域、磷酸化位点、预测出的二级结构等)也会给我们了解该蛋白质的结构或功能提供一些线索。
有直系同源序列或旁系同源序列的蛋白质。
这种蛋白质至少能找到一条同源序列,且两条序列存在具有显著相似性或显著特征的区域。这些有显著序列相似性或显著结构特征的区域有很多名称,如签名(signature)、结构域(domain)、模块(module)、模块元件(modularelement)、折叠子(fold)、模体(motif)、模式(pattern)或重复(repeat)。66蛋白质同源序列和家族在目前所有已知的数据库中均没有发现同源序DefinitionsSignature:aproteincategorysuchasadomainormotifDomain:aregionofaproteinthatcanadopta3Dstructureafoldafamilyisagroupofproteinsthatshareadomainexamples: zincfingerdomain immunoglobulindomainMotif(orfingerprint):ashort,conservedregionofaproteintypically10to20contiguousaminoacidresidues67DefinitionsSignature:67签名(signature)签名(signatures)的概念很宽广,它确定一个蛋白质分类,可能指结构域(domain)、家族(family)或模体(motif)。仅考虑单独的一个蛋白质时,我们仅能得到很少一部分关于其结构和功能的信息;但是将它与相关序列比对找到保守部分后,从保守序列中可以推测出很多信息。签名主要可以分为两类,每一类签名都可以用各自的方法确定。结构域(domain)是蛋白质中能折叠成特定三维结构的一段区域。结构域也能被称为模块。一组拥有相同结构域的蛋白被称为一个蛋白质家族。模体(motif,或称指纹,fingerprint)是蛋白质序列中较短的保守区域。模体的长度一般是10—20个氨基酸残基,尽管实际中的模体有可能更长或更短。一些简单而常见的模体在一组蛋白质中发现并不意味着这组蛋白质是同源的,例如形成跨膜区结构域或保守磷酸化位点的模体。而另一些情况中,小的模体则是一个蛋白质家族的标志(如prosite)。68签名(signature)签名(signatures)的概念InterPro对相关术语的定义
家族:InterPro定义一组进化上相关的共享一个或多个结构域的蛋白质为一个家族结构域:InterPro数据库中的结构域是指一个独立的结构单元,他们可能单独存在也可能与其他结构域相连。结构域也是进化上相关的序列。69InterPro对相关术语的定义家族:InterPro定义SMART对相关术语的定义
结构域:保守的结构单元,包含独特的二级结构组合和疏水内核。具有相同功能的同源结构域往往具有序列上的相似性。模体:序列模体是指短的保守的多肽段。含有相同模体的蛋白质并不一定是同源的。70SMART对相关术语的定义结构域:保守的结构单元,包含独特结构域和motif血清蛋白(581氨基酸):3个类似结构域,每个约180个氨基酸胶原蛋白中存在着几十个有GXY三肽组成的重复片段RNA聚合酶最大亚基C端结构域中有52个重复的六肽片段:[T/S]PTSP[N/T].PrP(疯牛病):有四个连续对八肽:PHGG[G/S]WGQ许多细胞内信号转导的蛋白质含有SH2肽段(与磷酸化丝氨酸/苏氨酸结合的肽段)71结构域和motif血清蛋白(581氨基酸):3个类似结构域,DefinitionofamotifAmotif(orfingerprint)isashort,conservedregionofaprotein.Itssizeisoften10to20aminoacids.Simplemotifsincludetransmembranedomainsandphosphorylationsites.Thesedonotimplyhomologywhenfoundinagroupofproteins.PROSITE(/prosite)isadictionaryofmotifs.InPROSITE,apatternisaqualitativemotifdescription(aproteineithermatchesapattern,ornot).Incontrast,aprofileisaquantitativemotifdescription.WewillencounterprofilesinPfam,ProDom,SMART,andotherdatabases.72DefinitionofamotifAmotif(蛋白质motif~~~~~EIQDVSGTWYAMTVDREFPEMNLESVTPMTLTTL.GGNLEAKVTMlipocalin1LSFTLEEEDITGTWYAMVVDKDFPEDRRRKVSPVKVTALGGGNLEATFTFodorant-bindingprotein2aTKQDLELPKLAGTWHSMAMATNNISLMATLKAPLRVHITSEDNLEIVLHRprogestagen-assoc.endo.VQENFDVNKYLGRWYEIEKIPTTFENGRCIQANYSLMENGNQELRADGTVapolipoproteinDVKENFDKARFSGTWYAMAKDPEGLFLQDNIVAEFSVDETGNWDVCADGTFretinol-bindingproteinLQQNFQDNQFQGKWYVVGLAGNAI.LREDKDPQKMYATIDKSYNVTSVLFneutrophilgelatinase-ass.VQPNFQQDKFLGRWFSAGLASNSSWLREKKAALSMCKSVDGGLNLTSTFLprostaglandinD2synthaseVQENFNISRIYGKWYNLAIGSTCPWMDRMTVSTLVLGEGEAEISMTSTRWalpha-1-microglobulinPKANFDAQQFAGTWLLVAVGSACRFLQRAEATTLHVAPQGSTFRKLD...complementcomponent873蛋白质motif~~~~~EIQDVSGTWYAMTVDRE例子在HIV-1pol蛋白的天冬氨酸蛋白酶(aspartylproteases)结构域中,天冬氨酸残基(asp)对酶的催化活性至关重要。天冬氨酸蛋白酶模体由12个氨基酸残基构成:
[LIVMFGAC]-[LIVMTADN]-[LIVFSA]-D-[ST]-G-[STAV]-[STAPDENQ]-x-[LIVMFSTNC]-x-[LIVMFGTA]。几乎所有的lipocalins中都可以找到一个短的模体GxW。PROSITE数据库定义的lipocalins的保守氨基酸模体是:
[DENG]-x-[DENQGSTARK]-x(0,2)-[DENQARK]-[LIVFY]-{CP}-G-{C}-W-[FYWLRH]-x-[LIVMTA]。74例子在HIV-1pol蛋白的天冬氨酸蛋白酶(asparty模体氨基酸残基修饰的模体蛋白质细胞定位的模体与活性有关的模体其他模体75模体氨基酸残基修饰的模体75氨基酸残基修饰的模体糖蛋白中被N糖基化的天冬酰胺(N)一定是处于N{P}[S/T]中的。在一些与凝血过程相关的蛋白质中,被羟化的天冬氨酸或天冬酰胺处于CX[D/N]X4@XCXC的模体中。@为芳香性氨基酸,X4为任意氨基酸构成的四肽。被磷酸化的丝氨酸和苏氨酸在不同蛋白质中处于不同的模体中。组蛋白中为SP##(#为带正电的氨基酸)。蛋白激酶PKA或PKG中的模体是##X[S/T]。76氨基酸残基修饰的模体糖蛋白中被N糖基化的天冬酰胺(N)一定是当C端的4个氨基酸序列为KDEL或HDEL时,蛋白质就被局限在细胞的内质网中能进入细胞核的肽链都有特定的序列模体。1.PKKKRKVorKRX10KKKK;2.蛋白激酶中,KRX21RXKXKXK;3.#RX10#XX。蛋白质细胞定位的模体77当C端的4个氨基酸序列为KDEL或HDEL时,蛋白质就被局限Motif与细胞定位78Motif与细胞定位78与活性有关的模体在许多蛋白水解酶中,与催化有关的活性中心由D/E-H-S组成。在ATP和GTP结合蛋白质中存在着一种序列为GXXXXGK[T/S]的模体:
Rho家族GDGAXGKTATP合成酶GGAGVGKTV
肌球蛋白重链GESGSGKT
胸苷激酶GXXGXGKTT
胸苷酸激酶GXPGXGKGT这个模体可以形成一个特定的结构,与核苷酸结合。79与活性有关的模体在许多蛋白水解酶中,与催化有关的活性中心由D其他模体含有半胱氨酸的模体。在一些蛋白质中存在着特定的序列模体,其中半胱氨酸的位置是相对固定的(锌指)。未知功能的模体。如一些细胞因子受体的膜外侧接近膜处有WKS和WSKWS序列模体,但其功能还不清楚。80其他模体含有半胱氨酸的模体。在一些蛋白质中存在着特定的序列模模体的意义总结:模体(
motiforfingerprint)
是蛋白质序列中较短的保守区域,是按照一定的模式排列的氨基酸残基,长度一般在10~20残基之间。一些简单而常见的模体在一组蛋白质中发现并不意味着这组蛋白质是同源的(跨膜区结构域或磷酸化位点)。在另一些情况下,模体可以成为一个蛋白质家族的标志,反映了这个家族的亲缘关系。可以利用这个族徽寻找宗亲。(载脂蛋白超家族)1986年至今,国际生物化学学会主编的《TrendsinBiochemicalScience》一直有专栏刊登不同类型的的序列模体(也同时刊登结构域、模块等)。81模体的意义总结:模体(motiforfingerpri结构域和模体:蛋白质的模块性质82结构域和模体:蛋白质的模块性质82结构域的由来从球状蛋白到晶体衍射实验。(溶菌酶)免疫球蛋白的例子蛋白质的折叠过程20世纪60~70年代,提出结构域(domain)的概念。从水解实验,可以看出结构域能组成一个结构单元。结构域常由不同的外显子编码。83结构域的由来从球状蛋白到晶体衍射实验。(溶菌酶)83DefinitionofadomainAccordingtoInterProatEBI(http://www.ebi.ac.uk/interpro/):Adomainisanindependentstructuralunit,foundaloneorinconjunctionwithotherdomainsorrepeats.Domainsareevolutionarilyrelated.AccordingtoSMART(http://smart.embl-heidelberg.de):Adomainisaconservedstructuralentitywithdistinctivesecondarystructurecontentandahydrophobiccore.Homologousdomainswithcommonfunctionsusuallyshowsequencesimilarities.84DefinitionofadomainAccordin总结结构域的概念:从最初的一级结构中较长的重复片段,上升为有特征的立体结构,而且他们有一定生物功能,并且对应着基因中的某些外显子,为它们编码、形成肽链后,还能自行折叠成稳定的结构。总之,结构域可看作是一个“entity”。一般来说,如果两个蛋白质拥有一个相同的结构域,那么这两个蛋白质有相关的功能。序列模体是一个序列上经概括后“求同存异”的“框架”,是在一段肽段中关键位置上氨基酸残基的组合模式。二者的区别在于结构域有“结构”的含义。85总结结构域的概念:从最初的一级结构中较长的重复片段,上升为有人类中15个最常见的结构域86人类中15个最常见的结构域86蛋白质共享一个结构域ExtendingalongthelengthofaproteinOccupyingasubsetofaproteinsequenceOccurringoneormoretimeslipocalin免疫球蛋白结构域纤连蛋白重复区
与甲基化的DNA结合的转录因子家族87蛋白质共享一个结构域ExtendingalongtheExampleofaproteinwithdomains:MethylCpGbindingprotein2(MeCP2)MBDTRDTheproteinincludesamethylatedDNAbindingdomain(MBD)andatranscriptionalrepressiondomain(TRD).MeCP2isatranscriptionalrepressor.MutationsinthegeneencodingMeCP2causeRettSyndrome,aneurologicaldisorderaffectinggirlsprimarily.88ExampleofaproteinwithdomaResultofanMeCP2blastpsearch:Amethyl-bindingdomainsharedbyseveralproteins89ResultofanMeCP2blastpsear这些蛋白质的大小差别很大,并且结合甲基化DNA的结构域也出现在蛋白质的不同位置上。从BLAST的匹配结果看,这些蛋白质除了甲基化DNA结构域以外没有其他序列上有显著相似性的区域了
90这些蛋白质的大小差别很大,并且结合甲基化DNA的结构域也出现多个拷贝的结构域Occurringoneormoretimes很多结构域在蛋白质中有多个拷贝,两个最常见的例子就是免疫球蛋白结构域和纤连蛋白重复区。这些结构域在蛋白质的胞外区极其常见91多个拷贝的结构域OccurringoneormoreAreproteinsthatshareonlyadomainhomologous?蛋白质家族是怎么定义的呢?是否一组仅共有一个结构域的同源蛋白质就可以被称为一个蛋白质家族呢?上面的例子中,5个蛋白中的MBD结构域显然是同源的(来自于同一祖先);虽然它们除了MBD结构域外没有显著相似的区域,但是这组蛋白仍旧构成一个蛋白质家族。
92Areproteinsthatshareonlya蛋白质家族蛋白质家族是根据蛋白质的同源性来定义的;同一个家族内的蛋白质就是一组进化上相关的蛋白质,这些蛋白质共享一个或多个结构域。什么逻辑?1.在一级结构比较的基础上,发现很多蛋白质存在同源性;2.(相似性往往是区域性的)一些同源性可以简单的用结构域加以表征;3.为了(计算机分类)方便,由结构域将相关的蛋白质归属为一个蛋白质家族。在蛋白质家族分类的过程中,有时向下细分为亚家族(subfamily),有时又向上归并为超家族(superfamily)93蛋白质家族蛋白质家族是根据蛋白质的同源性来定义的;同一个家族Challengesfor“家族分类”并系同源蛋白:
类视紫红质受体超家族:视觉、听觉、嗅觉、激素、神经传导的受体
脊椎动物进化过程早期分化而得到的不同视觉受体对不同的波长敏感人类视觉系统受体包括对红光和绿光等长波敏感的各种蛋白质分子,它们之间区别不大,其序列相似性程度为95%左右。这些视觉系统长波受体分子与蓝光等短波受体分子以及视紫红质等非色彩受体分子却相差很远,序列平均相似性为43%。可见,由种类繁多的并系同源蛋白和直系同源蛋白所产生的序列复杂性,对蛋白质家族分类研究是一个巨大的挑战。
94Challengesfor“家族分类”并系同源蛋白:94两个“家族”牛胰核糖核酸酶家族。丝氨酸蛋白抑制剂家族。95两个“家族”牛胰核糖核酸酶家族。95Exampleofamultidomainprotein:HIV-1pol1003aminoacidslongcleavedintothreeproteinswithdistinctactivities:--aspartylprotease(天冬氨酸蛋白酶
)--reversetranscriptase(反转录酶
)--integrase(整合酶
)WewillexploreHIV-1polandotherproteinsattheExpertProteinAnalysisSystem(ExPASy)server.Visit/HIV-1的pol(polymerase,聚合酶)96Exampleofamultidomainprote97979898SwissProtentryforHIV-1pollinkstomanydatabases99SwissProtentryforHIV-1polProDomentryforHIV-1polshowsmanyrelatedproteins100ProDomentryforHIV-1polshoProteinscanhavebothdomainsandpatterns(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 盘锦金芳地丽都小区建设项目申请报告
- 肌肉痉挛病因介绍
- 睾丸肿大病因介绍
- 智能制造生产线技术及应用 教案 7-1 数控加工产线联调
- 2024版房地产买卖合同(含税费)3篇
- 四边形单元测试题课件
- 淋病性关节炎病因介绍
- (高考英语作文炼句)第2篇译文老师笔记
- 开题报告:指向创造性思维培养的工科大平台课程教师教学素养研究
- 开题报告:预防乡村校园欺凌-基于生命关怀主题的小学生命科学教育实践研究
- 机关单位工会迎新春文体活动方案
- 2024秋期国国家开放大学专科《纳税实务》一平台在线形考(形考任务一至四)试题及答案
- 2024年大学生信息素养大赛培训考试题库500题(含答案)
- 《药物化学》甾体激素类药物 试题(含答案)
- 飞灰螯合物运输服务方案
- 2024年江苏地区“三新”供电服务公司招聘320人(第二批)高频难、易错点500题模拟试题附带答案详解
- 金属非金属地下矿山安全生产标准化定级评分标准(2023版)
- ISO 22003-1:2022《食品安全-第 1 部分:食品安全管理体系 审核与认证机构要求》中文版(机翻)
- 安全生产文明施工措施费用一览表
- 期末复习资料(知识清单)-2024-2025学年人教PEP版英语四年级上册
- 2024秋期国家开放大学《可编程控制器应用实训》一平台在线形考(形成任务4)试题及答案
评论
0/150
提交评论