《基于质谱的定量蛋白质组技术规程》编制说明_第1页
《基于质谱的定量蛋白质组技术规程》编制说明_第2页
《基于质谱的定量蛋白质组技术规程》编制说明_第3页
《基于质谱的定量蛋白质组技术规程》编制说明_第4页
《基于质谱的定量蛋白质组技术规程》编制说明_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2本标准基于卫健委/科技部国家重点研发计划《医学生命组学数据质量控制关键技术研发与应用》(2018YFC0910200,2018年立项,2021年结题)和广东省重点领域研发计划《多组学整合技术研发及标准化组学数据质量控制技术的推广应用》(2019B020226001,2023年9月提出申报,根据中国国际科技促进会标准化工作委员会[2023]中科促标字第982号文件:关于开展《基于质谱的定量蛋白质组技术规程》团体标准立项通知,正式确立立质谱是目前蛋白质组学研究的主流技术,可以一次性分析复杂样品中上万种蛋白质。但质谱的重现性一直是一个很大的问题。同一个样品做两次质谱实验,鉴定到的蛋白质都有较大的不同,重现性(即两次都能鉴定到的蛋白数量占总鉴定数的百分比)一般只能达AcquisitionofallTheoreticalfragmentions,SWATH)质谱技术中被重复鉴定到,而SWATH已经被认为是重现性相对较高的质谱技术了。《Science》曾组织专题研讨会讨论如何提高质谱的重现性,指出现有质谱的重现性远远不能满足生物标志物的要求。重现性问题如果不能得到很好的解决,那么基于质谱的生物标志物发现及临床应用将十分困难。对于定量蛋白质组学研究,因为样品制备流程、质谱平台和分析流程常常不一致,加大了蛋白质组学在精准医学中的应用难度;此外,Hela细胞蛋白酶解的标准品作为一种高度验3证的哺乳动物蛋白消化物,可用作复杂蛋白质组学样品的质谱分析的质控样品被人们广泛使用。然而Hela细胞因其存在超强的种内污染和种间污染而存在广泛争论。基于以上领域内存在的诸多问题,我们利用多组学技术手段评估并开发出一种或多种可作为蛋白质组标目前国内外均无相关的标准流程,各蛋白质组学研究单位处于各自为战的状态。流程本标准对样品采集、处理、运输、质控和检测以及数据产生、质量评估和数据分析全流程进行标准化和规范化。该标准的特点是:流程标准化,可应对各种类型样品蛋白质提取和制备需求,同时保持结果的重现性,对样品保存运输的要求低;开发出了具有极高蛋白质组稳定性且可稳定传代的蛋白质组标准品细胞株:MHCC97H,可用于监控实验流程或本标准参加起草单位:暨南大学、华南理工大学、北京师范大学、中国科学院大连化学物理研究所、福建农林大学、福建省妇幼保健院、上海易算生物科技有限公司、布鲁克本标准主要起草人:张弓、陈洋、余卓、卢少华、赵晶、李亚星、范小路、杜红丽、参加单位工作分配:深圳承启生物科技有限公司负责标准方案的制定及网页发布;深圳承启生物科技有限公司、暨南大学、华南理工大学、中国科学院大连化学物理研究所、北京师范大学、福建农林大学、福建省妇幼保健院、上海易算生物科技有限公司和布鲁克生物科技有限公司参与了标准方案的实验测试和质量评估;暨南大学、深圳承启生物科技有限公司进行了标准起草和编制说明编写,其他参与单位对标准各个版本的全部内容提出42019年1月至2019年6月,标准起草单位组织相关技术人员对标准项目进行了预研,课题组成员广泛收集了国内外基于质谱的定量蛋白质组技术的应用现状及技术发展趋势相关2019年7月至2022年4月,标准起草单位对标准草案进行实验验证和技术论证并确立了基于质谱的定量蛋白质组技术从采样、前处理、运输、质控和检测以及数据产生、质量评估和数据分析全流程,形成了《基于质谱的定量蛋白质组学技术规程》的初稿,并于2023(/Resources/omicsSt2022年8月,国家卫生健康委医药卫生科技发展研究中心组织专家对本标准流程初稿进行评审,参会专家做“基本完成主要相关考核指标”的评价,建议进一步加强相关数据2022年9月至11月,编制组针对收集的意见,对标准进行了补充和完善。包括:1)增加了蛋白质提取质量检测标准;2)增加了使用MHCC97H标准品及标准数据集进行数据质量控制的内容;3)在暨南大学、华南理工大学、北京师范大学和布鲁克生物科技有限公司2022年12月,向广东省科技创新监测研究中心组织的专家组进行总结报告,专家组考察了标准实施场地,审阅了相关资料并进行了咨询。项目开发技术已在多家机构推广应用,本标准由深圳承启生物科技有限公司提出,由暨南大学和深圳承启生物科技有限公司主编,其他单位共同参与起草,于2023年9月提交团体标准《基于质谱的定量蛋白质组学5技术规程》的立项申请书,经中国国际科技促进会标准化工作委员会及相关专家技术审核,2024年1月,中国国际科技促进会标准化工作委员会完成了对本标准内容的审核并提出对格式重排和规范书写的意见,编制组进一步参考标准书写规范,修改和完善了标准文本内容,形成了《基于质谱的定量蛋白质组技术规程》团体标准征求意见稿和团体标准编2024年2月,本标准由中国国际科促会标准化工作委员会,在全国团体标准信息平台二、标准编制原则、主要内容及其确定依据,修订标准时,还包括修订前后本标准的制定工作遵循“先进性、适用性、可操作性、实用性、规范性”的原则,依63.1蛋白质组标准流程可极大提高大肠杆菌蛋白组的重复性本项目前期已初步建立蛋白质组的制备分析全流程,并已研发获得极为稳定的蛋白质标准品,据此,我们利用前期研究成果进一步验证流程和标准品的稳健性。细菌中半数以上的蛋白质编码基因是由两个或两个以上的基因组成的多顺反子操纵子所组成。操纵子组织是否维持操纵子内基因的化学计量表达仍有争议。在本研究中,我们进行了一项无标记、与数据无关的采集超反应监测质谱(HRM-MS)实验,以定量指数期的大肠杆菌蛋白质组,并顺反子操纵子。我们发现翻译调控在很大程度上有助于蛋白质组的复杂性:对于化学计量,较短的操纵子往往比较长的操纵子受到更严格的控制;主要编码复合物的操纵子比主要编码代谢途径的操纵子更严格地控制化学计量。基因间隔(一个操纵子中相邻基因之间的距离)可以作为化学计量的调节因子。催化效率可能是一个操纵子编码的酶的差异表达的驱动力。这些结果说明了操纵子调控的多面性:操纵子统一转录水平和基因特异性翻译水平。这种多水平调控通过优化代谢途径的生产力效率和维持不同类型的蛋白质复合物而有益于为了评估HRM-MS方法的定量能力和再现性,我们应用自研标准品对质谱进行标准测7可溶性蛋白进行了两次生物学重复实验。当使用先前的鉴定标准(至少一种独特肽,肽长对几乎相同的蛋白质进行了定量:仅在一个重复中对少数蛋白质进行了定量(图1A)。在严格标准下为两个独特的肽和至少七个氨基酸的肽长度。即使在严格标准下,我们仍以高再893.2翻译组可作为指导蛋白质组质量控制的独立数据集到目前为止,在质谱蛋白质组鉴定的时候依然有超过一半的谱图无法被鉴定。开放式搜索(OpenSearch)策略很早就被提出用来解决这一问题。但是OpenSearch的搜索策略的鉴定结果可靠程度一直难以评估,也缺乏一套完整系统的使用手册。我们提出使用翻译组测序数据作为最小化库对OpenSe发现率(SDR)作为参考指标对OpenSearch策略和限制性搜索(NarrowwindowSearch)这对于促进容差搜索策略的发展有重要意义,并且能帮助我们更好地认识那些无法被鉴定所有RNC-seq都是以非常高的通量下1基酸修饰进行预先的设置,包括固定修饰或者可变修饰。在通常情况下,氨基酸的修饰千变万化,无法准确地清楚所有的氨基酸修饰的具体情况,那么较为经典的做法是对氨基酸进行占比例较大的一些修饰进行预先的设置,例如半胱氨酸的烷基化修饰和蛋氨酸的氧化1仅需要更多的计算也会导致鉴定结果的准确性的下降,因此,我们在这里只进行两种占比例较大的氨基酸修饰进行预先的设置,分别为半胱氨酸的烷基化修饰和蛋氨酸的氧化修饰。通过不同的修饰设置的组合对相同数据集进行Narrowwnce=10ppm我们发现对于一般的搜库软件如pFind,增加可变修饰会使得鉴定结果的开放搜索策略的关键是允许更大的母离子质量容差,以耐受由修饰引起的质量偏移。然而,这也将导致允许更多假阳性的副作用。允许较小的母离子容差在理论上应该会降低的较高误差,因此更严格的肽FDR应有助于控制质量。胱氨酸氨基甲酸乙酯化设置为可变修饰还是固定修饰,均可将开两个搜索引擎获取的身份信息的一致性反映了身份识别质量的提高。在所有数据集中,13.3利用翻译组发现隐藏的非编码基因来源蛋白质组人类基因组上已知大约有5万个基因,其中约2万个被标注为可以表达蛋白质的“编码基因”,而另外3万个基因被标注为“非编码基报道中,除了部分非编码基因可以表达为小肽行使调控功能外,也有个别lncRNA被发现实际上能翻译成>50氨基酸的蛋白质,例如CLUU1,ESRG等,问题是,如果这种情况不是个案而是普遍存在的现象,则确实存在部分“编码基因”被错误地标注成了“非编码基1meprofiling计算模型认为章,仅仅是调整了计算模型,认为lncRNA可能编码蛋白质,然而其始终拿不出蛋白质实“新蛋白质”,但随后便被人类蛋白质组组织(HUPO)爆出其分析不合规范,存在大量的假阳性鉴定,在用较严格的标准进行质控后,这些所谓的“新蛋白质证据”几乎都被认定为假阳性。因此,如何避免蛋白质组学质谱技术的固有缺陷,提供独立的蛋白质编码信息源,正在被翻译,且可能以经典翻译起始方式翻译出>50氨基酸的蛋白质。利用目前公认的验确的细胞定位,功能实验也证实它们以蛋白质形式(而非RNA形式)行使着明确的生物学11总蛋白质的鸟枪法蛋白质组学分析。我们认为根据以下标准进行鉴定是有把握的:(I)蛋白括蛋白名称、唯一肽序列、肽长、搜索引擎,1集方法,包括多反应监测(MRM)和平行反应监测进行片段化和定量。可通过添加合成肽作为样品中这些肽的进一步定量的加样标准来辅助上允许的重标记标准肽。我们可以通过数据相关采集(DDA)分析确定313项标准中的206接下来,我们使用含有抗原表位的特异性肽制备了用于鸟枪法MS检测的四种新蛋白的多克隆抗体。免疫印迹结果显示,在各种人细胞系和人组织中,所有这些蛋白在预期分确保抗体的特异性,我们使用体外翻译的全长蛋白作为阳性对照,从细菌鲍曼不动杆菌和肺炎链球菌中提取的总蛋白作为阴性对照(图513.4全长翻译组的测序和蛋白质剪切变体的深度鉴定MinION三代测序平台的三代长读长测序,产生初始reads平均错误率大约为8.47%;对同一样品进行精度高、短读长的二代测序,用以对三代序列进行修正。修正后RNC-mRNA全长测序误差最终控制在约0.61%。该研究实现了翻译组的三代全长测序,并建立了相关实验和分析流程。相关成果发表于FrontiersinMolecular了15131个全长剪切变体序列,其中包体;建立了包含基因剪切变体信息的最小化参考蛋白序列库,鉴定到6766个来自于已知蛋白的不同全长剪切变体以及50个全新的蛋白剪切变体。该研究高精度地实现了蛋白质剪切变体的大规模鉴定,完善了相关的实验流程和分析流程,并发现了大量可翻译的新剪1本标准核心起草人张弓研究员,现为暨南大学翻译组学实验室负责人。国家优青,国家863青年科学家,国家万人计划青年拔事,中国分子系统生物学专业委员会委员。获美国化学学会颁发的会员奖。任国际人类蛋白质组计划(C-HPP)副主席,是中国人在C-HPP中的最高职位。建立了翻译组学新学科领域,首次实现翻译组全长测序,将中心法则定量化,对1972年诺贝尔化学奖理论“安芬森原则”作出重大更新,发现大量“非编码RNA”可编码蛋白质(暗蛋白质组)。翻译张弓研究院研发了一系列大规模测序和蛋白质组质谱的基础算法和实验策略,建立了第一个全国产化测序分析全流程并规模化商用,打破美国垄断,被新闻联播报道。建立核1研究领域一线的代表性高校、科研院所、技术服务及仪器供应商,可为本标准的执行和推对基于质谱的定量蛋白质组技术进行调研评估,搜集相关资料及研究结果,结合文献及众多科研项目,以及深圳承启生物科技有限公司内部标准化流程及评估标准,梳理出了具有代表性的关键步骤和通用流程。因此本标准规定了基于质谱的定量蛋白质组检测的主要内容,主要实验内容包括了:样品采集、保存和运输、蛋白质提取和质控、蛋白质酶解我们首先对数据产生的源头即样品开始了甄选,在各实验室,各平台广泛使用且容易生产培养的细胞系的基础上,选择代次之间稳定性最强的细胞株是组学数据产出的可靠保障。正常细胞系体外培养传代次数有限,因此选择多种恶性程度强的癌细胞系作为组学数可重复和可验证的稳定数据,这个结果不仅肯定了我们所建立的标准操作程序,还说明了MHCC97H是非常稳定的,可以作为标准物质进行长时间生产,可以在各个实验室广泛推广2使用。与此同时通过蛋白质组标准流程,我们对对大肠杆菌全蛋白质组进行了质谱测定。在两个不同菌株的全蛋白质组两次生物学重复测定中,实现了99.7%和99.8%的重现性,距离完美重现仅一步之遥。不仅重现性极高,其蛋白质鉴定数量也创造了大肠杆菌蛋白质在蛋白质组学数据质控方面,使用稳态细胞翻译组数据作为“标准答案”来评价开放式搜索蛋白质鉴定结果,质谱搜库结果中没有翻译证据的蛋白被认为是假阳性蛋白,属于“可疑鉴定”(SuspiciousIdentifications,SI而利用SI和有翻译证据的蛋白质(Translation-supportedIdentifications,TI)则可计算可疑鉴定率(SuspiciousDiscoveryRate,SDR),以此来反映蛋白质的潜在错误鉴定率。研究发现,开放式搜索结果的SDR可达限制性搜索的两倍甚至更多,强调开放性搜索若不进行有效质量控制难样水平。对比开放式搜索不同参数设置下的结果,发现FDR控制是开放式搜索质控最重要的影响因素,而质量容差值、可变修饰、酶切方式和色谱分离条件并不是影响SDR的主要因素。该研究首次将翻译组数据应用于开放式搜索策略的质控评估中,有效挖掘质谱数据此外,我们利用已经建立的蛋白质组学标准流程和翻译组学质控策略,成功发现疾病、神经退行性疾病以及其他的疾病相关,而对他们的功能研究主要的停留在转录水平上或者与miRNA相互作用等。然而,我们的研究提供了确切的证据证明462个lncRNAs可以翻译成具有功能的新蛋白质,而且数目可能不止462个,而是会更大。这一成果将推动lncRNAs研究领域从转录水平研究进入到蛋白水平的研究,也将会从根本上提高我们对疾病模型研究的认识。我们的研究成果,不仅丰富了人类基因组编码基因的参考库,2以上研究成果表明,蛋白质组学的标准操作流程和质控方法可以极大提高基于质谱技三、试验验证的分析、综述报告,技术经济论证,预期的经济效益、社会效 根据不同样品类型和检测目标准备足量样品 应选择溶解性强的蛋白质裂解液裂解样品,亦可采购样品溶解效果好、蛋白质提取效率高、酶解及质谱兼容的商品化蛋白质裂解液。为取得最佳的使用效果,可以适当将裂解F。如需检测磷酸化蛋白,必须加入含磷酸酶抑制剂的蛋白酶抑制剂化合物。裂解样品的1)常见的动物、植物、真菌等物种,包括人、鼠、水稻、拟南芥、酵母等,应尽量充分2破碎和溶解样品,但也需要尽可能减少不必要的破碎步骤,以减少样品损失;蛋白质3)血清、血浆、唾液、尿液、羊水、脑脊液、关节液等体液类样品,可不加蛋白质裂解 使用聚丙烯酰胺凝胶电泳(SDS)对样品进行质检,将所有蛋白质样品取等量色,脱色至背景透明无色后使用凝胶成像仪扫描获得样品的完整蛋白质组条带。样品结果SDS结果/2 器本身固有特性,其在长时间工作后会出现质量精度的偏移如不及时矫正,则会出现信息峰宽能够得到较好的定性定量效果。肽段碎裂信号的好坏决定了定性结果优劣,因此保证iRT标肽的出峰均匀说明色谱流出的一致性较高,保证了定量信息的最高覆盖及准确性。色谱半峰宽(FWHM)是衡量色谱效能的重要指标,大规模蛋白质组定性定量检测中采4.1.1MS1TIC(MS1色谱总离子流):各样品在色谱图梯度内谱峰尽可能的4.2.2MS2TIC(MS2色谱总离子流):各样品在色谱图梯度内谱峰尽可能的4.2.3RTFragmentDistribution(碎片离子保留时间分布):在色谱图梯度内不同样本中鉴定到的碎片离子数目基本一致。如出现的样品间峰型基本一致而强度波动较大,24.2.4RTPrecursorDistribution(母离子保留时间分布):在色谱图梯度内不同样4.2.5DeltaRT(保留时间偏差):通过iRT留时间越符合模型计算,在定量中越可以得到较好的矫正计算结果。DeltaRT/iRT推荐4.2.7Datapointsperpeak(每个峰采集的数据点):推荐4.2.8Capacity(色谱峰容量):峰容量图显示了超高效液相色谱(UPLC)色谱柱在分成功多肽的平均半峰宽。更高的峰容量代表更窄的色谱峰,也代表了更好的肽分离能力,检测到的肽段也就越多,通常FWHM会随着梯度拉长而变宽。对于采用自填柱的色谱,峰:(24.4.1ExperimentIdentificationFrequency(鉴定结果分布):组内各样品鉴定数因此缺失值会相对偏高,其缺失值比例主要取决于样品情况,其次是整个前处理和质谱流程中的重复性。组内的样品缺失值比例和分布不应出现太大波动,且可尽可能聚类到一起;4.5.3QuantityCV(变异系数):用于评估各观测值变异程度,即组内定量结果的重4.5.4Correlation(相关性):通常情况下,同一组内样本重复性越好,相关性就越按照本标准的方法,我们组织实施了关键性能指标的试验项目验证,实施验证的内容22评估蛋白通过目标-诱饵库(Target-decoy)搜库策略降低鉴定假阳性率,最终得到不同2流程,质控方法如下:采取超滤管酶解标准操作进行实验,酶解后对肽断除盐并进行肽断DA模式,不分组分。评估蛋白通过目标-诱饵库(Target-decoy)搜库策略降低鉴定假阳性率,最终得到不同实验室对同一样品的蛋白质定性及定量列表。同一样品蛋白质在四个实验室的测试下(暨南大学一个生物学重复,鉴定结果取交集),蛋白质的鉴定数量相对一致。对四个实验室蛋白质定量结果进行DDAiBAQ定量一致性测试同实验室定量重复性布鲁克生物科技有限公司的timsTOF的数字转换技术,能够在细胞和组织的定量蛋白质组学分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论