不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式_第1页
不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式_第2页
不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式_第3页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式新近研究表明,通过质谱法已建立了多种独特的血清多肽组表达模式 库,而血清多肽组表达模式与临床症状密切相关。阐明血清中多肽组成的序列 特征及其产生机制,将有助于将血清多肽组表达模式作为可靠的疾病标识而更 加广为接受。我们采用一种高度优化的多肽提Josep Villanueva, David R. Shaffer, John Philip, Carlos A. Chaparro, Hediye Erdjument-Bromage,Adam B. Olshen, Martin Fleisher, Hans Lilja, Edi Brogi, Jef

2、f Boyd, Marta Sanchez-Carbayo,Eric C.Holland, Carlos Cordon-Cardo, Howard I. Scher, and Paul Tempst Memorial Sloan-Kettering Cancer Center, New York, New York, USA摘要: 新近研究表明,通过质谱法已建立了多种独特的血清多肽组表达模式 库,而血清多肽组表达模式与临床症状密切相关。阐明血清中多肽组成的序列 特征及其产生机制,将有助于将血清多肽组表达模式作为可靠的疾病标识而更 加广为接受。我们采用一种高度优化的多肽提取方法和基质辅助激光解析

3、电离 飞行时间质谱(MALDI-TOF-MS技术进行的研究表明,仅靠一套有限的血清多肽 表达模式(一个特征),即可将 3 种类型的实体肿瘤患者和未患癌的对照受试 者准确地区分开来。 61 个特征肽段的靶序列识别结果显示,这些肽又可分为密 切相关的几个簇,大多数是由于造成肿瘤类型特异性差异的胞外蛋白酶活性影 响了体内结合蛋白质的水解过程和补体的降解过程而产生的。这一特征肽段家 族成员虽少、但功能极为强大,可精确预测前列腺癌样本的分级,其准确度与 其他标准方法可比。 总之,本研究表面,疾病的肽段标记物表达谱和蛋白 酶活性的差异之间存在直接的相互关联,而且,本文中所描述的几种肽段表达 模式在临床上有

4、望用作癌症检出和分级的标记物,同时我们的发现对未来的肽 段生物标记物的研究也具有重要的提示意义。 前言 近年来的科学进展, 包括基因组测序 1和模拟复杂的生物体系的新技术 2 有望帮助我们提高抗癌治疗 的水平。然而,目前的最佳抗癌治疗策略仍然有赖于早期发现及密切检测早期 复发,以便能够合理地调整治疗方案 3 。尽管如此,令人乐观的是,基因组和 蛋白质组研究的进展将为我们提供新的或改进原有的分子诊断手段,帮助我们 预测患者对个体化治疗的反应性,并据此将其进一步分成不同亚组 4,5 。良好的 生物标记物筛选方法,应当是创伤小而重复性好,最为理想的是通过简单的血 样或尿样检测即可检测出肿瘤组织特异性

5、分子。此外,筛选技术应足够灵敏, 既可检测出早期癌症,又可准确地将未患癌症者进行区分 3 。 虽然基因中 携带有遗传信息,包括癌症或其他疾病的遗传易感性,但在正常健康或疾病状 态时,真正赋予生物体的表现型的却是基因的产物。由于存在众多的蛋白质结 构、功能和降解的翻译后调节机制,仅靠对于基因的认识甚至已难以圆满解释 生物体系的复杂性。从筛选的角度来讲,由组织分泌或释放入血流中也主要是 蛋白6,7 。然而尽管经过了数十年的倾心研究,已鉴定的癌症生物标记物中,证 明确实具有临床意义的也不过寥寥数种蛋白、且全是血浆蛋白(如前列腺特异 性抗原PSA、癌胚抗原CEA、癌抗原125 CA125和甲状腺球蛋白

6、),常常 需要结合其他诊断工具才能预测患者对治疗的反应性、复发和生存率、对病情 进行分级和监测治疗效果,而无法用于大范围人群筛查 8,9 。而那些在血浆或血清中的浓度为纳摩尔级别的蛋白质,需要专门的放免试验才能检出并定量 10,11 。因此,发现新的、更好的癌生物标记,开发出简单易行的检测方法势在 必行。尽管目前已经有底物特异性的蛋白酶(如胰蛋白酶),可将复杂的蛋白 质混合物降解为肽段进行质谱分析,但由于仪器的动力学量程以及在统计学处 理之前,检测低丰度肽段所需的、与多次质谱检测相配合的复杂的分级分离过 程的限制 12 ,这类想法均尚未付诸实现。癌症过程中,细胞类型的转化和转化后表达高水平的蛋

7、白质和酶(如 PSA和PSMA的细胞的增殖13,14,不但使 已有血清蛋白(血清蛋白组)的变化 6,7 ,而且也影响到其代谢产物(血清多肽 组)。研究表明,人血清中含有数千种蛋白水解而产生的肽段 15,17,但这一复 杂的多肽组是否与整体生物的生物学事件之间存在密切关联,到目前为止尚属 未知。当前质谱技术的发展,已可以检测几个毫升的血清样本中成百上千的小 到中等大小的肽段 17,18,最近几篇报告已开始利用质谱相关技术对血清肽进行 定性和定量检测(常称为特征码或条形码),作为是否患有某种疾病(如癌 症)的指征 119-24 。不过,此类工作争议很大,因为越来越多的证据表明,临床 过程和分析化学

8、及信号处理过程中未经控制的变异可能会使研究结果可信度大 打折扣 12,25-29 。在分析过程中所应用的低级的质谱设备缺乏精确性,分辨率不 够高,再加上到目前为止仅阐明了少量的有争议的标记物的特征 130-32 ,使怀疑 论更加膨胀。如果几个不同的实验室分别证明了这些看似差异明显的多肽具有 相似的氨基酸序列,则可表明这一新技术确实具有潜在价值。然而到目前为 止,此工作尚在进行中。图1.对MS技术获得的3组癌症患者和健康对照组的血清多肽表 达谱的无监督分级聚类分析和主成份分析。 (A) 按照标准操作规程制备的健康 志愿者和晚期前列腺癌、乳腺癌和膀胱癌患者的血清样本。在自动固相多肽提 取和MALD

9、I-TOF M分析前随机分为4组。质谱图经处理后采用 Qcealign script 进行匹配,每个样品获得一个包含 651 个 m/z 值(换算后的离子强度) 的峰列表。图中数字代表各组中患者和对照组的例数。 (B) 采用标准关联作为 各癌症组与正常组间二元距离标尺的平均 -连锁分级聚类无监督分析。所有的峰 值均被采用。柱表示样品,横排为 m/z峰。树状图颜色编码方案同A。热图 中,标准化后的离子强度值为从 0(绿色)到 200(红色),中点为 100(黄 色)。(C) 3个癌症组和正常组的分级聚类分析(与 B相应)。(D) 3个癌症组 和正常组的主成分分析(PCA)。颜色编码同A。造成原始

10、数据变异的3个主要成 份见图。为完成这一目标,我们曾开发了一种利用反相磁珠俘获被分析物,借助于(MALDI-TOF)技术的自动操作程序以同时检测血清中存在的各种肽段 (18, 29) 。此系统的灵敏性优于芯片表面俘获 33 ,因为球状颗粒的结合表面积 较小直径斑点更大,因此结合能力也更强。与高分辨率MS或MS/MSK用时,可同时检测一滴血清中的数百种肽段,并且多数可不经再次分级而直接测定。 这一自动化特性使得操作方便,并保证了实验结果的重现性。为使此系统更趋 完美,我们还开发了一种基于最小熵的运算法则,简化并改进了质谱图的校准 和后续的统计学分析工作 29 。有了这些工具在手,我们再次探讨了是

11、否某种选 定的已知序列的血清多肽的表达模式可能有助于 (a) 将癌症与非癌症区分开, (b) 区别不同类型的实体瘤, (c) 利用一个独立的效验设置预测癌症的分级。图 2. 3 个癌症组和正常组受试者血清多肽表达谱数据选择和比较 分析。 (A) 各个癌症组分别与对照组进行 Mann-Whitney U 检验。只有校正 P 值小于 0.00001 的峰才能进入第二次筛选(峰强度中位数值 > 500 单位):如果可以通过 1个癌症组或对照组的阈值,则此峰入选。 (B) Venn 图显示一个癌 症组中强度升高或降低的多肽的总数目。 (C) 3 个癌症组和对照组选定特征的 热图的多元或二元比较。

12、柱表示每组样品数;横排为 m/z 峰(非以数字表 示)。二元比较中所用的肽段为各组中特别升高或降低者:多元热图包含有组 合的、不可归还的多肽数目。多级膀胱癌和乳腺癌热图的比例尺为标准化的强 度,范围为从 0(绿色)到 500(红色),中点为 250(黄色);前列腺癌的热 图为从 0(绿色)到 2000(红色),中点为 1000(黄色)。为达到这一目的,我们利用了目视检测光谱重叠、肽离子相对强度比较和统计分析,对 106 例晚期前列腺癌、膀胱癌和乳腺癌以及健康人的血清样本测得的精确的肽 表达模式的数百种特征性参数进行分类,以寻找最具有预测性的几种关键性多 肽。我们发现,将关键性多肽的范围大大缩小

13、至易于识别的少数(如仅限于特 征肽段)后,并未对分级预测产生不利影响。MS或基于MS的序列识别技术识别的 61 种特征性肽段,均为血液中高丰度蛋白的降解产物或相关产物。通过分 析疾病与蛋白水解模式的关系,我们发现,胞外蛋白酶的活性与体内蛋白质结 合及补体降解途径一起,不仅对癌症特异性多肽的产生有影响,还影响到癌症 类型特异性血清肽段的产生。结果对基于MS的血清样本中651个肽离子信号 的无监督分析,可区分三类癌症和正常对照我们分析了本研究所采用单标准临床规范收集到的 73 例癌症患者(其中晚期前列腺癌 32例,乳腺癌 21 例, 膀胱癌 20例)及 33 例正常志愿者的血清样本 29。年龄分布

14、、性别及临床特征 见补充表 1(本文章的补充资料可在线查阅 doi:10.1172/JCI26022DS1) 。 收集 到的样品采用统一方案处理,包括 2 次冻融后进行初次保存,随后抽样进行蛋 白质提取和MS分析29。全部106个血清标本作为同一批样本,利用专门的样品 处理系统进行全自动处理(包括采用包被 C8的磁珠进行肽段提取,洗涤,洗 脱,与基质混匀,上于 MALDI靶板)后, 在1小时内进行MALDI-TOF MS1动 分析(参见补充方法)。在同日内按照以往报告方法进行分析、计算机校准和 目视检测 12个参考样本/谱,以验证系统的重复性和再现性(参见补充方法) 18,29 。在随后的处理

15、和分析过程中,将取自不同癌症患者和正常人的血清标 本进行随机分配,采用专用的 entropycal 程序将处理后的质谱图对齐后 29,在 700- 15,000 Da的范围内共获得651个不同的质量与电荷比值(m/z值)。对 每个标本的 651 个峰强度进行标准化(信号强度减去本底,除以相应谱的总离 子流,再乘以换算系数 107)后,逐个进行无监督的平均 -连锁系统聚类分析。 二元和多元比较结果表明,患者与正常人及不同类型的实体瘤之间,肽段表达 模式迥然不同(见图 1)。图 3. 3 个癌症组和正常组受试者血清肽表达谱选定峰的 MALDI- TOF质谱图重叠。谱图按照方法部分所述获得后,进行匹

16、配和标准化,以质谱 图浏览器显示。除 2021.05(为大量的无组间差异的肽离子的代表)外,选定 可代表组间差异的肽离子的标准化强度。 24 处重叠区各代表一个癌症组与对照 组的谱图的二元比较结果(膀胱癌: n = 20 , 绿色;前列腺癌: n = 32; 蓝 色;乳腺癌: n = 21; 红色;对照组: n = 33; 黄色) 。其排列方式允许经标准 化后换算成同样大小的 3 个二元比较结果可在同样的质量范围窗内显示,各肽 离子峰显示的均为单同位素峰。 特征选择发现 68个肽离子特征可区别 3个癌 症组人群与正常组 对本技术的预期临床应用前景进行分析后,我们认为难 以将取自不同时间及不同地

17、点的人群标本的 651 个特征峰进行关联分析。因 此,我们采用判别分析进行了特征选择,以选出差别最大的峰。分别将3 组癌 症标本与对照组的 196 个峰进行 Mann-Whitney U 检验分析,其中至少一类癌症 的多重比较校正P值小于1 x 10 - 5,结果见图2。将每个样品群中所有肽峰 的离子强度中位值设为阈值时,肽段数目减少至 68 个(见图 2A 和补充表 2),此门槛的设置足以将质谱图中基于 MALDI MS/MSI联MS测序的大峰检 出,又可排除邻近峰或“峰肩”的干扰。当此标准在至少 1 个癌症组或对照组 可满足时,对应的 m/z 峰入选(参见补充表 2)。采用多级 Krusk

18、al- Wallis test检验(校正值P < 1 x 10 - 5),阈值设置同上,重复进行特征选择,分 别有214和67个峰入选。大多数入选的峰为分子量小于 2000Da的肽段;绝大 部分4000Da以上的分子被排除在外(见图2A和补充表2)。随后将所有样本 的质谱图用颜色进行编码和涂覆,目测对 68 个肽峰进行正确的分类和分度,并 区分癌症组和正常组的所有差异(如图 3 所示)。结果发现, 1 个(或多个) 癌症组的 47 个 m/z 峰的离子强度偏高, 23 个 m/z 峰的离子强度偏低(图 2B),而有趣的是,2个峰在1种癌症中偏高但在别种癌症中偏低。68个峰 中, 14个(

19、或升高或降低, 1 个是前列腺癌特异性的, 13个是癌症共有的)可 能包含前列腺癌的生物分子信号, 14个(11 个是癌症共有的)可能包含乳腺癌 信号,58个(43为膀胱癌特有的)可能包含有膀胱癌信号(见图 2B C)。图 2C为上述结果的热图(heat maps)形式,表明资料减少90%并未对临床分组产 生不利影响,同时还表明癌症特异性肽特征似乎不但能够反映不具有特异性的 炎症如关节炎和感染,还能够反映癌症,并且其特异性足以帮助我们区分正常 与癌症患者甚至不同类型的癌症。图4.采用MALDI-TOF/TOF MS/M技术鉴定血清补体 C4a的一个 片段肽段2305.20。1例乳腺癌患者的血清

20、样本经多肽提取和 MS分析后,采用 MS/M战术分析选定离子(见补充方法)。图中所示片段离子谱取自NR数据库中人片段的Mascot MS/MS离子研究 (/entrez/query.fcgi db=Protein)且找到一个序列 GLEEELQFSLGSKINVKVGGNS (MH+ = 2305.19;= 4 ppm)Mascot 打分为 38。 b 和 y 片段离子系列与限制性序列同时标出(上方箭头)。请注意, y 离 子产生于C末端,因此序列应向后读(见箭头方向)。图 5. 晚期前列腺癌、乳腺癌和膀胱癌的血清肽模式。经 MALDI- T

21、OF/TOF MS/M技术选定的肽段位于交叠序列簇,包括最初的68个单同位素m/z值中的46个(图2及补充表2)。另外23个肽经推测后采用靶 MS/MS分 析,与已知的序列簇匹配。总体上, 61 个肽段对于至少一种癌症具有明显的标 记物可能性(校正 P < 0.0002; 图 6) ,标成蓝色 26个(前列腺癌),绿色 50 个(膀胱癌)或红色 25 个(乳腺癌)。与对照组相比,这些肽段有的升高(空 心圈),有的降低(实心圈)。所有癌症组和对照组中, C3f (m/z = 2021.05) 和纤维蛋白素原a簇的1个成员(m/z = 2553.01)离子信号接近(见图3:2021 和图 6

22、) ,因此可作为有效的内标(黄色)。 6个肽段(粉色)为随机出 现。括号中的残基在本实验中未观察到,但或为全长的建立者多肽,或为胰蛋 白酶样切割位点处(Arg/Lys - Xaa)。图 6. 晚期前列腺癌、乳腺癌和膀胱癌的血清肽模式。本图中包 含图5中所列的69个肽段和已知序列的肽段(以 m/z值列出)的MS离子强度 和信号,并给出3个不同的Mann-Whitney U检验(柱6 -8)和1个多元 Kruskal-Wallis 检验(柱 9) 的显著性水平。实际信号(蓝色、绿色和红色) 由至少对一种癌症具有明确标记能力的肽离子(校正P值< 0.0002)。 校正 P 值为最主要的标准,最

23、终符合此标准的肽离子分别为前列腺26 个,膀胱癌50 个,乳腺癌 25个(与图 5 所示相同)。第二个柱列出的是对照组样本中每 个m/z峰的离子强度值的中位数。峰强度比值(柱 3 -5)为与对照组强度的比 值。比值为1的和更多信号,在当中位信号在某一种癌症中较高(r > 1.4)时底纹设为深灰色,在低于对照时(r < 0.75)设为浅灰色。Norm.:标准化的数 据。图 7. 与相应对照组相比,选定序列簇的离子强度值的中位数。 3 组中每个肽段的离子强度值的中位数标为与对照组的比值 (r = 患者/对照)。比 值绘在对数表中,范围 0.1-10 。左侧短线 (r < 1) ,

24、右侧短线 (r > 1) 分别表示 癌症组的离子强度值低于或高于对照组。患者和对照组间无明显差异的多肽接 近或与中央线重叠。 血清多肽组由种类不多但序列各异的几种序列簇组成 68种入选的多肽中,46种可为MALDI-TOF/TO方法(图4)、MALDI-Q/TOF MS/M鲂析和数据库搜索检出(图5)。请注意,图5中所列出的m/z值为单同 位素峰,故小于补充表 1 中所给出的相应的平均同位素的值。有趣的是,所有 的(而非仅一部分)肽段序列均集中于各组的C端或N端重叠区,并在相应的末端有梯状平截,事实上,有些匹配分数甚至低于门槛值(参见补充方法)的 序列,仍然被明确归为前体离子质量或入选为

25、某一特殊档的离子质量片段 (b 或 y),这是由于考虑到有限的CID模式可能与已建立的优势肽键断裂规则(34)不 完全相符而定。此外,根据靶向 MS/MS分析推测,另有23个多肽也可与某一特 定序列匹配,其中15个的判别式分析校正P值至少对一种癌症具有显著性(< 0.0002) ,但离子强度明显较低(图 6)。另两个( 2553 和 2021; 图 5、 6)在 各组中,具有非常高但相似的 MS离子强度,校正P值> 0.04,因而可用作准内 标。另外 6个多肽(图 5、 6)随机分布于癌症组合对照组,既无判别价值亦无 内标价值。我们发现此处得到的大部分肽段可分为 10或11个簇,这

26、并无特别 令人惊奇之处,因为最近的一项发现表明超过 250种的血浆多肽来源于约 20种 血浆蛋白,而且也是广泛重叠的簇 17。应当注意的是,我们采用了一种无偏差 的方法,从根据判别分析得到的多肽中先鉴别多肽标记物,再进行测序。这种 方法一般称为离子作图,可采用各种 MS平台获得35,36。肽段标记物的序列簇 来源于高丰度的血浆多肽和蛋白质前体三个序列簇来源于天然产生的血浆多肽纤维蛋白肽A (FPA)、补体C3f和缓激肽,这些肽段分别产生自或是体内 内源性途径早期血浆蛋白的胞外蛋白降解过程(缓激肽产生于高分子量激肽原 被激肽释放酶降解的过程中),或产生于血浆制备过程中(纤维蛋白素原N末端被凝血酶

27、裂解而产生FPA C3转变为C3b后经因子I和H作用而释放C3f) 。全长的建立者肽( founder peptides )末端为 Arg 或 Lys ,之后是一个 疏水的氨基酸如 Val, Leu, 或 Phe。 C3f 和缓激肽去掉了 Arg 而形成去 Arg- 缓 激肽。其它肽段簇也由类似的胰酶样降解作用而形成(见后文)。 39个酶切位 点中,21个是C末端碱性氨基酸之前存在一个疏水氨基酸(F、L、V、I、W或 A),15个为S Q或 N (见补充表4)。典型情况是,Arg/Lys全部或部分被羧 肽酶降解掉,除非之前有一个 Pro (3/3 )或者有时是Vai (2/4 )。此后C端或

28、N端才进行进一步的胞外降解作用直至完全降解或中途停顿,产生许多或者各 式中间产物(见图 5及补充表 3),此过程周而复始,在各个簇中重复发生(见后文)。诊断性的MALDI-TOF质谱模式中包括N末端FPA和 C3f降解物,此前在心肌梗塞患者的血清中曾经报告存在这两种多肽 30。而与此相反, 我们在对照血清中共检测出 19种多肽,在癌症患者血清中,这些多肽有的持续保持很低水平(如各种癌症患者中所有的FPA片段和乳腺癌患者中3C3f片段),有的则呈高水平(如膀胱癌和前列腺癌中的几种C3f片段和乳腺癌中的一种FPA片段)。全长C3f在各样本中均为较高水平且接近,而膀胱癌患者血 清中几乎见不到全长FP

29、A这些样本中均未检出纤维蛋白 B及其片段。与以往 报告的卵巢癌患者血清磷酸FPA水平升高(电喷射离子化 MS法,31)和胃肠 道癌症及乳腺癌患者FPA水平升高(免疫化学法检测,39,40)不同,我们的结 果显示,前列腺癌、膀胱癌和乳腺癌患者血清中FPA水平降低。图8.研究总览。简图中显示了用于开发及验证 68个肽离子和前 列腺癌的 26 个序列已知的特征性血清肽(图 5,蓝色)的方法。画圈的数字表 示在研究各阶段选定肽段的总数目。缓激肽被认为是一种癌症生长因子,研究人员曾对其各种拮抗剂的抗癌作用进行过测试 41。我们则发现,乳腺癌患 者血清中缓激肽和去 Arg- 缓激肽的水平均升高,而膀胱癌患

30、者中却是降低的 (见图 5)。各种多肽的羟基化形式 (42)prohydroxylated forms也呈类似趋势(结果未显示)。缓激肽及 FPA的来源,蛋白纤维蛋白素原?和HMW激肽 原,各自形成一种序列簇,成为癌症的特征性多肽,其位置与前体序列不同 (见图 5,图 7 和补充表 3、 4)。有趣的是,缓激肽与其他激肽原来源的多肽 具有相反的标记特性。例如,膀胱癌中缓激肽和去 Arg- 缓激肽的离子强度较正 常组降低,而其他肽段 (如1944 和 2209)则相对升高(见图 5、 6)。以往常有 草率的解释,认为某些肽段的离子强度相对于正常人偏高或偏低是由于原始蛋 白上调或下调所致,本文的观

31、察结果直接反驳了这一论点,很显然,HMW缓激肽的水平不可能同时既上调又下调。多肽2724 (见图5)是来自交联-a -胰蛋白酶抑制物重链(ITIH4)前体43包括第662 - 687位氨基酸(补充表3、 4),由于含两个激肽释放酶酶切位点(Phe-Arg - Xaa)而得名。第662 - 687位 氨基酸残基似乎是一种功能未知的前肽 44 ,与缓激肽相似,末端也是 Pro- Phe-Arg。几个较长的ITIH4前体片段,包括3272 (第658 - 687位氨基酸), 横跨第一个激肽释放酶酶切位点,是早期卵巢癌的生物标记物 32 。进一步研 究表明,仅仅改变ITIH4簇N末端的几个氨基酸即可产

32、生对于不同癌症具有选 择性的离子标记。例如肽段 3971 和 3273 的离子强度中位数在膀胱癌中水平最 高,而肽段 2358 和 2184 在乳腺癌中最高,前列腺癌中肽段 2271 水平最高。 肽段2115与ITIH4的一种剪接异构体序列匹配(PRO1851;见补充表4),似乎 对各种癌症都具有标记作用,特别是膀胱癌和乳腺癌(见图6)。另一个簇包括2X4个肽段,位于Ile-Arg Xaa酶切位点的一侧,来源于补体 C4a前 体45(见图5和补充表3、4)。此C4a簇在乳腺癌中作为离子标记物的发生率 最高,超过所有其他簇,也超过 C4a来源的膀胱癌标记物(表6)。此簇中仅 有一个离子(肽段 1

33、763)是前列腺癌的标记物,同时也是其他两种癌症的标记 物。另外,源自 即oA-l、即oA-IV和 即oE的离子标记物除1个外、均具有膀胱 癌特异性,且离子强度均较高;肽段 1971例外,是乳腺癌中最为显著 (P = 5.5 X 10- 13)的离子标记物。图 9. 用于验证多肽特征性生物标记物的独立前列腺癌血清样 本。(A)实验设计见图8及结果部分。(B)对PR1 PR2和对照组的分级聚类分 析。采用了 3个二元比较中具有统计学显著性的 68个肽离子和组成前列腺癌特 征性的 26个序列已知的肽段,其余的近 650个肽离子未予处理。标准化离子强 度的热图比例范围为从 0(绿色)到 2000(红

34、色),中点为 1000(黄色)。 (C) PR1和PR2组与对照组的主成分分析,肽离子同 B。图中显示了造成原始数据差异的前3个主要成分。 表1采用SVMt分析651个特征肽段,68个特征肽段 和 26 个特征肽段对一个前列腺癌效验组进行分级预测No. m/z binsBinaryMulticlass651100% (41/41)97.5% (40/41)68100% (41/41)97.5% (40/41) 26 100% (41/41) 97.5% (40/41)预测正确的百分率列于表中。 41 例患者中, 40 个预测正确,双 侧95刑信区间为87.1 - 99.9%; 41个预测正确的

35、区间为91.4 - 100%训练组 为 PR1 与对照组(二元)或 3 个癌症组与对照组(多级)。 m/z bin :已鉴定 的 m/z 值 ( 多次质量测定 ) ( 见补充方法 )。 免疫组化研究证实,丛生蛋 白(如 apoJ) 上调与前列腺癌和膀胱癌都相关 46-48 。我们检测到前列腺癌和膀胱 癌患者血清中长度为10个氨基酸的丛生蛋白片断(位于 C末端)的浓度升高(补充表2、3)。切断Val-Arg - Xaa键分离丛生蛋白(N-t)和(C-t)后,一次 单酶切足以释放此肽段。因此,一个长度为 6 个氨基酸的亚片断作为膀胱癌标 记物更为显著(表5、6),这与其他大多数来自 apoA-l,

36、 apoA-IV 和apoE的 肽段变化趋势相同。最后,两个离子(肽段 2602和 2451)与 XIIIa 因子和 transthyretin 来源的肽段相应(图 5、 6),在乳腺癌中的强度高于正常 人。肽段2602对应于XIIIa因子前肽(37个氨基酸)的C端25个氨基酸(补 充表 3、 4)。有趣的是,乳腺癌中 XIIIa 因子自身是下调的 49 。尽管我们尚不 清楚在本研究中患者血样是否具有同样的变化,但是进一步反驳了离子强度升 高是由于前体物上调所造成的这一论点。 癌症特异性肽段包括选自几种不同序列簇的肽段 图 5 中列出了 69种血清肽段(匹配信息见图 6)。其中 61个 对于至

37、少一种癌症具有明显的 MALDI-TOF MS离子标记能力(校正P < 0.0002) ,分别标成蓝色(前列腺癌)、绿色(膀胱癌)和红色(乳腺癌)。结 果表明,三种癌症的特征肽段分别为前列腺癌 26个,膀胱癌 50 个,乳腺癌 25 个,某些肽段还同时出现在两种或三种癌症中。与健康对照相比,某种特定癌 症组中离子标记物的强度值的中位数可能升高(图5)也可能降低:前列腺癌中 16 个升高, 10个降低;膀胱癌中 30个升高, 19 个降低;乳腺癌中 19个升 高,6 个降低。强度值升高或降低的肽段中,均只有 3个肽段为各癌症组所共 有。来自C4a的一个肽段和ITIH4簇的2个肽段在所有癌症

38、组中的离子强度均 高于健康对照,而3个FPA片断则在所有癌症组中均降低。其他的离子标记物 或为 2 个癌症组共有、更多见的则是专属于某一癌症组(图5)。应引起注意的是,9个apo肽段和3个C3f肽段在膀胱癌中具有较高的离子强度;4个C4a 肽段、 2个缓激肽肽段和 1个 transthyretin 片断在乳腺癌中强度升高; 3 种在 乳腺癌中特异性降低的肽离子都来源于 C3f。有趣的是,某些共同标记物离子 在一种癌症中强度升高,但在另一种癌症中表现为降低(图5、6)。例如,乳腺癌标本中 5 个肽段的离子强度都较正常组升高,但在膀胱癌标本中,这些肽 段的强度降低,而对于前列腺癌则全无标记物意义。

39、 ITIH4 肽段( 842; HAAYPF) 在前列腺癌中强度相对较高,但在膀胱癌却几乎检不到。从上述结果,难以阐明究竟那一簇或哪一长度档的肽段序列在何种癌症中具有何种变化规律或 趋势。为了探索这种规律,或者至少能够更好的显示可能存在的差异,我们标 出了各癌症组与正常组中 4 个主要簇的各个肽段的离子强度值的中位数比值( r =癌症/对照)。图 7中,中央线代表无差异 (r = 1) ,左侧的短线 (r < 1) 代表较 低的中位数比值,右侧(r > 1)的短线代表较高的比值。在FPA阶梯状肽段中, 几乎所有癌症的离子信号都小于正常组,各癌症组中每个肽段都存在差异。应 注意,膀胱

40、癌患者血清中全长 FPA似乎完全消失。其他3簇则均有显著的内部 变异和中位强度比值变异,大多数超过 1,也有等于 1 和小于 1 者。对 4个表 (33 X3个数据点)进行目视检测的结果见图7,3种癌症可被明确区分开。膀胱 癌血清中,C3f簇中肽段的离子强度显示升高趋势,C4a和ITIH4簇的变异较 大;而在乳腺癌中,C3f簇肽段的离子强度较低,C4a簇的离子强度升高;前列 腺癌中,离子强度变化趋势与前面两种癌症中不同,而 ITIH4 簇中某些短肽段 的变化更为明显。有趣的是, C3f, C4a 和 ITIH4 簇中,各有一长度档在对照组 中几乎为 0,而在三种癌症中都具有高的离子强度中位数比

41、值。图10.血浆胞外蛋白酶降解人工合成的 C3f与内源性血清多肽(来自C3前体)的水解模式相似。新鲜血浆 MALDI-TOF MS读数(上方面板) 显示除缓激肽和去 Arg- 缓激肽外,血浆小肽段的水平极低。加入人工合成的 C3f(1 pmol/ml 血浆), 1 份立即取出,其他的在 15分钟后取出。样品放置于室 温。中间的面板显示C末端Arg在几秒钟内被羧肽酶剪切。随后 C3f被氨基肽 酶活性进一步降解形成与血清中固有梯度相同的序列梯度。Brad ( - R):去掉C末端 Arg 的缓激肽;R: Arg; RI : Arg-lle; H : His; T : Thr; I : lie; K

42、 : Lys; S : Ser.图 11. 血清蛋白酶活性。多数肽段经 2步蛋白水解而产生。组合正确 时, 6-12 个不同的簇中, 1 个以上成员表现出具有诊断意义的离子强度特征 (经直接MALDITOF M测定),可预测癌症及其类型。氨基酸序列标成彩色, 代表观察到的簇中的两个离子 C3f簇序列(左)和FPA(右)。综上所 述,根据统计学分析(图 6)、目视检测(图 3)、肽段测序(图 4、5)以及 相对离子强度分析,图 7 的资料表明人血清肽组以特征性肽段的形式包含有可 区别癌症与正常的信息及区分 3 种癌症的信息。 肽离子信号可精确预测经过其 他外部效验的前列腺癌样品的分级 为了评价识

43、别的标记物的强度,我们检 测了一组 41 个取自晚期前列腺癌( PR2) 的独立血清样品中的肽段信号(图8、9A)。前列腺癌标本随机分入训练组(prostate 1 PR1)或实验组(PR2),但保证具有相同的人口统计学/病理学参数(如年龄、PSA水平、Gleason评分 和存活时间)。实验组中无既往曾经接受监督分析者,因此可用于估计真实的 预测精确性。对这 41 例标本经过标准规程分析后,得到一份新的表格,其中也 包含了原先 106 份训练样品中的所有资料。将特征第二列中列出的肽离子 (68 个肽段;见图2A、8)和前列腺癌中的肽段信号(26个测序的肽段;图5、6)用于 进行对照组、PR1和

44、PR2组分级聚类分析(图9B)和主成分分析(图9C)。 PR1和 PR2的样品为与对照组差别最大的样品。分别对 3组中这26个肽离子进 行比较的结果表明,PR1和对照组之间,26个肽段全部具有统计学差异(校正P 值 0.0002,见图6) ; PR2和对照组间,23个差异显著;而在PR1和PR2间仅 有一个肽段有差异。最后,对 651 个、 68个和 26个选出的肽段分别进行了基 于SVM的二元或多元分级预测,二元和多元分级预测的灵敏度分别为100%(41/41) 和 97.5% (40/41) (表 1),与前一方法相近。 血浆中氨基蛋白酶活性 可使人工合成的 C3f 产生一组梯状序列 本研

45、究显示,血清多肽组似乎主要 为固有酶作用底物的产物,而且更像是其蛋白水解的产物,这与以往报告相符 (17), 因此可代表血浆中存在的在血液凝固时激活的蛋白酶的种类。除缓激肽 之外,我们观察到的血清中多肽的浓度均高于血浆(图 10,数据未显示),此 机制与体外凝血和补体激活一起参与几乎所有簇的建立者肽段的产生过程。采 用肝素抗凝试管制备的血浆多肽更接近于低水平凝血和肝素诱导的补体激活时 的产物( 17, Villanueva 和 P. Tempst, 未发表的研究结果 )。很显然,诱导 的血浆和血清多肽组被胞外蛋白酶活性放大,可部分甚至全部解释我们观察到 的差异。本研究结果提示,癌细胞可能产生独

46、特的蛋白酶(可能是胞外酶), 导致微妙的但具有特征性的上百种人血清中可溶性多肽的复杂平衡发生变化。 为了证实胞外酶的存在及其作用,我们将人工合成的 C3f 加入新鲜血浆中使接 近血清终浓度。结果见图10,C3f迅速降解,C末端的Arg的几秒钟内即被切 掉,N末端切割也在10-15分钟后开始。此模式接近于血清中观察到的内源性 过程,也可说明其片段长度梯度的不同长度档的片断离子强度为何各异。不 过,除最小片段之外,大多数 C3f降解产物在延长孵育时间后消失(未显示此 数据)。人工合成的FPA在血浆中被胞外蛋白酶降解的过程也有类似的过程, 而纤维蛋白肽B (FPB)则在数分钟内被彻底降解(未显示此数

47、据),这可以解 释为何在我们的血清表达谱分析时从未检出过其内源性形式。本结果提示,血 浆和血清中胞外蛋白酶的工作浓度和活性基本相同,因此可排除凝固过程的影 响。 讨论 在寻找具有临床意义的生物标记物时,研究者未给与血清蛋白 质组的低质量段、特别是分子量低于 3000Da的多肽和高分子量段多肽及蛋白同 等的重视。那些更小的、原先就存在的小肽段难以被全蛋白组胰蛋白酶消化物 的高通量液相色谱/固相色谱-MS/MS分析检出,在有利于检测5-15kDa范围内 的多肽的基于SELDI-TOF MS技术的筛选中也难以得到很好的分析19-24。本试验 和Koomer等最近报告的一项分析中,首次给出了血清和血浆

48、肽库的详细信息。 总的说来,MALDI-TOF M方法检测到的大部分人血清肽产生自体内内源性蛋白酶对内源性底物的降解作用。如图 11 所示,多肽的产生发生在内源性凝血途径 和补体激活过程中的蛋白水解级联反应 50 。这些多肽中,有的是已知的生物活 性分子,有的是降解的前肽,有的则是前提蛋白的随机内切片断。不过,所观 察到的切断位点一般均与胰蛋白酶和已知丝氨酸蛋白酶(如激肽释放酶、纤维 蛋白溶酶、凝血酶和因子 I 等)的糜蛋白酶样活性一致。产生之后,这些建立 这多肽即被胞外蛋白酶降解成阶梯状的簇。 胞外蛋白酶是由不同成份组成 的一组酶,在调节生物活性多肽方面起着重要的作用 51-53 。例如,亮

49、氨酸氨基 肽酶(LAP)、氨基肽酶A(AP-A)、氨基肽酶N(AP-N)、羧肽酶N(CP-N)、及羧肽 酶的激肽酶I家族都参与血管紧张素、缓激肽和后叶加压素的调节;TAFI (一种羧肽酶B酶)参与调节纤维蛋白溶解作用阿。还有几种胞外蛋白酶是跨膜蛋 白,锚定于血管内皮细胞的质膜,其不均质分布导致不同组织在不同情况下产 生了一系列的蛋白分解后形成的多肽51。此外,有些胞外蛋白酶如 AP-N和胎盘 LAP (P-LAP)在蛋白酶ADAh家族作用下由细胞释放出来 阿,以可溶形式存在于 血液中55,56 ,降解血液、血浆和血清中的多肽。根据所用分析手段,以及研究目的(为了寻找具有诊断意义的标记物),对于

50、如上所述血浆和血清中存 在的一个产生自血液中蛋白的如此大的多肽库(或称降解组) (图 11),可以有 相反的解释。一种观点认为,寻找多肽标记物时存在的背景噪声,得在肽组中 不可能找到天然存在的、真正的生物标记物,或不可能找到癌症相关的具有特 异活性的蛋白酶。支持这一观点的研究者认为胞外蛋白酶活性或具有类似作用 的所有蛋白酶的活性,在取样时已被阻断。然而,已有观点明确指出,蛋白降 解组是血清肽组中唯一可被直接的 MALDI-TOF M新检测的部分17。良好的标记 蛋白片断(例如前列腺癌患者血清中的 PSA,如果确实存在,目前亦由于灵 敏度、离子抑制及技术本身的质量分辨问题等因素而检测不到。因此,

51、无法明 确证实这一降解组中确实可能找到生物标记物或代用的生物标记物。虽然到目前为止,最强的高分辨率血浆/血清肽MS分析技术旨在提供一份清单17, 我们再从中寻找可作为实体瘤癌症类型特异性的标记的肽或肽表达模式。在研 究的发现阶段,我们扫描了数百种的特征以识别其中最具预测性者,发现将关 键性肽的数目大大减少至易于识别的若干种后,并不影响分级预测的效果。因 此,我们才认为这些特征性信号可在含有晚期前列腺癌血清样本的独立效验体 系中,用于区别正常人和癌患者。尤为令人吃惊的是,开始选定的 68个严格选 定的具有区分意义的多肽信号中,序列清楚的全部 46 个肽段均为血清蛋白降解 物。由于最初标记物中三分

52、之二的片断已经得到阐明,我们有理由相信我们发 现的现象是普遍存在的。血液中数目不多的蛋白质几乎是所有前列腺、乳腺和膀胱癌症特征性肽段的来源,并不可作为天然的生物标记物、而仅仅是真 正的生物标记物如蛋白酶的内源性底物库。在底物浓度和多数降解物MS 离子强度之间并无真正的相关关系。高丰度的血清蛋白质如白蛋白和免疫球蛋白并未 被某种高离子强度的多肽有所代表,浓度差异 10倍的蛋白质片断离子强度相 近。另一方面,尽管在各癌症组和对照组中,全长 C3f 的离子强度非常接近, 而其几种截断形式的情况却有所不同。事实上,至少两个或以上血清多肽虽来 源于同一蛋白,但常常具有相反的相对离子强度。例如,肽段 x

53、较对照组升 高,而肽段 y 却较对照组降低。最后,我们观察到的几种具有较高的标记物价 值的蛋白质降解组多肽,在对照组中却几乎缺如(图 6中列出了几个在对照组 中标准化的强度值为 1的例子)。此类肽段共有 7个(图 5、 6:m/z = 998, 1278, 2053, 2409, 2565, 2704和 3971), 每一个都为某种或几种癌症特有,在某些高分辨率血浆多肽分析中未见报告,可能正是由于这些血样取自健康个 体所致17 。图 11中所示的 2步蛋白水解过程产生了大量丰富的血清多肽组,这个过程随血清酶、辅助因子、抑制物和各种其他控制因素和条件的改变 而变化,造成了几乎无限的不同长度肽段和

54、组成的组合变化。基于直接 MALDI- TOF MS技术的血清多肽表达模式因此而成为一种与机体活动相关的蛋白质组学,一种监测蛋白质代谢产物形式的生物标记物的手段。这可以开发成为一种诊断 性的或预测性的,利用内源性或外源性底物及定量分析方法,解读体液或组织 中催化及其他代谢活动表现型的工具;也可以专门开发为检测癌症的手段,如 朊酶即是一种已经明确的癌症进展和侵蚀性的标记物 57-60 。我们的证据表明, 胞外蛋白酶活性与体外凝血和补体降解途径交叠作用,产生了不仅具有癌症特 异性而且具有癌症类型特异性的血清多肽。以往研究已表明胞外蛋白酶参与癌症的过程阿。例如,AP-N/CD13在膀胱、胃肠道、甲状

55、腺和肝脏肿瘤中呈 高表达61, 而且其可溶性形式在癌症患者中也增加 56。与此情况类似,一种溶 酶体二肽基氨肽酶( DAP II) 在携瘤动物和癌症患者血清中浓度也升高 65; LAP AP-P和脑腓肽降解酪氨酰氨基肽酶(EDA)与乳腺癌相关57,66-68 ; AP-A,甲 硫氨酸氨基肽酶2 (Met-AP2)和GPDA则与其他多种癌症相关69-71 ; AP-N和Met- AP2通过促进血管发生而在功能上肿瘤细胞的转移相关72-75;羧肽酶及羧肽酶D (CP-D)在造血系统肿瘤中呈选择性升高76 ; PSMAE前列腺癌中过表达,且参 与肿瘤侵袭的过程 14,77。3种肿瘤中,上述酶和其他目

56、前尚未鉴定的酶究竟是以何种机制促成的血清多肽表达模式的差异,目前还无法解释,可能还需 要较长时间的研究。不过,这些差异确实具有统计学差异,组间的交叠也应引 起重视。尽管存在性别差异,乳腺和膀胱癌与对照组有同方向差异的特征肽段 中,仍然有 8 个肽离子交叠;仅有 1 个肽离子 (1865) 变化趋势相反。乳腺癌和 膀胱癌( 85%为男性,见补充表 1)共有 7个肽离子呈同方向变化,其他 7个在 乳腺癌升高而在膀胱癌降低,或呈相反变化。不过, 23个这样的肽离子中, 19 个在膀胱癌中具有优势P值,4个在乳腺癌中P值更优。我们认为这种交叠或 差异似与性别无关,因为对健康男性和女性血清肽模式的比较显

57、示虽有差异, 但统计学不显著 (J. Villanueva 和 P. Tempst, 未发表的结果 )。再者,每个 癌症组中的大多数肽离子都与对照组无论男女性均有差别(补充图1)。对于膀胱癌和前列腺癌的交叠更为有理的解释是,胚胎发育时二者均起源于的泌尿 生殖脊的内胚层组织,具有相似的生物学特点,而在泌尿生殖器道外层组织中 则无。例如,组织重组研究表明,泌尿生殖系间充质可诱导膀胱上皮向前列腺 上皮分化 -即分化型表型,但此特性仅限于与前列腺具有共同胚胎起源的内胚层 上皮(如膀胱上皮) 78。总而言之,前列腺癌的特征性多肽非常强,足以预测 疾病的分级,多级SVM分析结果表明,灵敏度达到其他独立效验

58、体系的97.5%(表 1)。综上所述,我们认为血清多肽组中蕴含的蛋白质降解模式携带着重要的、可能具有临床应用价值的癌症检测和分级的标记物信息。我们的发 现还提示,将来向着临床应用方面优化血清多肽组的工作,应当以内源性的蛋 白水解活动可反应癌症类型特异性信息这一认识作为立足点。蛋白酶抑制剂的 应用,应当像以前一样谨慎 29 , 即便是取样、储存和样品处理、化学分析、 MS 信号处理过程中最轻微的不符合标准操作规程的操作也应尽量避免。我们认为 在采用常规方法操作时如可做到这些方面,则可使我们对于针对各种癌症的关 键性、有辨识力的肽段的认识扩展并更加精确。这些表达模式可能还对于诊断 癌症的亚型或分期

59、也具有诊断意义,还可能给一种临床所见打分,或者可靠的区分临床显著与不显著的癌症。这样一种血液学检验可以做到,例如,检测刚 诊断的前列腺患者是否可以免予手术或放射治疗。对于来自内源性或常规合成 底物的关键肽的加强MS定量和同位素标记技术的应用,将推动将此技术应用于 临床实践的过程。 方法 血清样品制备 无已知恶性肿瘤的健康志愿者(男 女均用,年龄 23-56 岁,见补充表 1)和诊断为前列腺癌、乳腺癌或膀胱癌的 患者的血清按照标准临床操作规程取自 Sloan-Kettering 纪念癌症中心 29 , 有关患者的年龄、性别及病理诊断的详情参见补充表1。所有采血操作均获得MSKC制度审查和隐私局的批准,并得到患者的书

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论