不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式_第1页
不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式_第2页
不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式_第3页
不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式_第4页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、不同的胞外蛋白酶活性造成肿瘤特异的血清多肽组表达模式新近研究表明,通过质谱法已建立了多种独特的血清多肽组表达模式库,而血清多肽组表达模式与临床症状密切相关。阐明血清中多肽组成的序列特征及其产生机制,将有助于将血清多肽组表达模式作为可靠的疾病标识而更加广为接受。我们采用一种高度优化的多肽提Josep Villanueva, David R. Shaffer, John Philip, CarlosA. Chaparro, Hediye Erdjument-Bromage,Adam B. Olshen, Martin Fleisher,Hans Lilja, Edi Brogi, Jeff Boy

2、d, Marta Sanchez-Carbayo,Eric C.Holland, Carlos Cordon-Cardo, Howard I. Scher, and Paul TempstMemorial Sloan-Kettering Cancer Center, New York, New York, USA摘要:新近研究表明,通过质谱法已建立了多种独特的血清多肽组表达模式库,而血清多肽组表达模式与临床症状密切相关。阐明血清中多肽组成的序列特征及其产生机制,将有助于将血清多肽组表达模式作为可靠的疾病标识而更加广为接受。我们采用一种高度优化的多肽提取方法和基质辅助激光解析电离飞行时间质谱 (

3、MALDI-TOF-MS)技术进行的研究表明,仅靠一套有限的血清多肽表达模式(一个特征),即可将 3 种类型的实体肿瘤患者和未患癌的对照受试者准确地区分开来。61 个特征肽段的靶序列识别结果显示,这些肽又可分为密切相关的几个簇,大多数是由于造成肿瘤类型特异性差异的胞外蛋白酶活性影响了体内结合蛋白质的水解过程和补体的降解过程而产生的。这一特征肽段家族成员虽少、但功能极为强大,可精确预测前列腺癌样本的分级,其准确度与其他标准方法可比。总之,本研究表面,疾病的肽段标记物表达谱和蛋白酶活性的差异之间存在直接的相互关联,而且,本文中所描述的几种肽段表达模式在临床上有望用作癌症检出和分级的标记物,同时我们

4、的发现对未来的肽段生物标记物的研究也具有重要的提示意义。前言近年来的科学进展,包括基因组测序 1 和模拟复杂的生物体系的新技术2有望帮助我们提高抗癌治疗的水平。然而,目前的最佳抗癌治疗策略仍然有赖于早期发现及密切检测早期复发,以便能够合理地调整治疗方案3 。尽管如此,令人乐观的是,基因组和蛋白质组研究的进展将为我们提供新的或改进原有的分子诊断手段,帮助我们预测患者对个体化治疗的反应性,并据此将其进一步分成不同亚组4,5 。良好的生物标记物筛选方法,应当是创伤小而重复性好,最为理想的是通过简单的血样或尿样检测即可检测出肿瘤组织特异性分子。此外,筛选技术应足够灵敏,既可检测出早期癌症,又可准确地将

5、未患癌症者进行区分 3 。 虽然基因中携带有遗传信息,包括癌症或其他疾病的遗传易感性,但在正常健康或疾病状态时,真正赋予生物体的表现型的却是基因的产物。由于存在众多的蛋白质结构、功能和降解的翻译后调节机制,仅靠对于基因的认识甚至已难以圆满解释生物体系的复杂性。从筛选的角度来讲,由组织分泌或释放入血流中也主要是蛋白 6,7 。然而尽管经过了数十年的倾心研究,已鉴定的癌症生物标记物中,证明确实具有临床意义的也不过寥寥数种蛋白、且全是血浆蛋白(如前列腺特异性抗原 PSA 、癌胚抗原 CEA、癌抗原 125 CA125 和甲状腺球蛋白),常常需要结合其他诊断工具才能预测患者对治疗的反应性、复发和生存率

6、、对病情进行分级和监测治疗效果,而无法用于大范围人群筛查8,9 。而那些在血浆或血清中的浓度为纳摩尔级别的蛋白质,需要专门的放免试验才能检出并定量10,11 。因此,发现新的、更好的癌生物标记,开发出简单易行的检测方法势在必行。尽管目前已经有底物特异性的蛋白酶(如胰蛋白酶),可将复杂的蛋白质混合物降解为肽段进行质谱分析,但由于仪器的动力学量程以及在统计学处理之前,检测低丰度肽段所需的、与多次质谱检测相配合的复杂的分级分离过程的限制 12 ,这类想法均尚未付诸实现。 癌症过程中,细胞类型的转化和转化后表达高水平的蛋白质和酶(如 PSA和 PSMA)的细胞的增殖 13,14 ,不但使 6,715,

7、17组)。研究表明,人血清中含有数千种蛋白水解而产生的肽段,但这一复杂的多肽组是否与整体生物的生物学事件之间存在密切关联,到目前为止尚属未知。当前质谱技术的发展,已可以检测几个毫升的血清样本中成百上千的小到中等大小的肽段 17,18 ,最近几篇报告已开始利用质谱相关技术对血清肽进行定性和定量检测(常称为特征码或条形码),作为是否患有某种疾病(如癌症)的指征 119-24 。不过,此类工作争议很大,因为越来越多的证据表明,临床过程和分析化学及信号处理过程中未经控制的变异可能会使研究结果可信度大打折扣 12,25-29 。在分析过程中所应用的低级的质谱设备缺乏精确性,分辨率不够高,再加上到目前为止

8、仅阐明了少量的有争议的标记物的特征130-32 ,使怀疑论更加膨胀。如果几个不同的实验室分别证明了这些看似差异明显的多肽具有相似的氨基酸序列,则可表明这一新技术确实具有潜在价值。然而到目前为止,此工作尚在进行中。图 1. 对 MS技术获得的 3 组癌症患者和健康对照组的血清多肽表达谱的无监督分级聚类分析和主成份分析。 (A) 按照标准操作规程制备的健康志愿者和晚期前列腺癌、乳腺癌和膀胱癌患者的血清样本。在自动固相多肽提取和 MALDI-TOF MS分析前随机分为 4 组。质谱图经处理后采用 Qcealignscript 进行匹配,每个样品获得一个包含 651 个 m/z 值(换算后的离子强度)

9、的峰列表。图中数字代表各组中患者和对照组的例数。 (B) 采用标准关联作为各癌症组与正常组间二元距离标尺的平均 - 连锁分级聚类无监督分析。所有的峰值均被采用。柱表示样品,横排为m/z 峰。树状图颜色编码方案同A。热图中,标准化后的离子强度值为从0(绿色)到 200(红色),中点为100(黄色)。 (C) 3 个癌症组和正常组的分级聚类分析(与B 相应)。 (D) 3 个癌症组和正常组的主成分分析 (PCA)。颜色编码同 A。造成原始数据变异的3 个主要成份见图。为完成这一目标,我们曾开发了一种利用反相磁珠俘获被分析物,借助于 (MALDI-TOF)技术的自动操作程序以同时检测血清中存在的各种

10、肽段33较小直径斑点更大,因此结合能力也更强。与高分辨率MS 或 MS/MS联用时,可同时检测一滴血清中的数百种肽段,并且多数可不经再次分级而直接测定。这一自动化特性使得操作方便,并保证了实验结果的重现性。为使此系统更趋完美,我们还开发了一种基于最小熵的运算法则,简化并改进了质谱图的校准和后续的统计学分析工作 29 。有了这些工具在手,我们再次探讨了是否某种选定的已知序列的血清多肽的表达模式可能有助于 (a) 将癌症与非癌症区分开,(b) 区别不同类型的实体瘤, (c) 利用一个独立的效验设置预测癌症的分级。图 2. 3 个癌症组和正常组受试者血清多肽表达谱数据选择和比较分析。 (A) 各个癌

11、症组分别与对照组进行 Mann-Whitney U 检验。只有校正 P值小于 0.00001 的峰才能进入第二次筛选(峰强度中位数值> 500 单位):如果可以通过 1 个癌症组或对照组的阈值,则此峰入选。 (B) Venn 图显示一个癌症组中强度升高或降低的多肽的总数目。 (C) 3 个癌症组和对照组选定特征的热图的多元或二元比较。柱表示每组样品数;横排为 m/z 峰(非以数字表示)。二元比较中所用的肽段为各组中特别升高或降低者:多元热图包含有组合的、不可归还的多肽数目。多级膀胱癌和乳腺癌热图的比例尺为标准化的强度,范围为从 0(绿色)到 500(红色),中点为250(黄色);前列腺癌

12、的热图为从 0(绿色)到 2000(红色),中点为 1000(黄色)。 为达到这一目的,我们利用了目视检测光谱重叠、肽离子相对强度比较和统计分析,对106 例晚期前列腺癌、膀胱癌和乳腺癌以及健康人的血清样本测得的精确的肽表达模式的数百种特征性参数进行分类,以寻找最具有预测性的几种关键性多肽。我们发现,将关键性多肽的范围大大缩小至易于识别的少数(如仅限于特征肽段)后,并未对分级预测产生不利影响。 MS或基于 MS的序列识别技术识别的 61 种特征性肽段,均为血液中高丰度蛋白的降解产物或相关产物。通过分析疾病与蛋白水解模式的关系,我们发现,胞外蛋白酶的活性与体内蛋白质结合及补体降解途径一起,不仅对

13、癌症特异性多肽的产生有影响,还影响到癌症类型特异性血清肽段的产生。 结果 对基于 MS的血清样本中 651 个肽离子信号的无监督分析,可区分三类癌症和正常对照 我们分析了本研究所采用单标准临床规范收集到的 73 例癌症患者(其中晚期前列腺癌 32 例,乳腺癌 21 例,膀胱癌 20 例)及 33 例正常志愿者的血清样本 29 。年龄分布、性别及临床特征见补充表 1(本文章的补充资料可在线查阅 doi:10.1172/JCI26022DS1) 。 收集到的样品采用统一方案处理,包括 2 次冻融后进行初次保存,随后抽样进行蛋白质提取和 MS分析 29 。全部 106 个血清标本作为同一批样本,利用

14、专门的样品处理系统进行全自动处理(包括采用包被 C8 的磁珠进行肽段提取,洗涤,洗脱,与基质混匀,上于 MALDI靶板)后, 在 1 小时内进行 MALDI-TOF MS自动分析(参见补充方法)。在同日内按照以往报告方法进行分析、计算机校准和目视检测 12 个参考样本 / 谱,以验证系统的重复性和再现性(参见补充方法)18,29 。在随后的处理和分析过程中,将取自不同癌症患者和正常人的血清标本进行随机分配,采用专用的entropycal程序将处理后的质谱图对齐后29 ,在700 15,000 Da 的范围内共获得651 个不同的质量与电荷比值(m/z 值)。对每个标本的 651 个峰强度进行标

15、准化(信号强度减去本底,除以相应谱的总离子流,再乘以换算系数107) 后,逐个进行无监督的平均- 连锁系统聚类分析。二元和多元比较结果表明,患者与正常人及不同类型的实体瘤之间,肽段表达模式迥然不同(见图1)。图 3. 3个癌症组和正常组受试者血清肽表达谱选定峰的MALDI-TOF质谱图重叠。谱图按照方法部分所述获得后,进行匹配和标准化,以质谱图浏览器显示。除2021.05 (为大量的无组间差异的肽离子的代表)外,选定可代表组间差异的肽离子的标准化强度。24 处重叠区各代表一个癌症组与对照组的谱图的二元比较结果(膀胱癌:n = 20 , 绿色;前列腺癌: n = 32;蓝色;乳腺癌: n = 2

16、1;红色;对照组: n = 33;黄色 ) 。其排列方式允许经标准化后换算成同样大小的3 个二元比较结果可在同样的质量范围窗内显示,各肽离子峰显示的均为单同位素峰。特征选择发现 68 个肽离子特征可区别3 个癌症组人群与正常组对本技术的预期临床应用前景进行分析后,我们认为难以将取自不同时间及不同地点的人群标本的651 个特征峰进行关联分析。因此,我们采用判别分析进行了特征选择,以选出差别最大的峰。分别将3 组癌症标本与对照组的 196 个峰进行 Mann-Whitney U 检验分析,其中至少一类癌症的多重比较校正 P 值小于 1 × 10 5,结果见图 2。将每个样品群中所有肽峰的

17、离子强度中位值设为阈值时,肽段数目减少至68 个(见图 2A 和补充表2),此门槛的设置足以将质谱图中基于MALDI MS/MS串联 MS测序的大峰检出,又可排除邻近峰或“峰肩”的干扰。当此标准在至少1 个癌症组或对照组可满足时,对应的 m/z 峰入选(参见补充表 2)。采用多级 Kruskal- Wallis test 检验 ( 校正值 P < 1 × 10 5) ,阈值设置同上,重复进行特征选择,分别有 214 和 67 个峰入选。大多数入选的峰为分子量小于 2000Da的肽段;绝大部分 4000Da以上的分子被排除在外(见图 2A 和补充表 2)。随后将所有样本的质谱图用

18、颜色进行编码和涂覆,目测对 68 个肽峰进行正确的分类和分度,并区分癌症组和正常组的所有差异(如图 3 所示)。结果发现, 1 个(或多个)癌症组的 47 个 m/z 峰的离子强度偏高, 23 个 m/z 峰的离子强度偏低(图2B),而有趣的是, 2 个峰在 1 种癌症中偏高但在别种癌症中偏低。 68 个峰中, 14 个(或升高或降低, 1 个是前列腺癌特异性的, 13 个是癌症共有的)可能包含前列腺癌的生物分子信号, 14 个( 11 个是癌症共有的)可能包含乳腺癌信号, 58 个( 43 为膀胱癌特有的)可能包含有膀胱癌信号(见图 2B、 C)。图2C为上述结果的热图( heat maps

19、 )形式,表明资料减少 90%并未对临床分组产生不利影响,同时还表明癌症特异性肽特征似乎不但能够反映不具有特异性的炎症如关节炎和感染,还能够反映癌症,并且其特异性足以帮助我们区分正常与癌症患者甚至不同类型的癌症。图 4. 采用 MALDI-TOF/TOF MS/MS技术鉴定血清补体 C4a的一个片段肽段 2305.20 。 1 例乳腺癌患者的血清样本经多肽提取和 MS分析后,采用MS/MS技术分析选定离子(见补充方法)。图中所示片段离子谱取自 NR数据库中人片段的 Mascot MS/MS离子研究(/entrez/query.fcgi db=

20、Protein)且找到一个序列 GLEEELQFSLGSKINVKVGGNS (MH+ = 2305.19;= 4 ppm),Mascot 打分为38。b 和 y 片段离子系列与限制性序列同时标出(上方箭头)。请注意,y 离子产生于 C 末端,因此序列应向后读(见箭头方向)。图 5.晚期前列腺癌、乳腺癌和膀胱癌的血清肽模式。经MALDI-TOF/TOF MS/MS技术选定的肽段位于交叠序列簇,包括最初的68 个单同位素m/z 值中的 46 个(图 2 及补充表 2)。另外 23 个肽经推测后采用靶MS/MS分析,与已知的序列簇匹配。总体上,61 个肽段对于至少一种癌症具有明显的标记物可能性(校

21、正P < 0.0002;图 6) ,标成蓝色 26 个(前列腺癌),绿色50个(膀胱癌)或红色25 个(乳腺癌)。与对照组相比,这些肽段有的升高(空心圈),有的降低(实心圈)。所有癌症组和对照组中,C3f (m/z = 2021.05)和纤维蛋白素原 a 簇的 1 个成员 (m/z = 2553.01)离子信号接近 ( 见图 3:2021 和图 6) ,因此可作为有效的内标(黄色)。6 个肽段(粉色)为随机出现。括号中的残基在本实验中未观察到,但或为全长的建立者多肽,或为胰蛋白酶样切割位点处 (Arg/Lys Xaa)。图 6. 晚期前列腺癌、乳腺癌和膀胱癌的血清肽模式。本图中包含图 5

22、 中所列的 69 个肽段和已知序列的肽段(以m/z 值列出)的 MS离子强度和信号,并给出3 个不同的 Mann-Whitney U 检验(柱 68) 和 1 个多元Kruskal-Wallis检验(柱 9) 的显著性水平。实际信号(蓝色、绿色和红色)由至少对一种癌症具有明确标记能力的肽离子(校正P 值< 0.0002) 。校正 P 值为最主要的标准,最终符合此标准的肽离子分别为前列腺26 个,膀胱癌50 个,乳腺癌 25 个(与图 5 所示相同)。第二个柱列出的是对照组样本中每个 m/z 峰的离子强度值的中位数。峰强度比值(柱35) 为与对照组强度的比值。比值为 1 的和更多信号,在当

23、中位信号在某一种癌症中较高(r 1.4) 时底纹设为深灰色,在低于对照时 (r 0.75) 设为浅灰色。 Norm.:标准化的数据。图 7. 与相应对照组相比,选定序列簇的离子强度值的中位数。 3 组中每个肽段的离子强度值的中位数标为与对照组的比值 (r = 患者 / 对照 ) 。比值绘在对数表中,范围 0.1-10 。左侧短线 (r < 1) ,右侧短线 (r > 1) 分别表示癌症组的离子强度值低于或高于对照组。患者和对照组间无明显差异的多肽接近或与中央线重叠。血清多肽组由种类不多但序列各异的几种序列簇组成68 种入选的多肽中, 46 种可为 MALDI-TOF/TOF方法(图

24、 4)、 MALDI-Q/TOF MS/MS分析和数据库搜索检出(图 5)。请注意,图 5 中所列出的 m/z 值为单同位素峰,故小于补充表 1 中所给出的相应的平均同位素的值。有趣的是,所有的(而非仅一部分)肽段序列均集中于各组的C 端或 N 端重叠区,并在相应的末端有梯状平截,事实上,有些匹配分数甚至低于门槛值(参见补充方法)的序列,仍然被明确归为前体离子质量或入选为某一特殊档的离子质量片段(b 或y) ,这是由于考虑到有限的 CID 模式可能与已建立的优势肽键断裂规则 (34) 不完全相符而定。此外,根据靶向 MS/MS分析推测,另有 23 个多肽也可与某一特定序列匹配,其中 15 个的

25、判别式分析校正 P 值至少对一种癌症具有显著性 (< 0.0002) ,但离子强度明显较低(图 6)。另两个( 2553 和 2021; 图 5、6) 在各组中,具有非常高但相似的 MS离子强度,校正 P 值> 0.04 ,因而可用作准内标。另外 6 个多肽(图 5、 6) 随机分布于癌症组合对照组,既无判别价值亦无内标价值。我们发现此处得到的大部分肽段可分为10 或 11 个簇,这并无特别令人惊奇之处,因为最近的一项发现表明超过250 种的血浆多肽来源于约20 种血浆蛋白,而且也是广泛重叠的簇17 。应当注意的是,我们采用了一种无偏差的方法,从根据判别分析得到的多肽中先鉴别多肽标

26、记物,再进行测序。这种方法一般称为离子作图,可采用各种MS平台获得 35,36 。 肽段标记物的序列簇来源于高丰度的血浆多肽和蛋白质前体三个序列簇来源于天然产生的血浆多肽纤维蛋白肽 A (FPA) 、补体 C3f 和缓激肽,这些肽段分别产生自或是体内内源性途径早期血浆蛋白的胞外蛋白降解过程(缓激肽产生于高分子量激肽原被激肽释放酶降解的过程中),或产生于血浆制备过程中(纤维蛋白素原N 末端被凝血酶裂解而产生FPA;C3 转变为 C3b后经因子 I和 H 作用而释放 C3f)37,38 。全长的建立者肽(founder peptides)末端为 Arg 或 Lys ,之后是一个疏水的氨基酸如Val

27、, Leu,或 Phe。C3f 和缓激肽去掉了Arg 而形成去 Arg- 缓激肽。其它肽段簇也由类似的胰酶样降解作用而形成(见后文)。 39 个酶切位点中, 21 个是 C末端碱性氨基酸之前存在一个疏水氨基酸 (F 、L、V、 I 、 W或 A) ,15 个为 S、 Q或 N(见补充表 4)。典型情况是, Arg/Lys 全部或部分被羧肽酶降解掉,除非之前有一个 Pro(3/3 )或者有时是 Val (2/4 )。此后 C 端或N端才进行进一步的胞外降解作用直至完全降解或中途停顿,产生许多或者各式中间产物(见图5 及补充表 3),此过程周而复始,在各个簇中重复发生(见后文)。诊断性的 MALD

28、I-TOF质谱模式中包括N 末端 FPA和 C3f 降解30物,此前在心肌梗塞患者的血清中曾经报告存在这两种多肽。而与此相反,我们在对照血清中共检测出19 种多肽,在癌症患者血清中,这些多肽有的持续保持很低水平(如各种癌症患者中所有的 FPA片段和乳腺癌患者中 3C3f 片段),有的则呈高水平(如膀胱癌和前列腺癌中的几种 C3f 片段和乳腺癌中的一种 FPA片段)。全长 C3f 在各样本中均为较高水平且接近,而膀胱癌患者血清中几乎见不到全长 FPA。这些样本中均未检出纤维蛋白 B 及其片段。与以往报告的卵巢癌患者血清磷酸 FPA水平升高(电喷射离子化 MS法, 31) 和胃肠道癌症及乳腺癌患者

29、 FPA水平升高(免疫化学法检测, 39,40 )不同,我们的结果显示,前列腺癌、膀胱癌和乳腺癌患者血清中 FPA水平降低。图 8. 研究总览。简图中显示了用于开发及验证 68 个肽离子和前列腺癌的 26 个序列已知的特征性血清肽(图 5,蓝色 ) 的方法。画圈的数字表示在研究各阶段选定肽段的总数目。缓激肽被认为是一种癌症生长因子,41者血清中缓激肽和去Arg- 缓激肽的水平均升高,而膀胱癌患者中却是降低的(见图 5)。各种多肽的羟基化形式(42)prohydroxylated forms也呈类似趋势(结果未显示)。缓激肽及 FPA的来源,蛋白纤维蛋白素原 ?和 HMW激-肽原,各自形成一种序

30、列簇,成为癌症的特征性多肽,其位置与前体序列不同(见图 5,图 7 和补充表 3、 4)。有趣的是,缓激肽与其他激肽原来源的多肽具有相反的标记特性。例如,膀胱癌中缓激肽和去 Arg- 缓激肽的离子强度较正常组降低,而其他肽段 ( 如 1944 和 2209) 则相对升高(见图 5、6)。以往常有草率的解释,认为某些肽段的离子强度相对于正常人偏高或偏低是由于原始蛋白上调或下调所致,本文的观察结果直接反驳了这一论点,很显然, HMW缓-激肽的水平不可能同时既上调又下调。 多肽 2724(见图 5)是来自交联 - -胰蛋白酶抑制物重链 (ITIH4) 前体 43 包括第 662687 位氨基酸 (

31、补充表 3、4),由于含两个激肽释放酶酶切位点 (Phe-Arg Xaa)而得名。第 662687 位氨基酸残基似乎是一种功能未知的前肽44 ,与缓激肽相似,末端也是Pro-Phe-Arg 。几个较长的 ITIH4 前体片段,包括 3272(第 658687 位氨基酸),横跨第一个激肽释放酶酶切位点,是早期卵巢癌的生物标记物32 。进一步研究表明,仅仅改变 ITIH4 簇 N 末端的几个氨基酸即可产生对于不同癌症具有选择性的离子标记。例如肽段3971 和 3273 的离子强度中位数在膀胱癌中水平最高,而肽段 2358 和 2184在乳腺癌中最高,前列腺癌中肽段2271 水平最高。肽段 2115

32、 与 ITIH4 的一种剪接异构体序列匹配 (PRO1851;见补充表 4) ,似乎对各种癌症都具有标记作用,特别是膀胱癌和乳腺癌(见图6)。另一个簇包括 2×4个肽段,位于 Ile-Arg Xaa 酶切位点的一侧,来源于补体C4a 前体 45 (见图 5 和补充表 3、 4)。此 C4a簇在乳腺癌中作为离子标记物的发生率最高,超过所有其他簇,也超过 C4a来源的膀胱癌标记物(表 6)。此簇中仅有一个离子(肽段 1763) 是前列腺癌的标记物,同时也是其他两种癌症的标记物。另外,源自 apoA-I 、apoA-IV 和 apoE 的离子标记物除 1 个外、均具有膀胱癌特异性,且离子强

33、度均较高;肽段 1971 例外,是乳腺癌中最为显著 (P = 5.5 ×10 13) 的离子标记物。图 9. 用于验证多肽特征性生物标记物的独立前列腺癌血清样本。 (A) 实验设计见图 8 及结果部分。 (B) 对 PR1、 PR2 和对照组的分级聚类分析。采用了 3 个二元比较中具有统计学显著性的 68 个肽离子和组成前列腺癌特征性的 26 个序列已知的肽段,其余的近 650 个肽离子未予处理。标准化离子强度的热图比例范围为从 0(绿色)到 2000(红色),中点为 1000(黄色)。 (C) PR1和 PR2组与对照组的主成分分析,肽离子同 B。图中显示了造成原始数据差异的前 3

34、 个主要成分。 表 1. 采用 SVM法分析 651 个特征肽段 , 68 个特征肽段和 26 个特征肽段对一个前列腺癌效验组进行分级预测No. m/z binsBinaryMulticlass651100% (41/41)97.5% (40/41)68100% (41/41)97.5% (40/41)26100% (41/41)97.5% (40/41)预测正确的百分率列于表中。41 例患者中, 40 个预测正确,双侧 95%可信区间为 87.1 99.9%; 41 个预测正确的区间为 91.4 100%。训练组为 PR1与对照组(二元)或 3 个癌症组与对照组(多级)。 m/z bin :

35、已鉴定的 m/z 值 ( 多次质量测定 ) ( 见补充方法 ) 。免疫组化研究证实,丛生蛋白(如 apoJ) 上调与前列腺癌和膀胱癌都相关 46-48。我们检测到前列腺癌和膀胱癌患者血清中长度为 10 个氨基酸的丛生蛋白片断(位于 C 末端)的浓度升高(补充表 2、3)。切断 Val-Arg Xaa键分离丛生蛋白 (N-t) 和(C-t) 后,一次单酶切足以释放此肽段。因此,一个长度为 6 个氨基酸的亚片断作为膀胱癌标记物更为显著(表 5、6),这与其他大多数来自 apoA-I, apoA-IV 和 apoE的肽段变化趋势相同。 最后,两个离子(肽段 2602 和 2451) 与 XIIIa

36、因子和 transthyretin来源的肽段相应(图 5、6),在乳腺癌中的强度高于正常人。肽段 2602 对应于 XIIIa 因子前肽( 37 个氨基酸)的 C端 25 个氨基酸(补充表 3、4)。有趣的是,乳腺癌中 XIIIa 因子自身是下调的 49 。尽管我们尚不清楚在本研究中患者血样是否具有同样的变化,但是进一步反驳了离子强度升高是由于前体物上调所造成的这一论点。癌症特异性肽段包括选自几种不同序列簇的肽段图 5 中列出了 69 种血清肽段(匹配信息见图6)。其中 61 个对于至少一种癌症具有明显的MALDI-TOF MS离子标记能力(校正P <0.0002) ,分别标成蓝色(前列

37、腺癌)、绿色(膀胱癌)和红色(乳腺癌)。结果表明,三种癌症的特征肽段分别为前列腺癌26 个,膀胱癌 50 个,乳腺癌 25个,某些肽段还同时出现在两种或三种癌症中。与健康对照相比,某种特定癌症组中离子标记物的强度值的中位数可能升高(图5)也可能降低:前列腺癌中 16 个升高, 10 个降低;膀胱癌中 30 个升高, 19 个降低;乳腺癌中 19 个升高, 6 个降低。强度值升高或降低的肽段中,均只有 3 个肽段为各癌症组所共有。来自 C4a的一个肽段和 ITIH4 簇的 2 个肽段在所有癌症组中的离子强度均高于健康对照,而 3 个 FPA片断则在所有癌症组中均降低。其他的离子标记物或为 2 个

38、癌症组共有、更多见的则是专属于某一癌症组(图 5)。应引起注意的是, 9 个 apo 肽段和 3 个 C3f 肽段在膀胱癌中具有较高的离子强度; 4 个 C4a肽段、 2 个缓激肽肽段和1 个 transthyretin片断在乳腺癌中强度升高;3 种在乳腺癌中特异性降低的肽离子都来源于C3f。有趣的是,某些共同标记物离子在一种癌症中强度升高,但在另一种癌症中表现为降低(图5、 6)。例如,乳腺癌标本中 5 个肽段的离子强度都较正常组升高,但在膀胱癌标本中,这些肽段的强度降低,而对于前列腺癌则全无标记物意义。ITIH4 肽段( 842; HAAYPF)在前列腺癌中强度相对较高,但在膀胱癌却几乎检

39、不到。从上述结果,难以阐明究竟那一簇或哪一长度档的肽段序列在何种癌症中具有何种变化规律或趋势。为了探索这种规律,或者至少能够更好的显示可能存在的差异,我们标出了各癌症组与正常组中 4 个主要簇的各个肽段的离子强度值的中位数比值( r =癌症 / 对照 ) 。图 7 中,中央线代表无差异 (r = 1) ,左侧的短线 (r < 1) 代表较低的中位数比值,右侧 (r > 1) 的短线代表较高的比值。在 FPA阶梯状肽段中,几乎所有癌症的离子信号都小于正常组,各癌症组中每个肽段都存在差异。应注意,膀胱癌患者血清中全长 FPA似乎完全消失。其他 3 簇则均有显著的内部变异和中位强度比值变

40、异,大多数超过 1,也有等于 1 和小于 1 者。对 4 个表 (33 ×3个数据点 ) 进行目视检测的结果见图 7,3 种癌症可被明确区分开。膀胱癌血清中, C3f 簇中肽段的离子强度显示升高趋势, C4a和 ITIH4 簇的变异较大;而在乳腺癌中, C3f 簇肽段的离子强度较低, C4a簇的离子强度升高;前列腺癌中,离子强度变化趋势与前面两种癌症中不同,而 ITIH4 簇中某些短肽段的变化更为明显。有趣的是, C3f, C4a 和 ITIH4 簇中,各有一长度档在对照组中几乎为 0,而在三种癌症中都具有高的离子强度中位数比值。图 10. 血浆胞外蛋白酶降解人工合成的 C3f 与内

41、源性血清多肽(来自 C3前体)的水解模式相似。新鲜血浆 MALDI-TOF MS读数(上方面板)显示除缓激肽和去 Arg- 缓激肽外,血浆小肽段的水平极低。加入人工合成的 C3f(1 pmol/ml 血浆 ) , 1 份立即取出,其他的在 15 分钟后取出。样品放置于室温。中间的面板显示 C 末端 Arg 在几秒钟内被羧肽酶剪切。随后 C3f 被氨基肽酶活性进一步降解形成与血清中固有梯度相同的序列梯度。Brad (R):去掉C末端 Arg 的缓激肽; R:Arg; RI :Arg-Ile; H: His; T :Thr; I:Ile; K:Lys; S: Ser.图 11. 血清蛋白酶活性。多

42、数肽段经 2 步蛋白水解而产生。组合正确时, 6-12 个不同的簇中, 1 个以上成员表现出具有诊断意义的离子强度特征(经直接 MALDITOF MS测定),可预测癌症及其类型。氨基酸序列标成彩色,代表观察到的簇中的两个离子C3f 簇序列(左)和 FPA(右)。综上所述,根据统计学分析(图 6)、目视检测(图 3)、肽段测序(图 4、5)以及相对离子强度分析,图 7 的资料表明人血清肽组以特征性肽段的形式包含有可区别癌症与正常的信息及区分 3 种癌症的信息。 肽离子信号可精确预测经过其他外部效验的前列腺癌样品的分级 为了评价识别的标记物的强度,我们检测了一组 41 个取自晚期前列腺癌( PR2

43、) 的独立血清样品中的肽段信号(图8、9A)。前列腺癌标本随机分入训练组 (prostate 1 PR1) 或实验组 (PR2) ,但保证具有相同的人口统计学 / 病理学参数(如年龄、 PSA水平、 Gleason 评分和存活时间)。实验组中无既往曾经接受监督分析者,因此可用于估计真实的预测精确性。对这 41 例标本经过标准规程分析后,得到一份新的表格,其中也包含了原先 106 份训练样品中的所有资料。将特征第二列中列出的肽离子 (68个肽段 ; 见图 2A、8) 和前列腺癌中的肽段信号 (26 个测序的肽段 ; 图 5、6) 用于进行对照组、 PR1和 PR2组分级聚类分析(图 9B)和主成

44、分分析(图 9C)。PR1和 PR2的样品为与对照组差别最大的样品。分别对 3 组中这 26 个肽离子进行比较的结果表明, PR1和对照组之间, 26 个肽段全部具有统计学差异( 校正 P值 < 0.0002, 见图 6) ; PR2和对照组间, 23 个差异显著;而在 PR1和 PR2 间仅有一个肽段有差异。最后,对 651 个、 68 个和 26 个选出的肽段分别进行了基于 SVM的二元或多元分级预测,二元和多元分级预测的灵敏度分别为 100% (41/41) 和 97.5% (40/41) (表 1),与前一方法相近。 血浆中氨基蛋白酶活性可使人工合成的 C3f 产生一组梯状序列

45、本研究显示,血清多肽组似乎主要为固有酶作用底物的产物,而且更像是其蛋白水解的产物,这与以往报告相符(17),因此可代表血浆中存在的在血液凝固时激活的蛋白酶的种类。除缓激肽之外,我们观察到的血清中多肽的浓度均高于血浆(图 10,数据未显示),此机制与体外凝血和补体激活一起参与几乎所有簇的建立者肽段的产生过程。采用肝素抗凝试管制备的血浆多肽更接近于低水平凝血和肝素诱导的补体激活时的产物( 17,Villanueva 和 P. Tempst, 未发表的研究结果 ) 。很显然,诱导的血浆和血清多肽组被胞外蛋白酶活性放大,可部分甚至全部解释我们观察到的差异。本研究结果提示,癌细胞可能产生独特的蛋白酶(可

46、能是胞外酶),导致微妙的但具有特征性的上百种人血清中可溶性多肽的复杂平衡发生变化。为了证实胞外酶的存在及其作用,我们将人工合成的 C3f 加入新鲜血浆中使接近血清终浓度。结果见图 10, C3f 迅速降解, C末端的 Arg 的几秒钟内即被切掉, N末端切割也在 10-15 分钟后开始。此模式接近于血清中观察到的内源性过程,也可说明其片段长度梯度的不同长度档的片断离子强度为何各异。不过,除最小片段之外,大多数 C3f 降解产物在延长孵育时间后消失(未显示此数据)。人工合成的 FPA在血浆中被胞外蛋白酶降解的过程也有类似的过程,而纤维蛋白肽 B (FPB) 则在数分钟内被彻底降解(未显示此数据)

47、,这可以解释为何在我们的血清表达谱分析时从未检出过其内源性形式。本结果提示,血浆和血清中胞外蛋白酶的工作浓度和活性基本相同,因此可排除凝固过程的影响。 讨论 在寻找具有临床意义的生物标记物时,研究者未给与血清蛋白质组的低质量段、特别是分子量低于 3000Da的多肽和高分子量段多肽及蛋白同等的重视。那些更小的、原先就存在的小肽段难以被全蛋白组胰蛋白酶消化物的高通量液相色谱 / 固相色谱 -MS/MS分析检出,在有利于检测 5-15kDa 范围内的多肽的基于 SELDI-TOF MS技术的筛选中也难以得到很好的分析 19-24 。本试验和 Koomen等最近报告的一项分析中,首次给出了血清和血浆肽

48、库的详细信息。总的说来, MALDI-TOF MS方法检测到的大部分人血清肽产生自体内内源性蛋白酶对内源性底物的降解作用。如图 11 所示,多肽的产生发生在内源性凝血途径和补体激活过程中的蛋白水解级联反应 50 。这些多肽中,有的是已知的生物活性分子,有的是降解的前肽,有的则是前提蛋白的随机内切片断。不过,所观察到的切断位点一般均与胰蛋白酶和已知丝氨酸蛋白酶(如激肽释放酶、纤维蛋白溶酶、凝血酶和因子 I 等)的糜蛋白酶样活性一致。产生之后,这些建立这多肽即被胞外蛋白酶降解成阶梯状的簇。胞外蛋白酶是由不同成份组成的一组酶,在调节生物活性多肽方面起着重要的作用51-53 。例如,亮氨酸氨基肽酶 (

49、LAP) 、氨基肽酶 A(AP-A) 、氨基肽酶 N(AP-N)、羧肽酶 N(CP-N)、及羧肽酶的激肽酶 I 家族都参与血管紧张素、缓激肽和后叶加压素的调节;TAFI(一种羧肽酶 B 酶)参与调节纤维蛋白溶解作用 54 。还有几种胞外蛋白酶是跨膜蛋白,锚定于血管内皮细胞的质膜,其不均质分布导致不同组织在不同情况下产生了一系列的蛋白分解后形成的多肽51 。此外,有些胞外蛋白酶如AP-N和胎盘LAP (P-LAP) 在蛋白酶 ADAM家族作用下由细胞释放出来 55 ,以可溶形式存在于血液中 55,56 ,降解血液、血浆和血清中的多肽。根据所用分析手段,以及研究目的(为了寻找具有诊断意义的标记物)

50、,对于如上所述血浆和血清中存在的一个产生自血液中蛋白的如此大的多肽库(或称降解组)( 图 11) ,可以有相反的解释。一种观点认为,寻找多肽标记物时存在的背景噪声,得在肽组中不可能找到天然存在的、真正的生物标记物,或不可能找到癌症相关的具有特异活性的蛋白酶。支持这一观点的研究者认为胞外蛋白酶活性或具有类似作用的所有蛋白酶的活性,在取样时已被阻断。然而,已有观点明确指出,蛋白降解组是血清肽组中唯一可被直接的MALDI-TOF MS所检测的部分 17 。良好的标记蛋白片断(例如前列腺癌患者血清中的PSA),如果确实存在,目前亦由于灵敏度、离子抑制及技术本身的质量分辨问题等因素而检测不到。因此,无法

51、明确证实这一降解组中确实可能找到生物标记物或代用的生物标记物。虽然17到目前为止,最强的高分辨率血浆/ 血清肽 MS分析技术旨在提供一份清单,我们再从中寻找可作为实体瘤癌症类型特异性的标记的肽或肽表达模式。在研究的发现阶段,我们扫描了数百种的特征以识别其中最具预测性者,发现将关键性肽的数目大大减少至易于识别的若干种后,并不影响分级预测的效果。因此,我们才认为这些特征性信号可在含有晚期前列腺癌血清样本的独立效验体系中,用于区别正常人和癌患者。尤为令人吃惊的是,开始选定的68 个严格选定的具有区分意义的多肽信号中,序列清楚的全部46 个肽段均为血清蛋白降解物。由于最初标记物中三分之二的片断已经得到

52、阐明,我们有理由相信我们发现的现象是普遍存在的。血液中数目不多的蛋白质几乎是所有前列腺、乳腺和膀胱癌症特征性肽段的来源,并不可作为天然的生物标记物、而仅仅是真正的生物标记物如蛋白酶的内源性底物库。在底物浓度和多数降解物MS离子强度之间并无真正的相关关系。高丰度的血清蛋白质如白蛋白和免疫球蛋白并未被某种高离子强度的多肽有所代表,浓度差异10 倍的蛋白质片断离子强度相近。另一方面,尽管在各癌症组和对照组中,全长C3f 的离子强度非常接近,而其几种截断形式的情况却有所不同。事实上,至少两个或以上血清多肽虽来源于同一蛋白,但常常具有相反的相对离子强度。例如,肽段x 较对照组升高,而肽段 y 却较对照组

53、降低。最后,我们观察到的几种具有较高的标记物价值的蛋白质降解组多肽,在对照组中却几乎缺如(图6 中列出了几个在对照组中标准化的强度值为 1 的例子)。此类肽段共有 7 个( 图 5、 6: m/z = 998,1278, 2053, 2409, 2565, 2704和 3971),每一个都为某种或几种癌症特有,在某些高分辨率血浆多肽分析中未见报告,可能正是由于这些血样取自健康个体所致 17 。 图 11 中所示的 2 步蛋白水解过程产生了大量丰富的血清多肽组,这个过程随血清酶、辅助因子、抑制物和各种其他控制因素和条件的改变而变化,造成了几乎无限的不同长度肽段和组成的组合变化。基于直接MALDI

54、-TOF MS技术的血清多肽表达模式因此而成为一种与机体活动相关的蛋白质组学 , 一种监测蛋白质代谢产物形式的生物标记物的手段。这可以开发成为一种诊断性的或预测性的,利用内源性或外源性底物及定量分析方法,解读体液或组织中催化及其他代谢活动表现型的工具;也可以专门开发为检测癌症的手段,如朊酶即是一种已经明确的癌症进展和侵蚀性的标记物57-60 。我们的证据表明,胞外蛋白酶活性与体外凝血和补体降解途径交叠作用,产生了不仅具有癌症特异性而且具有癌症类型特异性的血清多肽。以往研究已表明胞外蛋白酶参与癌症的过程 58 。例如, AP-N/CD13在膀胱、胃肠道、甲状腺和肝脏肿瘤中呈高表达 61 , 而且其可溶性形式在癌症患者中也增加56 。与此情况类似,一种溶酶体二肽基氨肽酶( DAP II) 在携瘤动物和癌症患者血清中浓度也升高65 ;LAP、 AP-P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论