




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
超高效液相色谱-质谱联用技术在代谢组学中的应用
代谢组学是经过基因组学、转换组学和蛋白质组学之后出现的系统生物学的另一个重要分支学科。这是一个定量和分析生物内源性代谢物质的一般状况以及内外环境变化的规律性科学。代谢组学通过测量细胞、组织和机体代谢产物的浓度变化来反映基因、蛋白质和代谢活性本身的直接关系。由于代谢组学变化是机体对基因、疾病、环境和药物等作用的最终反映,其内源性代谢产物是机体一系列生命事件的关键或终点反应,因此,代谢组学可以帮助人们更好地了解生物体中各种复杂的相互作用及其本质。临床诊断、药物开发、营养科学以及其他生命科学都会从代谢组学的研究中大大受益。目前,尽管代谢组学研究正处在最“热”的时期之一,并且取得了许多重要成果,但其研究技术方法仍然是影响代谢组学迅速发展的瓶颈之一。代谢组学技术主要是借助全面系统的物质分析平台来描述体内大量物质分子的结构和丰度信息,其主要研究对象是相对分子质量1000以下的内源性小分子。早期的代谢组学研究方法主要采用核磁共振(NMR)技术,NMR的主要优点是测定条件温和,不改变样品的结构和理化性质,还可通过施加外界干扰对样品的变化进行动态测定等。另外,1HNMR对含氢代谢产物具有一定的普适性。但是,相比较之下,色谱和质谱联用技术,特别是高分辨质谱凭借其普适性、高灵敏度和特异性的特点,逐渐成为代谢组学研究的主流技术。随着超高效液相色谱(UPLC)分离技术和傅里叶变换-离子回旋共振-质谱(FT-ICR-MS)检测技术的迅猛发展和广泛应用,LC-MS联用技术的优势也更加明显,所以基于LC-MS的代谢组学方法不论在植物、微生物还是动物组织样品领域都起着越来越重要的作用。基于LC-MS的代谢组学分析工作流程一般可包括:样品采集、多组LC-MS数据的采集和获取、数据预处理、多变量数据分析、标志物识别和代谢关键节点和途径分析等。本文综述了基于LC-MS技术的代谢组学研究流程和进展,并对其主要发展方向做了简要展望。1生物样品的采集和预处理方法。生物代谢样品的采集与制备是代谢组学研究的初始步骤也是最重要的步骤之一。代谢组学研究需要严格的实验设计和较高的分析精度,首先需要采集足够数量的样本,从而有效减少源于生物样品(如血液、尿液、组织和细胞培养液等)个体差异对分析结果的影响,得到有统计学意义的分析数据。实验设计中对样品收集的时间、部位、种类和样本群体等应给予充分考虑,如以小鼠为研究对象时,需要考虑小鼠的品系、品种、性别、体重以及是否同窝等诸多因素的影响。此外,分析过程要有严格的质量控制,需要考察如样本的重复性、分析精度、统一设置空白样本等。由于代谢产物的变化对分析结果有较大的影响,因此,在处理生物样本时要特别注意避免由于残留酶活性或氧化还原反应而降解代谢产物或产生新的代谢产物。生物样品采集后需要立即进行生物反应灭活处理,即对所收集样品进行快速淬灭,灭活的方法很多,如在液氮或-80℃下冷冻、酸碱处理或加有机试剂处理等。根据研究对象、目的和采用的分析方法不同,所需的样品提取和预处理方法也各异。但在整个样品处理和分析过程中,应尽可能保留和体现样品中代谢物的信息。基于NMR的代谢组学方法,样品的预处理比较简单,一般只需离心取上清液、加缓冲盐溶液稀释或者加有机试剂(如甲醇、乙腈等)沉淀蛋白即可。与NMR样品相比,采用基于LC-MS的方法进行“全”成分分析时,样品处理方法比较复杂,很难有一种普遍适用的标准化方法。代谢产物通常用水或有机溶剂(如甲醇、己烷等)分别提取,获得水提取物和有机溶剂提取物,从而把非极性相和极性相物质分开,以便进行特征分析。也可以选用合适比例的混合溶剂对水溶性和脂溶性的物质同时进行提取,黄强等在肝脏代谢组学的研究中发现甲醇和水(4:1)能实现最佳的提取效率和复溶结果。Teahan等用甲醇、氯仿和水的混合溶液对细胞中的代谢物进行了较好的提取。对于代谢轮廓谱或靶标分析,还需要做较为复杂的处理,如常用固相微萃取、固相萃取或亲和色谱等预处理方法,一般可以根据目标物的特性选择合适的萃取小柱进行样品纯化。为了避免代谢产物的降解,所有操作都需要在低温条件下进行。2质谱-质谱联用gc-ms数据采集是指运用LC和高分辨MS联用技术检测样品中代谢产物的种类、含量、状态及其变化,进而得到代谢物谱或代谢指纹图谱。由于生物体系中内源性代谢产物的复杂性,使得代谢组学技术分析对象的分子大小、数量以及其他理化参数差异很大,因此需要采集代谢产物的分析技术方法具有高灵敏度、高通量,甚至海量和无偏向性的特点。与其他组学技术只能分析特定类型的化合物不同,色谱-质谱联用技术兼备了色谱的高分离度和高通量,以及MS的普适性、高灵敏度和特异性,因而成为代谢组学研究的最主要的分析工具之一。同时,根据现有的分析技术所具有的各自的优势和适用范围,最好采用联用技术和多种方法进行综合分析。相对于NMR灵敏度低、检测动态范围窄等弱点,MS具有较高的灵敏度和专属性,可以实现对多个化合物的同时快速分析与鉴定。随着色谱-质谱联用技术的发展,越来越多的研究者将此技术用于代谢组学的研究。气相色谱-质谱联用(GC-MS)方法的主要优点是有较高的分辨率和检测灵敏度,仪器价格相对较低,并且有可供参考和比较标准的电子轰击质谱(EI-MS)谱图库,可以用于代谢产物定性和定量分析。但是,GC-MS不能直接得到体系中难挥发的大多数代谢组分的信息,对于挥发性较低的代谢产物需要进行衍生化处理。相比较而言,LC-MS避免了GC-MS中繁杂的样品前处理,且由于其较高的灵敏度和较宽的动态范围,现已被越来越多地用于代谢组学的研究,尤其是非常适合于生物样本中复杂代谢产物的检测和潜在标志物的鉴定。LC-MS的代谢组学研究通常采用反相填料、梯度洗脱程序,但体液样品特别是尿样,含有大量的亲水性代谢产物,这些代谢产物在反相色谱上不保留或保留很弱。Cai等和Wang等使用亲水反相色谱成功解决了血浆样品中亲水性物质的弱保留问题。Hasegawa等和许国旺等研究了一个柱切换二维液相系统,采用两根液相色谱柱(反相色谱柱和亲水色谱柱),通过阀切换实现了一次进样对复杂生物样品中亲水性和疏水性代谢产物的同时检测问题。新的分析技术如超高效液相色谱-高分辨飞行时间质谱联用(UPLC-TOF-MS)技术、毛细管液相色谱-质谱联用(CLC-MS)技术、FT-ICR等也被用于代谢组学研究以提高代谢产物的检测灵敏度和通量。理想的MS分析仪器不但要有高的分辨率(m/Δm>100000),还要能提供准确的分子质量(小于1ppm),同时还要能配合多种电离方式,如电喷雾离子化(ESI)、nanoESI、大气压化学电离(APCI)、基质辅助激光解吸电离(MALDI)、大气压光电离(APPI)、AP-MALDI、EI/CI等。另外再配合UPLC的使用,通过减小色谱柱填料的粒径,同时提高流动相的压力,可以显著提高样品的分析时间和分离度,将UPLC与高分辨MS联用可显著提高代谢组学研究的效率。目前许多仪器厂商均推出了各自的整套代谢组学液质联用设备,通过与其自带的软件配合,可大大减轻代谢组学研究工作者的工作量。3代谢组学的数据处理代谢组学的数据分析与处理是指使用多变量数据分析方法对获得的多维复杂数据进行降维处理和信息挖掘。由于代谢组学研究对象的复杂性,因此获得的数据往往都非常复杂,由此造成的数据分析处理技术一直是代谢组学研究的难点和瓶颈之一。代谢组学的数据处理主要包括原始数据的预处理和多变量数据分析两个步骤,其目的在于揭示生物样品的关键性生物标志物、代谢节点和代谢途径,以最终帮助解释代谢组学的数据分析结果。目前,发达国家的实验室已经成功解决了困扰MS代谢组学研究的一些瓶颈问题,从而加快了从高通量样品分析到完成海量数据分析的整个研究过程,基本可以完整地把整个平台应用于动物、植物、微生物、临床医学、药物或营养科学等领域的项目研究中。3.1结构数据处理数据预处理主要包括滤噪、峰识别、重叠峰解析、峰对齐、峰补齐、标准化和归一化等。由分析仪器直接导出的数据,一般不能直接用于统计分析,还需对数据进行格式转换,将原始数据转换为适合于多变量分析(主要是模式识别)的数据形式。在实际操作中,并不是每个步骤都需要进行,而是根据实际情况的需要,可以选其中几种进行预处理操作。目前有关代谢组学数据处理软件多达数十种,其中,常用的质谱数据处理软件可分为3类:(1)免费分析软件,如MSFACTS、MetAlign、XCMS和MZmine等。其特点是功能强大并且免费,但使用者需要一定的计算机背景知识和软件知识基础。如Scripp研究所开发的XCMS软件是一种基于R语言的质谱数据预处理工具,可处理多种公司生产GC-MS和LC-MS仪器所导出的格式为netCDF、mzXML或mzData等数据。由于XCMS支持多参数设置,所以在使用时可根据不同的需要进行多参数优化,并且XCMS还具有强大的图形显示功能,能够把提取出来的潜在的生物标志物的信号响应强度在不同的组别中的差异直观地显示出来。(2)商品化软件,如Markerlynx、AMDIS、MassHunter、Metalign和ChromaTOF等。其共同特点是功能强大,并且大多整合了相关搜索数据库和统计分析软件,可直接检索代谢物的结构并进行统计分析,为使用者提供了很大的方便,如Markerlynx就整合了统计软件UmetricsSimca-P和数据库ChemSpider。其缺点是价格昂贵,并且只能与一定的仪器设备兼容。(3)可自主开发设计的编程软件,如美国的Matlab软件。自编软件的特点是可根据自己的需要,设计编写出一套非常适合自己使用的数据处理软件,并且可以实现多种功能。如澳大利亚RMIT大学的Adams小组和浙江大学程翼宇研究组都自主编写了相关程序用于各自的代谢组学研究。其缺点是使用者需要具备一定的软件编程知识,对于初学者不易上手。综上分析,这三类分析软件都有自己的特点,可以满足不同使用者的需求。在代谢组学中广泛应用的信号滤噪技术是正交信号校正技术(OSC)。与普通的谱图滤噪技术不同,OSC滤掉与类别判断正交(不相关)的变量信息,只保留与类别判断有关的变量,从而使类别判别分析能集中在这些与类别的判别相关的变量上,提高判别的准确性。如基于LC-MS联用的代谢组学方法,流动相组成的微小变化、梯度的重现性、柱温的微小变化及其柱表面的状态变化而导致的保留时间的差异都可由OSC进行过滤。峰识别过程一般由电脑计算完成,主要依据信噪比进行有效峰和背景噪音的响应强度进行对比筛选,根据不同条件可设置不同的信噪比值。色谱图中所有峰信息识别完成后,需对谱图实行对称峰对齐,使相同的代谢产物在生成的数据矩阵中由同一个变量表示,使各样本的数据尽量得到正确的比较。由于保留时间的重复性问题,HPLC中的峰匹配要相对困难。XCMS创新性地使用了非线性拟合保留时间校正法,这种方法通过一种特殊的算法将同一标志物在不同样品中的保留时间进行归一化处理,算出保留时间之间的偏差,进而对物质在所有样品中的保留时间进行校正,有效地解决了LC-MS联用中出现的保留时间漂移问题。经过数据的预处理后,最后得到的用于模式识别的数据为二维矩阵数据形式,其中,行代表样品或实验数目,列则表示相应的单个测定指标(通常为相对分子质量、保留时间和代谢物的信号强度等)。3.2数据分析中主成分回归模型经过一系列步骤的数据预处理后,代谢组学研究得到的仍然是大量多维的数据信息。为了充分挖掘所获得数据中的本质和潜在信息,对数据的分析需要应用一系列化学计量学方法如多变量分析方法(MVA)来处理。根据研究对象和目的不同,代谢组学的数据处理主要涉及4个层次:代谢物靶标分析、代谢物轮廓(谱)分析、代谢指纹分析和代谢组学。应用最多的是代谢指纹分析,即从检测到的代谢产物信息中进行两类(如缺氧预适应前后小鼠的状态)或多类(如不同表型间代谢产物)的判别分类,以及生物标志物的发现。数据指纹分析过程中应用的主要手段为模式识别技术,包括非监督学习方法和有监督学习方法。非监督学习方法主要有主成分分析(PCA)、非线性映射和聚类分析等。有监督学习方法主要是基于PCA、偏最小二乘法(PLS)、神经网络的改进方法,常用的有类模拟软独立建模和偏最小二乘法-判别分析(PLS-DA)。作为非线性的模式识别方法,人工神经元网络(ANN)技术也得到广泛应用。目前应用得较为广泛的模式识别软件为SIMCA-P+,其对其他软件导出的数据格式都有很好的兼容性。SIMCA-P+软件利用PCA和PLS-DA这两种代谢组学研究中最常用的模式识别方法,对数据集的分类信息、溢出值和趋势走向信息等进行判断。得到的主成分是由具有相关性的原始变量通过线性组合得到的相互正交的新变量,这些新变量包含了原始数据的大部分信息,一般只需要两三个主成分就能提供原始数据80%以上的信息。偏最小二乘回归与主成分回归的不同之处在于得分因子的提取方法不同,简而言之,主成分回归产生的权重矩阵W反映的是预测变量X之间的协方差,偏最小二乘回归产生的权重矩阵W反映的是预测变量X与响应变量Y之间的协方差。通常以得分图(scoreplot)获得对样品分类的信息,载荷图(loadingplot)获得对分类有贡献变量及其贡献大小,从而用于发现可作为生物标志物的变量(图1,图2)。4代谢产物的质谱鉴定查询数据库的直接目的是为了解释得到的质谱信号,主要是根据代谢物的相对分子质量和碎片结构信息,从而推断代谢物的化学结构;其次,一些功能数据库还可以查询到代谢物的生物功能、代谢节点和代谢途径等信息。与基因组学和蛋白组学已有较完善的数据库供搜索使用相比,目前代谢组学研究尚无类似的功能完备数据库。一些数据库只提供依据相对分子质量进行检索代谢产物,这对实验仪器设备提出了很高的要求,至少需要达到Q-TOF-MS和FT-ICR-MS的级别。另外,还有一些数据库可以根据代谢产物的裂解碎片进行检索,但代谢产物在不同的实验条件下,如离子源、轰击能量、正负离子的选择等可导致分子的碎片结构有很大的差异,从而使确定代谢产物变得比较复杂。目前尚没有哪个数据库提供了完整的代谢产物的质谱碎片结构,因此,代谢组学中代谢产物或生物标志物的质谱信号的解释工作还存在着较大的困难和不确定性。根据不同的用途和特点,有关代谢组学的质谱数据库大致可以分为3类:(1)一般的化学数据库,主要为天然或人工合成的化合物,如ChEBI、ChemFinder、ChemnetBASE、CSLS、EnhancedNCIdatabaseBrowser、Feihnlibrary、KEGGliganddatabase、MadisonMetabolomicConsortiumDatabase、MassBank、MerckIndex、NIST、PubChem、SDBS和SciFinder等;(2)有关解释代谢产物和代谢途径的数据库,如BioCyc(HumanCyc和MetaCyc)、MMP等;(3)源自于特定项目研究的代谢产物数据库,如Golm、HMDB、KNApSAcK、LipidMaps、LipidBank、Me
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北省部分省级示范高中2024~2025学年下学期高一期中测试数学答案
- 江苏省海门市2024-2025学年初三第四次月考物理试题试卷含解析
- 四川长江职业学院《信息技术基础》2023-2024学年第二学期期末试卷
- 武汉信息传播职业技术学院《文化创意产品设计》2023-2024学年第二学期期末试卷
- 六盘水幼儿师范高等专科学校《植物地理学实验》2023-2024学年第二学期期末试卷
- 山东省青岛市胶州市重点名校2024-2025学年初三数学试题第一次联考试题含解析
- 上饶卫生健康职业学院《商业银行业务与经营》2023-2024学年第二学期期末试卷
- 唐山幼儿师范高等专科学校《质量统计分析》2023-2024学年第二学期期末试卷
- 江西省抚州市临川二中学、崇仁二中学2025届初三第三次联合模拟化学试题含解析
- 山东省青岛市市北区2025年初三4月模拟训练化学试题含解析
- 电梯井内脚手架搭拆施工专项方案
- 涉外商标实务培训课件
- 2022年2月兴业银行审计部招聘人员模拟试题3套(含答案解析)
- 社会研究方法复习资料(风笑天版)
- 《青年友谊圆舞曲》音乐课件
- 博士后出站研究报告
- 中华人民共和国海关进出境自用物品申请表
- 高一语文《赤壁赋》 完整版课件PPT
- 纸包装生产企业设备管理课件
- 北师大版小学数学二年级下册第三单元《练习二》教学设计建议及课本习题解析
- 货物交接单范文
评论
0/150
提交评论