基于质谱数据的糖组学解析系统和新方法研究_第1页
基于质谱数据的糖组学解析系统和新方法研究_第2页
基于质谱数据的糖组学解析系统和新方法研究_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于质谱数据的糖组学解析系统和新方法研究质谱(MS)是一种仪器分析技术,它能够有效地解析聚糖结构并提供定性和定量的信息。糖组学是研究生物体内糖的分子结构及生物功能的科学。随着糖组学的发展,大量的聚糖结构通过解析质谱实验数据而确定。最近生物信息技术的发展提供了一个利用聚糖结构数据库和从头算法对MS或MS/MS数据提取有价值的信息的机会。功能糖组学协会(CFG)已经提供的基于网络的资源,使获得聚糖质谱实验数据和聚糖结构信息变得更加容易。然而,大量由质谱获取的聚糖分析的数据需要手动注释。此项工作不但耗时,而且精确度很低。此外,检测被埋没在噪音数据中的低强度信号峰仍然是一个挑战。因此,开发从MS数据中准确预测和注释聚糖结构的算法是非常需要的。本研究开发了一种基于匹配聚糖分子的同位素相对丰度(mGIA)的方法来预测和注释聚糖的单糖组成(糖组成)和单糖间连接方式(糖结构)的算法,它利用质谱数据中分子同位素的观测质荷比值,丰度特征以及两者之间的关系。我们首先构建了一个完整的聚糖分子的单糖组成库,其中包含了808个聚糖的单糖以及聚糖分子相应的同位素理论丰度。同时,我们利用CFG数据库中得到的样品数据并结合了一个有效的数据预处理技术生成了含有所有候选组成的数据集。数据预处理是为了从MS数据中精确地提取聚糖同位素观测峰簇,包括基线消除,平滑去噪,峰质心化处理和一个基于库的组成匹配方法。有别于大多数已报道的方法,我们不仅考虑到峰的质荷比值特征,还引入了相应的聚糖分子同位素的理论和观测丰度向量之间的欧几里德距离。为了解决不同聚糖分子同位素会出现重叠的问题,我们在匹配计算中增加了对重叠的区域的预测和识别。如果两个匹配到的组成的质荷比的差值接近于1至4之间的一个整数,并且每个峰各有一个相匹配的理论聚糖组成,那么我们就认为这两个糖组成的前五个同位素峰的质荷比是一个潜在的重叠区域。在每个样品数据中,我们都发现了超过20个潜在的重叠区域。我们通过构建一个最优化模型对每个潜在的重叠区域内的聚糖同位素簇进行了去卷积处理从而改善了mGIA算法。为了提高聚糖结构注释的精确度,我们提出了一个线性分类的评估方法。在分类器获取过程中,我们使用支持向量机(SVM)算法训练了三个候选聚糖组成数据集,它们是源于CFGprofiling数据库中的三个不同的人体组织样品数据。并使用CFGprofiling数据库中的小鼠肾脏样品数据对我们的算法进行了验证,结果显示比他人的注释多鉴定出6个聚糖组成。并且与已报道的算法相比,我们显著改善了对丰度较弱的离子的检测。因为从CFGprofiling数据库的7个CHO样品数据获得的训练数据集具有不平衡性,影响了分类器效果。我们因此尝试了几种不同的采样技术,如过采样技术SMOTE等,分别与支持向量机(SVMs)算法相结合对候选聚糖组成集进行训练。结果显示通过SMOTE-支持向量机算法,所有样品的注释灵敏度平均增长了26.8%。基于这个注释算法,我们开发了一个名为GlycoMaid的系统来帮助用户使用聚糖组成自动标注质谱实验数据,并列出注释的可信度以及所有在CFG数据库中的候选结构链接。软件包和源代码发布在/p/glycomaid/。为了丰富注释的聚糖组成的候选结构集,我们通过一系列酶反应规则模拟了在内质网和高尔基体中的生物合成过程。结果发现具有较高质荷比值的聚糖组成在生成的结果中会出现较多的假阳性结构。我们还尝试使用了组织信息对来自CFG结构数据库的注释结果进行过滤,遗憾的是现有的生物信息非常有限,使得这种方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论