高斯过程在机器学习中的应用_第1页
高斯过程在机器学习中的应用_第2页
高斯过程在机器学习中的应用_第3页
高斯过程在机器学习中的应用_第4页
高斯过程在机器学习中的应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、西安郵電大学科 研 训 练 报 告 书基于高斯过程在机器学习中的应用 摘 要高斯过程是近年来发展起来的一种新的机器学习方法,它有着严格的统计学习理论基础,对处理高维数非线性小样本复杂问题具有良好的适应性。对列车精准停车问题的这种复杂的非线性问题,将高斯过程机器学习方法应用于此问题,并提出相应的模型 ,减少数据间复杂的内在物理或其他关系。很多工程实例研究表明,高斯过程机器学习模型是科学可行的,预测精度高,简单实用,对很多问题问题具有较好的适用性。关键词:高斯过程;机器学习;列车精准停车Abstract Gaussian processes ( GP) is a newly developed m

2、achine learning method based on the strict statistical learning theory. GP is capable of solving the highly nonlinear problem with small samples and high dimensions.Precise train stopping complex nonlinear problem, GP machine learning model applied to this problem, and propose a model to reduce the

3、complexity of data between the intrinsic physical or other relationship. Case studies show that many of the works, GP machine learning model is scientific and feasible, the prediction accuracy is high, simple and practical, on many issues the problem has good applicability.Key Words: Gaussian proces

4、ses;machine learning;precise train stopping1引言列车(包括火车、地铁、轻轨等轨道交通工具)的精确停车是轨道交通控制系统中的一项关键技术。对于有效使用站台屏蔽门、保证乘客安全、较少乘客换乘时间等有着至关重要的作用。然而就实际物理模型建模时收到很多方面的制约,且耗费大量的金钱。通过研究,将实际上依赖于物理模型的建立和控制参数的调整,而采用对数据本身的练习进行学习和建模。如果能从数据中学习到列车精确停车的规律,则可以在保证列车达到精确停车所需指标的同时,大量节省硬件方面的费用,并建立数据规律,同时使结果与实际模型相联系,促进物理模型的建立。因此,在利用机器

5、学习来分析列车精确停车问题时,不需要过多关注各种复杂的如轨道坡度、摩擦系数、天气状况、乘客数量等外在因素,而只需关注对精度有明显影响的因素如停车的初始速度及距离等。在本文中,将研究机器学习领域的高斯过程(Gaussian Process,GP),并以实际的列车停车数据做了相关评测。2 .高斯过程在机器学习领域中,GP 是指在高斯随机过程与贝叶斯学习理论基础上发展起来的一种机器学习方法。在统计学理论中,GP 是这样的一个随机过程:其任意有限变量集合的分布都是高斯分布,即对任意整数及任意的一族随机变量 X,与其对应的 t 时刻的过程状态的联合概率分布服从 n 维高斯分布。GP 的全部统计特征完全由

6、它的均值和协方差函数 来确定,其定义式表示如下 : (1)GP 可用于解决回归和分类两类问题,受篇幅限制,本文仅对GP回归模型的基本原理做简单介绍,具体参见文献 1。假设有 n 个观察数据的训练集 ,d 维输入矢量 , 相应的输出标量。如果 X 表示维输入矩阵,表示输出矢量,那么训练集 , 对于新的输入,GP 模型的任务是根据先验知识预测出与相对应的输出值。假设观察目标值被噪声腐蚀, 它与真实输出值相差: (2)其中为独立的随机变量,符合高斯分布,均值为0,方差为,即 (3)观察目标值的先验分布为 (4)式中:为阶对称正定的协方差矩阵,矩阵中的任一项度量了和的相关性。个训练样本输出和1个测试样

7、本输出 所形成的联合高斯先验分布为:(5) 式中, 是测试点与训练集的所有输入点 X 的阶协方差矩阵, 可简写为; 是测试点自身的协方差。GP 可选择不同的协方差函数。协方差函数需要满足:对任一点集都能够保证产生一个非负正定协方差矩阵。常用的协方差函数为: (6) 协方差函数的超参数 、 对预测结果的影响甚大。最优超参数可通过极大似然法获得,即通过建立训练样本条件概率的对数似然函数对超参数求偏导,再采用共轭梯度优化方法搜索出超参数的最优解。对数似然函数的形式为: (7)获得最优超参数后,下一步就可以进行预测,具体过程是:根据贝叶斯原理在训练集的基础上预测出与对应的最可能的输出值。采用贝叶斯原理

8、的目的是利用观察到的真实数据不断更新概率预测分布,即给定新的输入、 训练集的输入值X 和观察目标值的条件下,推断出的最大可能的预测后验分布 ,预测后验分布是高斯型的: (8) 的均值和方差为 (9) (10) 2 . 2 建立列车精准停车的高斯过程模( 1) 根据列车精准停车的若干实测值建立学习样本,输入向量代表列车精准停车的影响因素;输出标量代表实测地下水位埋深 。(2) 当列车精准停车的各影响因素的数量级相差较大或同一控制因素的离散性过大时,不利于 GP 的学习,需要对样本数据和预测样本数据进行如下标准化处理 : (11) 式中:为标准化后的值 ,第个指标 。( 3) 对学习样本进行学习,

9、通过学习样本的对数似然极大化获得最优的超参数 。( 4) 根据式 ( 9) 获得测试样本( 新的影响列车精准停车的主要因素) 对应的列车精准停车的预测均值 。3 结语 (1)在实际应用中,应尽可能多地收集与分析列车精准停车相关的各种影响因素的信息资料,通过丰富学习样本提高高斯过程学习的效果,若能充分考虑自然环境的影响因素并把相关信息纳入学习样本,可以进一步提高高斯过程模型预测结果的。(2)在实际应用中高斯过程机器学习,可以将复杂的物理实际模型抽象为内在的数据联系,以多次试验资料作为数据源进行机器学习,就能推断出准确可靠的预测结果,对列车的精准停车的动态预测具有较强的适用性,为克服精准停车测量时条件高度复杂或测量资料不充分情况下数值方法模拟困难的局限性提供有效的途径。(3)实际工程中较多出现的是小样本预测问题,与神经网络相比较,高斯过程机器学习方法对处理小样本预测问题较优,具有很强的适应性。但对于大样本预测的问题,大型协方差矩阵的存储和运算将导致高斯过程的计算负担稍显繁重,为提高高斯过程的计算效率,建议采用稀疏化技术来处理。 参考文献 1 Seeger M. Gaussian processes for machine l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论