




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、摘要: 所有移动平均法都存在很多问题。它们都太难计算了。每个点的计算都让你绞尽脑汁。而且也不能通过之前的计算结果推算出加权移动平均值。移动平均值永远不可能应用于现有的数据集边缘的数据,因为它们的窗口宽度是有限 .所有移动平均法都存在很多问题。它们都太难计算了。每个点的计算都让你绞尽脑汁。而且也不能通过之前的计算结果推算出加权移动平均值。移动平均值永远不可能应用于现有的数据集边缘的数据,因为它们的窗口宽度是有限的。这是一个大问题,因为数据集边缘的变动形态一般都是我们最感兴趣的部分。类似地,移动平均法也不能应用于现有数据集的范围之外。其结果是,它们对预测毫无用处。幸运的是,有一种很简单的计算方案能
2、够避免所有这些问题。它叫指数平滑法(exponential smoothing)或Holt-Winters法。指数平滑法有几种不同形式:一次指数平滑法针对没有趋势和季节性的序列,二次指数平滑法针对有趋势但 没有季节性的序列。术语“Holt-Winters法”有时特指三次指数平滑法。所有的指数平滑法都要更新上一时间步长的计算结果,并使用当前时间步长的数据中包含的新信息。它们通过“混合”新信息和旧信息来实现,而相关的新旧信息的权重由一个可调整的拌和参数来控制。各种方法的不同之处在于它们跟踪的量的个数和对应的拌和参数的个数。一次指数平滑法的递推关系特别简单: 其中, 是时间步长i上经过平滑
3、后的值, 是这个时间步长上的实际(未平滑的)数据。你可以看到 是怎么由原始数据和上一时间步长的平滑值 混合而成的。拌和参数 可以是0和1之间的任意值,它控制着新旧信息之间的平衡:当 接近1时,我们就只保留当前数据点(即完全没有对序列进行平滑);当 接近0时,我们就只保留前面的平滑值(也就是说整个曲线都是平的)。为何这个方法被称为“指数”平滑法?要找出答案,展开它的递推关系式即可知道: 从这里可以看出,在指数平滑法中,所有先前的观测值都对当前平滑值产生了影响,但它们所起的作用随着参数 的幂的增大而逐渐减小。那些相对较早的观测值所起的作用相对较小,这也就是指数变动形态所表现出来的特性。
4、从某种程度上来说,指数平滑法就像是拥有无限记 忆且权值呈指数级递减的移动平均法。(同时也要注意到所有权值的和,等于1,因为当q<1 时,几何序列 。参见附录B的几何序列方面的信息。)一次指数平滑所得的计算结果可以在数据集范围之外进行扩展,因此也就可以用来进行预测。预测也非常简单: 其中, 是最后一个已经算出来的值。也就是说,一次指数平滑法得出的预测在任何时候都是一条直线。刚刚描述的一次指数平滑法适用于没有总体趋势的时间序列。如果用来处理有总体趋势的序列,平滑值将往往滞后于原始数据,除非 的值接近1,但这样一来就会造成不够平滑。二次指数平滑法保留了趋势的详细信息,从而改
5、正了这个缺点。换句话说,我们保留并更新两个量的状态:平滑后的信号和平滑后的趋势。它有两个等式和两个拌合参数: 我们先看看第二个等式。这个等式描述了平滑后的趋势。当前趋势的未平滑“值”是当前平滑值和上一个平滑值的差;也就是说,当前趋势告诉我们在上一个 时间步长里平滑信号改变了多少。要想使趋势平滑,我们用一次指数平滑法对趋势进行处理,并使用拌合参数 。为获得平滑信号,我们像上次那样进行一次混合,但要同时考虑到上一个平滑信号及趋势。第一个等式的最后那个项可以对当前平滑信号进行估计假设在单个 时间步长里我们保持着上一个趋势。若要利用该计算结果进行预测,我们就取最后那个平滑值,然后每增加一个时
6、间步长,就在该平滑值上增加一次最后那个平滑趋势: 最后,我们给三次指数平滑法添加第三个量,用来描述季节性。我们有必要区分一下累加式和累乘式季节性,累加式对应的等式: 累乘式的等式: 其中,pi 是指“周期性”部分, 是这个周期的长度。前面的等式中也包含预测的等式。所有的指数平滑方法都是基于递推关系的,这表明我们要先设定初始值才能使用它们。选择什么样的初始值并不特别重要:指数式衰减规律说明所有的指数平滑方法的“记忆”能力都是很短的,只需经过几个时间步长,初始值的影响就会变得微乎其微。一些合理的初始值: 且 对三次指数平滑法而言,我们必须初始化一个
7、完整的“季节”的值,不过我们可以简单地设置为全1(针对累乘式)或全0(针对累加式)。只有当序列的长度较短时,我们才需要慎重考虑初始值的选取。最后一个问题是如何选择拌合参数。 我的建议是反复试验。先试试0.2和0.4之间的几个值(非常粗略地),然后看看会得到什么结果。或者也可以为(实际数据和平滑算法的结果之间的)误差定 义一个标准,再使用一个数值优化过程来将误差最小化。就我的经验而言,一般没有必要弄得这么麻烦,原因至少有两个:数值优化是一个不能保证收敛的迭代过 程,最终你可能还需要花非常多时间将算法设计成收敛的。此外,任何这样的数值优化都受限于你选对误差进行最小化的表达式。问题是使误差最小化的参
8、数值可能 并不能满足在解决方案中你想要看到的其他特性(也就是近似值的精确性和结果曲线的平滑程度之间的平衡),那么,到最后你才会发现,手动的计算方法往往更 好。不过,如果你要预测很多序列,花些精力构建一个能自动决定最优参数值的系统也是值得的,但要实现这个系统恐怕也并不容易。最后,我想用一个例子来展示我们想从指数平滑法得到的结果。下图是一个经典的数据集,它显示的是每个月国际航班的旅客数量(单位:千人) 。该图显示了实际数据和三次指数近似值。19491957年用来“训练”生成它的算法,而19581960年都是预测数值。注意,这里的预测值与实际 数据相当接近特别是它强烈的季节形态持续了一段如此长的预测
9、时段(整整三年!)。对于像这样简单的方法来说,是很不错的。时间序列挖掘-预测算法-三次指数平滑法(Holt-Winters)在时间序列中,我们需要基于该时间序列当前已有的数据来预测其在之后的走势,三次指数平滑(Triple/Three Order Exponential Smoothing,Holt-Winters)算法可以很好的进行时间序列的预测。 时间序列数据一般有以下几种特点:1.趋势(Trend) 2. 季节性(Seasonality)。 趋势描述的是时间序列的整体走势,比如总体上升或者总体下降。下图所示的时间序列是总体上升的:
10、0; 季节性描述的是数据的周期性波动,比如以年或者周为周期,如下图: 三次指数平滑算法可以对同时含有趋势和季节性的时间序列进行预测,该算法是基于一次指数平滑和二次指数平滑算法的。 一次指数平滑算法基于以下的递推关系: si=xi+(1-)si-1 其中是平滑参数,si是之前i个数据的平滑值,取值
11、为0,1,越接近1,平滑后的值越接近当前时间的数据值,数据越不平滑,越接近0,平滑后的值越接近前i个数据的平滑值,数据越平滑,的值通常可以多尝试几次以达到最佳效果。 一次指数平滑算法进行预测的公式为:xi+h=si,其中i为当前最后的一个数据记录的坐标,亦即预测的时间序列为一条直线,不能反映时间序列的趋势和季节性。 二次指数平滑保留了趋势的信息,使得预测的时间序列可以包含之前数据的趋势。二次指数平滑通过添加一个新的变量t来表示平滑后的趋势: si=xi+(1-)(si-1+ti-1) ti=ß(si-si-1)+(1-
12、3;)ti-1 二次指数平滑的预测公式为 xi+h=si+hti 二次指数平滑的预测结果是一条斜的直线。 三次指数平滑在二次指数平滑的基础上保留了季节性的信息,使得其可以预测带有季节性的时间序列。三次指数平滑添加了一个新的参数p来表示平滑后的趋势。 三次指数平滑有累加和累乘两种方法,下面是累加的三次指数平滑 si=(xi-pi-k)+(1-)(si-1+ti-1) ti=ß(si-si-1)+(1-ß)ti-1 pi=(xi-si)+(1-)pi-k
13、0;其中k为周期 累加三次指数平滑的预测公式为: xi+h=si+hti+pi-k+(h mod k) 注意:数据之魅P88此处有错误,根据Wikipedia修正。下式为累乘的三次指数平滑: si=xi/pi-k+(1-)(si-1+ti-1) ti=ß(si-si-1)+(1-ß)ti-1 pi=xi/si+(1-)pi-k 其中k为周期 累乘三次指数平滑的预测公式为: xi+h=(si+hti)pi-k+(h mod k) 注意:数据之魅P88此处有错误,
14、根据Wikipedia修正。 ,ß,的值都位于0,1之间,可以多试验几次以达到最佳效果。 s,t,p初始值的选取对于算法整体的影响不是特别大,通常的取值为s0=x0,t0=x1-x0,累加时p=0,累乘时p=1. 我们使用DataMarket的International Airline Passengers数据来测试累加和累乘三次指数平滑算法的性能,该数据记录的是每月的国际航线乘客数: 下图为使用累加三次指数平滑进行预测的效果:其中红色为源时间序列,蓝色为预测的时间序列,ß,的取值为0.45,0.2,0.95: 下图为累乘三次指数平滑进行预测的效果,ß,的取值为0.4,0.05,0.9:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年十一月份全屋降噪工程实施后录音棚租赁合同
- 语音练习的普通话考试试题及答案
- 小学安全教育教学课件
- 二零二四年份三月装修合同智能门锁应急供电接口条款
- 初中爱国卫生月活动总结
- 2025企业合同范本下载2
- 灭火器采购合同范本
- 2025年商丘道路客货运输从业资格证模拟考试下载
- 案防培顺课件
- 临时便道施工合同标准文本
- 长征与长征精神的历史意义和现实价值
- pet薄膜生产工艺
- 中学生如何预防网络诈骗
- 市集活动策划方案
- 学校食堂设备安全操作规程
- 桥梁美学与景观设计
- 2023届上海市虹口区高三年级上册一模英语试题(解析版)
- 液压式打包机安全操作规程范本
- (新版)首席质量官认证考试复习题库-上(单选题汇总)
- 建筑施工中小型施工机具验收记录表
- 4.3 TIA博途软件的调试
评论
0/150
提交评论