版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022-2-251第三节 ARIMA预测方法陈炳为2022-2-2522022-2-253传统的时间序列分析的应用, 主要是确定性的时间序列分析方法, 包括指数平滑法、滑动平均法、时间序列的分解等等, 这些方法的应用有一个前提条件: 时间序列的随机性部分相对来说并不显著。事实上, 这一条件在大多数情况下都是不成立的。因为, 随着社会的发展, 许多不确定性因素的影响越来越大, 必须引起人们的重视。2022-2-2541970 年, Box 和Jenkins 提出了以随机理论为基础的时间序列分析方法, 使时间序列分析理论上升到一个新的高度, 预测的精确度大大提高。其基本模型有三种: 自回归(AR
2、) 模型; 滑动平均(MA) 模型自回归滑动平均(AR IMA) 模型。2022-2-255两个问题:(1)分析时间序列的随机性、平稳性和季节性;(2)在对时间序列分析的基础上,选择适当的模型进行预测 (AR(p),MA(q),ARIMA(p, d,q)。2022-2-2561 ARIMA预测数学模型 自回归滑动平均混合模型(autoregressive integrated moving average) ARIMA(p,d,q)其中:p为自回归的阶数;d为差分阶数;q为滑动平均阶数。2022-2-257ARIMA模型可分为:(1)自回归模型(AR),即ARIMA(p,0,0);(2)滑动平
3、均模型(MA),即ARIMA(0,0,q);(3)自回归滑动平均混合模型(ARIMA(p,d,q)。2022-2-258 ARIMA方法依据的基本思想:将预测对象随时间推移而形成的时间序列视为一个随机序列,即除去个别偶然原因引起的观测值外,时间序列是一组依赖于时间t的随机变量。这组随机变量所具有的依存关系或自相关性表征了预测对象发展的延续性,而这种自相关性一旦被相应的数学模型描述出来,就可以从时间序列的过去及现在的值预测未来值。2022-2-259运用ARIMA方法的前提条件:作为预测对象的时间序列是一零均值的平稳时间序列。平稳随机序列的统计特性不随时间的推移而变化。直观的看,平稳随机序列的折
4、线图无明显的上升或下降趋势。(如图2210)2022-2-2510 对非零均值的非平稳的时间序列,若用ARIMA预测方法,需先对时间序列进行零均值化和差分平稳化处理. 零均值化:对均数不为零的序列每一项都减去该序列的平均数,构成一个均值为零的新的时间序列。 如例222:可取YYXtt2200Y2022-2-2511 差分平稳化处理 (I)对均值为零的非平稳时间序列进行差分,使之成为平稳时间序列。一般情况下,非平稳序列经过一阶差分或二阶差分都可以平稳化。如:有线性增长趋势的时间序列可用一阶差分;若为二次增长可用二阶差分。)2() 1(121tXXXtXXXtttttt2022-2-2512月份7
5、17171717171717171717171门诊人数(千)7006005004003002001000例22-3某医院从1990年1月2001年12月的门诊量数据(P336)门诊情况的序列图2022-2-2513月份5915915915915915918006004002000-200-400门诊人数(千)均零法一阶差分门诊、均零、一阶差分法的序列图2022-2-2514171717171717171717171717月 份-2000200400600DIFF(PEOPLE,1)DIFF(people,2)门 诊 人 数 ( 千 )门诊、一阶差分法、二阶差分的序列图2022-2-2515具体
6、计算:2022-2-2516自回归模型(AR)经典统计中的回归模型:表示因变量对于自变量依赖(相关)关系。等式右侧将随机变量 分解成两部分,一部分是自变量 它们代表某些已知的可变化因素;另一部分是残差量 ,它是由一些不可捉摸的因素及测量误差产生。通常假定 为正态零均值独立序列。ttrrtttXXXY2211tYtt2022-2-2517 将经典统计回归模型推广,得到一类新的线性模型称为自回归模型。可用来描述某些时间序列。特别是当时间序列难于和其它因素建立联系时,用自回归模型建模更显重要。Yt代表在t时的观察值,et代表误差或偏差,表示不能用模型说明的随机因素。tptptttYYYY221120
7、22-2-2518此模型和经典统计回归模型的本质区别:在经典统计回归模型中 是已知的可变化因素。自变量间的关系是相互独立的。在自回归模型中 同属于一个序列,它们彼此之间不是独立的,而是有一定的相互依赖关系。pttttYYYY,21和),(21trttXXX2022-2-2519一阶自回归模型上面 的模型称为p阶自回归模型。当p1时是一阶自回归模型。意义: Yt变量受Yt-1的影响。tttYY112022-2-2520例如:考虑一个阻尼单摆。以Yt表示 t时刻的最大摆幅,由于阻尼的作用,Yt与Yt-1之间具有关系式:式中的 代表阻尼系数。 表示第t个摆动周期中单摆还受到外加的力所额外加的摆幅。t
8、ttYY111t2022-2-2521滑动平均(MA)模型式中 是时间序列在 t时刻的观察值;q是滑动平均的阶数; 是时间序列模型在t时刻的误差或偏差。在滑动平均的过程中,每一个值是由当前干扰以及前一个或多个干扰的均值决定的。滑动平均的阶确定了有多少个前干扰被用于平均。qtqttttY2211tYt2022-2-2522三、自回归滑动平均混合(ARIMA)模型将自回归模型和滑动平均模型组合,便构成自回归滑动平均混合(ARIMA)模型qtqtttptptttXXXX221122112022-2-2523应用ARIMA方法预测分为三个阶段:模型的识别:利用自相关分析和偏相关分析等方法,分析时间序列
9、的随机性、平稳性及季节性,并选定一个特定的模型以拟合所分析的时间序列。1. 2022-2-25242 模型中参数的估计和模型的检验:用时间序列的数据,估计模型的参数,并进行检验,以判定该模型是否恰当。3 预测应用:用选定的模型对将来某个时刻的数值作出预测。2022-2-2525ARIMA的计算步骤1、识别 必须确定三个整数p,d,q,另外还须确定是否具有周期性。首先应从散点图判别时间序列是否平稳。从上面差分之后的图可见: 进行一阶差分I(1)=ARIMA(1)之后,其随机性较好。故d=1。 I(2)=ARIMA(2) d通常取为0或1,一般不超过2。 如图22-10 d=02022-2-252
10、6p的确定:AR(p)=ARIMA(p,0,0)。其意义为在自回归序列中,每个值都是前一个值或多个值的线性组合。AR(1)代表每个值对前值的依赖程序。对于非周期的时间序列,P值的决定可取决于PACF。若Lag滞后项开始急剧减小,则通常令p=Lag。否则是拖尾的,其p=0。如:图22-12,P=0。2022-2-2527 q值的确定: 滑动平均MA(q),每一项是由当前干扰以及前或一个或前多个干扰的均值决定的。 MA(q)= ARIMA(0,0,q)对于非周期的时间序列,q值的决定可取决于ACF。若在Lag滞后项开始急剧减小,则通常令q=Lag。否则是拖尾的,其q=0。如:图22-12,由于在滞
11、后1处显示了一个负的低谷,其后几个值与其相差较大。故q=1。2022-2-25282、估计 给出模型后ARIMA(0,1,1),计算模型的参数,并获得 拟合值或预测值(FIT_1) 、残差(ERR_1)、其可信限(LCL_1,UCL_1)及标准误(SEP_1)。 结果表22-7,模型中MA1=0.78105,表示序列中的每个值等于当前的随机干扰减去前一个随机干扰的0.78倍。2022-2-25293 诊断可从两个方面考虑:(1)残差的ACF和PACF不应与0有显著的差异。 ACF、PACF高阶相关相关可能偶尔会超过95%的可信区间,但如一或二阶很大,那么模型就是错误的。2022-2-2530
12、(2)残差应是随机的,即是白噪声(white noise)。可用Box-Ljung Q统计量。应在大约有1/4的滞后项中考察Q值(但滞后项不能多于50)。Q统计量应没有统计学意义。 (3)考察AIC和SBC 考虑多个模型,如AIC与SBC均小,说明这个模型较好。AIC适用于自回归模型,SBC适用于更通用的模型。2022-2-2531(4)控制图的建立 可在同一个序列图中,作出其实测值、95%的可信限上、下界及预测值。 图22-14。2022-2-2532季节性ARIMA模型(seasonal ARIMA)。JAN 1990MAY 1990SEP 1990JAN 1991MAY 1991SEP
13、1991JAN 1992MAY 1992SEP 1992JAN 1993MAY 1993SEP 1993JAN 1994MAY 1994SEP 1994JAN 1995MAY 1995SEP 1995JAN 1996MAY 1996SEP 1996JAN 1997MAY 1997SEP 1997JAN 1998MAY 1998SEP 1998JAN 1999MAY 1999SEP 1999JAN 2000MAY 2000SEP 2000JAN 2001MAY 2001SEP 2001Date100200300400500600700门诊人数(千)2022-2-2533ARIMA(0,1,1)1
14、2 代表12为周期。1 季节性后移算子 B(backfit)代表时间序列后移一时间点考察。B2代表往后移动两个单位。对于周期为12的观察值,则为B12季节性ARIMA(0,0,1)12 Zt=(1-B12)etARIMA(0,1,1)12 (1-B12)Zt=(1-B12)et2022-2-25342 识别季节模型的一些问题 (1) 序列的长度要较长。如至少应有7或8个季节周期的数据。 (2)季节性与非季节性的混合 若ACF或PACF或两者在季节周期的整数倍时点处都显示了特别 值,说明存在季节过程。 2022-2-2535135791113151719212325272931333537394
15、143454749Lag Number-1.0-0.50.00.51.0ACFCoefficientUpper Confidence Limitelement_simpleline_2135791113151719212325272931333537394143454749Lag Number-1.0-0.50.00.51.0Partial ACFCoefficientUpper Confidence LimitLower Confidence Limit门 诊 人 数 ( 千 )(1)ACF图和PACF图2022-2-25361次差分后的序列图FEB 1990JUN 1990OCT 1990
16、FEB 1991JUN 1991OCT 1991FEB 1992JUN 1992OCT 1992FEB 1993JUN 1993OCT 1993FEB 1994JUN 1994OCT 1994FEB 1995JUN 1995OCT 1995FEB 1996JUN 1996OCT 1996FEB 1997JUN 1997OCT 1997FEB 1998JUN 1998OCT 1998FEB 1999JUN 1999OCT 1999FEB 2000JUN 2000OCT 2000FEB 2001JUN 2001OCT 2001Date-100-50050100门诊人数(千)Transforms:
17、difference(1)2022-2-2537(2)季节模型的识别1次差分存在问题(1) 仍存在季节性问题,仍有上升的趋势,可考虑用季节性差分。(2) 方差非齐,可考虑用对数变换。2022-2-2538季节性差分中 D=1。 季节性差分可平滑急剧的季节波动。左图为一次性季节差分后的序列图。JAN 1991JUN 1991NOV 1991APR 1992SEP 1992FEB 1993JUL 1993DEC 1993MAY 1994OCT 1994MAR 1995AUG 1995JAN 1996JUN 1996NOV 1996APR 1997SEP 1997FEB 1998JUL 1998DE
18、C 1998MAY 1999OCT 1999MAR 2000AUG 2000JAN 2001JUN 2001NOV 2001APR 2002SEP 2002FEB 2003JUL 2003DEC 2003Date-600-400-2000门诊人数(千)Transforms: seasonal difference(1, period 12)2022-2-2539135791113151719212325272931333537394143454749Lag Number-1.0-0.50.00.51.0Partial ACFCoefficientUpper Confidence LimitLower Confidence Limit门 诊 人 数 ( 千 )135791113151719212325272931333537394143454749Lag Number-1.0-0.50.00.51.0ACFCoefficientUpper Confidence LimitLower Confidence Limit门 诊 人 数 ( 千 )对数变换,1次季节性差分2022-2-2540 在时点12时出现一个单一的低谷,故Q=1。即考虑季节性模型为ARIMA(0,1,1)。 (3) 从残差中识别非季节性模型: 若季节性模型的识别是正确的,真实值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《农业银行北京分行风险失控问题研究》
- 《徐香猕猴桃组培快繁技术研究》
- 《我国利率市场化对通货膨胀的影响研究》
- 《共享经济视角下乡村物流配送模式优化研究》
- 《对哈他瑜伽体式的运动学特征研究》
- 《叶片型面机器人抛磨加工轨迹规划研究》
- 《上海“孤岛”时期杂文创作研究》
- 《我国商业银行系统性风险的防范与控制研究》
- 托儿所接送服务合同
- EDA电子设计自动化工具软件许可协议
- 工程伦理案例分析-毒跑道事件
- 小儿鼻炎调理课程课件
- 股东损害公司债权人利益责任纠纷起诉状(成功范文)
- 家庭财务管理系统
- 逆向思维的含义与作用课件教学
- 冠寓运营管理手册
- 2023年上海市15区物理中考一模分类汇编6伏安法测电阻、测电功率含答案
- 解剖学讲脑干
- 仙桃市自然灾害救助应急预案操作手册
- 2023国家开放大学:人文英语4边学边练1-6答案
- “小哥白尼杯”科普知识竞赛题库
评论
0/150
提交评论