数学建模时间序列分析_第1页
数学建模时间序列分析_第2页
数学建模时间序列分析_第3页
数学建模时间序列分析_第4页
数学建模时间序列分析_第5页
已阅读5页,还剩182页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于数学建模时间序列分析第一张,PPT共一百八十七页,创作于2022年6月7000年前的古埃及人把 尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,从而创建了埃及灿烂的史前文明。引例第二张,PPT共一百八十七页,创作于2022年6月引例第三张,PPT共一百八十七页,创作于2022年6月时间序列:某一系统在不同的时间(地点或其他条件等)的响应(数据)。时间序列是按一定的顺序排列而成,“一定顺序”既可以是时间顺序,也可以是具有不同意义的物理量。如:研究高度与气压的关系,这里的高度就可

2、以看作“时间”总而言之,时间序列只是强调顺序的重要性,因此又被称为“纵向数据”,相对于“横向数据”而言的。什么是时间序列第四张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理 平稳性检验 纯随机性检验 平稳时间序列数据分析非平稳时间序列数据分析 内容提要第五张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理时间序列数据的预处理基本概念平稳性检验纯随机性检验第六张,PPT共一百八十七页,创作于2022年6月概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定 时间序列概率分布族的定义几个重要数字特征:均值 、方差、自协方差、自相关系数时间序

3、列数据的预处理1 基本概念1 .1 基本的数字特征第七张,PPT共一百八十七页,创作于2022年6月特征统计量均值 方差自协方差自相关系数时间序列数据的预处理第八张,PPT共一百八十七页,创作于2022年6月1.2 平稳时间序列的定义严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。 时间序列数据的预处理第九张,PPT共一百八十七页,创作于2022年6月

4、满足如下条件的序列称为宽平稳序列时间序列数据的预处理第十张,PPT共一百八十七页,创作于2022年6月常数均值和方差 自协方差函数和自相关函数只依赖于时间的平移长度,而与时间的起止点无关 延迟k自协方差函数 延迟k自相关系数平稳时间序列的统计性质 时间序列数据的预处理第十一张,PPT共一百八十七页,创作于2022年6月平稳时间序列的意义 时间序列数据结构的特殊性可列多个随机变量,而每个变量只有一个样本观察值平稳性的重大意义极大地减少了随机变量的个数,并增加了待估变量的样本容量极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度时间序列数据的预处理第十二张,PPT共一百八十七页,创作于

5、2022年6月平稳性检验主要有两种方法:根据时序图和自相关图显示的特征做出判断的图检验方法构造检验统计量进行假设检验的方法。时间序列数据的预处理2 平稳性检验第十三张,PPT共一百八十七页,创作于2022年6月时序图检验 根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。自相关图检验 平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。2.1 平稳性的图检验时间序列数据的预处理第十四张,PPT共一百八十七页,创作于2022年6月例1检验19

6、64年1999年中国纱年产量序列的平稳性例2检验1962年1月1975年12月平均每头奶牛月产奶量序列的平稳性例3检验1949年1998年北京市每年最高气温序列的平稳性平稳性检验时间序列数据的预处理第十五张,PPT共一百八十七页,创作于2022年6月例1 平稳性检验时间序列数据的预处理第十六张,PPT共一百八十七页,创作于2022年6月平稳性检验时间序列数据的预处理第十七张,PPT共一百八十七页,创作于2022年6月平稳性检验时间序列数据的预处理第十八张,PPT共一百八十七页,创作于2022年6月例2 自相关图时间序列数据的预处理第十九张,PPT共一百八十七页,创作于2022年6月例3 时序图

7、时间序列数据的预处理第二十张,PPT共一百八十七页,创作于2022年6月例3 自相关图时间序列数据的预处理第二十一张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理等间隔时间数据的录入程序说明(数据的录入)第二十二张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理等间隔时间数据的录入程序说明(数据的录入)第二十三张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理数据的变换程序说明(数据的录入)第二十四张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理取数据中的子集程序说明(数据的录入)第二十五张,PPT共一百八十七页,创作于202

8、2年6月时间序列数据的预处理缺失数据的插入程序说明(数据的录入)第二十六张,PPT共一百八十七页,创作于2022年6月data a;input sha;year=intnx(year,1964,_n_-1);format year year4.;dif=dif(sha);cards;97 130 156.5 135.2 137.7 180.5 205.2 190 188.6 196.7180.3 210.8 196 223 238.2 263.5 292.6 317 335.4 327321.9 353.5 397.8 436.8 465.7 476.7 462.6 460.8501.8 50

9、1.5 489.5 542.3 512.2 559.8 542 567;proc gplot;plot sha*year=1 dif*year=2;symbol1 v=circle i=join c=black;symbol2 v=star i=join c=red;proc arima data=a;identify var=sha nlag=22;run;时间序列数据的预处理1964年1999年中国纱年产量SAS程序第二十七张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理1962年1月1975年12月平均每头奶牛月产奶量SAS程序第二十八张,PPT共一百八十七页,创作于2

10、022年6月时间序列数据的预处理1949年1998年北京市每年最高气温SAS程序第二十九张,PPT共一百八十七页,创作于2022年6月纯随机序列的定义纯随机性的性质纯随机性检验时间序列数据的预处理3 纯随机性检验第三十张,PPT共一百八十七页,创作于2022年6月3.1 纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质 时间序列数据的预处理第三十一张,PPT共一百八十七页,创作于2022年6月标准正态白噪声序列时序图 时间序列数据的预处理第三十二张,PPT共一百八十七页,创作于2022年6月3.2 白噪声序列的性质 纯随机性 各序列值之间没有任何相关关系,即为 “没有记忆”的序列

11、 方差齐性 根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的线性无偏估计时间序列数据的预处理第三十三张,PPT共一百八十七页,创作于2022年6月3.3 纯随机性检验 检验原理假设条件检验统计量 判别原则时间序列数据的预处理第三十四张,PPT共一百八十七页,创作于2022年6月Barlett定理 如果一个时间序列是纯随机的,得到一个观察期数为 的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布时间序列数据的预处理第三十五张,PPT共一百八十七页,创作于2022年6月假设条件原假设:延迟期数小于或等于

12、 期的序列值之间相互独立备择假设:延迟期数小于或等于 期的序列值之间有相关性 时间序列数据的预处理第三十六张,PPT共一百八十七页,创作于2022年6月检验统计量Q统计量 LB统计量 时间序列数据的预处理第三十七张,PPT共一百八十七页,创作于2022年6月判别原则拒绝原假设当检验统计量大于 分位点,或该统计量的P值小于 时,则可以以 的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于 分位点,或该统计量的P值大于 时,则认为在 的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定 时间序列数据的预处理第三十八张,PPT共一百八十七页,创作于2022年6月样本

13、自相关图例4 随机生成的100个服从标准正态的白噪声序列纯随机性检验时间序列数据的预处理第三十九张,PPT共一百八十七页,创作于2022年6月检验结果延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平 ,所以该序列不能拒绝纯随机的原假设。换句话说可以认为该序列的波动没有任何统计规律可循,因此可以停止对该序列的统计分析。时间序列数据的预处理第四十张,PPT共一百八十七页,创作于2022年6月数据预处理部分的小结:序列平稳性与纯随机性检验的基本步骤: 1. 绘制该序列时序图; 2. 自相关图检验; 3. 该序列若是平稳序列,进行纯随机性检

14、验. 实例: 对1950年1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验。 时间序列数据的预处理第四十一张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理data a; input year prop; cards; /*数据省略*/ ; proc gplot; plot prop*year=1; /*所画的图记为图1*/ symbol1 v=diamond i=join c=red; proc arima data=a; identify var=prop; run; 相应的SAS程序第四十二张,PPT共一百八十七页,创作于2022年6月时间序列数据的

15、预处理1. 绘制时序图该序列显示北京市城乡居民定期储蓄所占比例序列波动“貌似” 比较平稳 第四十三张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理2. 自相关图进一步检验平稳性样本自相关图延迟3阶后,自相关系数都落在2倍标准差范围以内,而且自相关系数向零衰减的速度非常快。综合前两个步骤,可知北京市城乡居民定期储蓄所占比例为平稳序列 第四十四张,PPT共一百八十七页,创作于2022年6月时间序列数据的预处理3. 序列纯随机性检验第四十五张,PPT共一百八十七页,创作于2022年6月结论:由于统计量的P值0.0001,远远小于 0.05,即拒绝序列为纯随机序列的假定。因而认为京市

16、城乡居民定期储蓄所占比例的变动不属于纯随机波动,各序列值之间有相关关系。 这说明我们可以根据历史信息预测未来年份的北京市城乡居民定期储蓄所占比例,该平稳序列属于非白噪声序列,可以对其继续进行研究。 时间序列数据的预处理第四十六张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析方法性工具与两种相关系数自回归(AutoRegression, AR)模型移动平均(Moving Average, MA)模型ARMA模型平稳序列建模 平稳时间序列数据分析第四十七张,PPT共一百八十七页,创作于2022年6月1.1 方法性工具 差分运算一阶差分 阶差分 步差分平稳时间序列数据分析1. 方法

17、性工具与两种相关系数第四十八张,PPT共一百八十七页,创作于2022年6月延迟算子延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻 记 B为延迟算子,有 平稳时间序列数据分析第四十九张,PPT共一百八十七页,创作于2022年6月延迟算子的性质平稳时间序列数据分析则有(用延迟算子表示差分):第五十张,PPT共一百八十七页,创作于2022年6月1.2 两种样本相关系数的基本概念与计算样本自相关系数样本偏自相关系数平稳时间序列数据分析所谓滞后k阶偏自相关系数就是指在给定中间k-1个随机变量 xt-1, xt-2, xt-k+1的条件下,或者说,在剔

18、除了中间k-1个随机变量的干扰之后, xt-k对xt影响的相关度量。第五十一张,PPT共一百八十七页,创作于2022年6月样本偏自相关系数的计算平稳时间序列数据分析第五十二张,PPT共一百八十七页,创作于2022年6月2. AR模型的定义具有如下结构的模型称为 阶自回归模型,简记为特别当 时,称为中心化 模型平稳时间序列数据分析第五十三张,PPT共一百八十七页,创作于2022年6月均 值 如果AR(p)模型满足平稳性条件,则有根据平稳序列均值为常数,且 为白噪声序列,有推导出平稳时间序列数据分析第五十四张,PPT共一百八十七页,创作于2022年6月 AR(P)序列中心化变换称 为 的中心化序列

19、 ,令平稳时间序列数据分析第五十五张,PPT共一百八十七页,创作于2022年6月中心化AR(P)模型引进延迟算子,中心化 模型又可以简记为 自回归系数多项式平稳时间序列数据分析第五十六张,PPT共一百八十七页,创作于2022年6月AR模型自相关系数的性质拖尾性呈负指数衰减平稳时间序列数据分析第五十七张,PPT共一百八十七页,创作于2022年6月例5 考察如下AR模型的自相关图平稳时间序列数据分析第五十八张,PPT共一百八十七页,创作于2022年6月自相关系数按复指数单调收敛到零平稳时间序列数据分析第五十九张,PPT共一百八十七页,创作于2022年6月自相关系数正负相间的衰减平稳时间序列数据分析

20、第六十张,PPT共一百八十七页,创作于2022年6月自相关系数呈现出“伪周期”性平稳时间序列数据分析第六十一张,PPT共一百八十七页,创作于2022年6月自相关系数不规则衰减平稳时间序列数据分析第六十二张,PPT共一百八十七页,创作于2022年6月偏自相关系数的截尾性AR(p)模型偏自相关系数P阶截尾平稳时间序列数据分析第六十三张,PPT共一百八十七页,创作于2022年6月例5续 考察如下AR模型的偏自相关图平稳时间序列数据分析第六十四张,PPT共一百八十七页,创作于2022年6月理论偏自相关系数样本偏自相关图平稳时间序列数据分析第六十五张,PPT共一百八十七页,创作于2022年6月理论偏自相

21、关系数样本偏自相关图平稳时间序列数据分析第六十六张,PPT共一百八十七页,创作于2022年6月理论偏自相关系数样本偏自相关图平稳时间序列数据分析第六十七张,PPT共一百八十七页,创作于2022年6月理论偏自相关系数样本偏自相关系数图平稳时间序列数据分析第六十八张,PPT共一百八十七页,创作于2022年6月3. MA模型的定义具有如下结构的模型称为 阶移动平均模型,简记为特别当 时,称为中心化 模型平稳时间序列数据分析第六十九张,PPT共一百八十七页,创作于2022年6月移动平均系数多项式引进延迟算子,中心化 模型又可以简记为 阶移动平均系数多项式平稳时间序列数据分析第七十张,PPT共一百八十七

22、页,创作于2022年6月MA模型的统计性质常数均值常数方差平稳时间序列数据分析第七十一张,PPT共一百八十七页,创作于2022年6月MA模型的统计性质MA模型的偏自相关系数拖尾平稳时间序列数据分析第七十二张,PPT共一百八十七页,创作于2022年6月例6 考察如下MA模型的相关性质平稳时间序列数据分析第七十三张,PPT共一百八十七页,创作于2022年6月MA模型的自相关系数截尾平稳时间序列数据分析第七十四张,PPT共一百八十七页,创作于2022年6月MA模型的自相关系数截尾平稳时间序列数据分析第七十五张,PPT共一百八十七页,创作于2022年6月MA模型的偏自相关系数拖尾平稳时间序列数据分析第

23、七十六张,PPT共一百八十七页,创作于2022年6月MA模型的偏自相关系数拖尾平稳时间序列数据分析第七十七张,PPT共一百八十七页,创作于2022年6月4. ARMA模型的定义具有如下结构的模型称为自回归移动平均模型,简记为特别当 时,称为中心化 模型平稳时间序列数据分析第七十八张,PPT共一百八十七页,创作于2022年6月系数多项式引进延迟算子,中心化 模型又可以简记为 阶自回归系数多项式 阶移动平均系数多项式平稳时间序列数据分析第七十九张,PPT共一百八十七页,创作于2022年6月ARMA(p,q)模型的统计性质均值协方差自相关系数平稳时间序列数据分析第八十张,PPT共一百八十七页,创作于

24、2022年6月ARMA模型的相关性自相关系数拖尾偏自相关系数拖尾平稳时间序列数据分析第八十一张,PPT共一百八十七页,创作于2022年6月例7 考察ARMA模型的相关性 拟合模型ARMA(1,1):并直观地考察该模型自相关系数和偏自相关系数的性质。 平稳时间序列数据分析第八十二张,PPT共一百八十七页,创作于2022年6月自相关系数和偏自相关系数拖尾性样本自相关图样本偏自相关图平稳时间序列数据分析自相关系数和偏自相关系数拖尾 第八十三张,PPT共一百八十七页,创作于2022年6月ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖

25、尾平稳时间序列数据分析第八十四张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析平稳时间序列的理论基础对于任何一个离散平稳过程 它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的,不妨记作 其中: 为确定性序列, 为随机序列, 它们需要满足如下条件 (1) (2) (3)Wold分解定理(1938):第八十五张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析ARMA模型分解确定性序列随机序列第八十六张,PPT共一百八十七页,创作于2022年6月5.平稳序列建模 建模步骤模型识别参数估计模型检验模型优化序列预测平稳时间序列数据分析第八十七

26、张,PPT共一百八十七页,创作于2022年6月建模步骤平稳非白噪声序列计算样本相关系数模型识别参数估计模型检验模型优化序列预测YN平稳时间序列数据分析第八十八张,PPT共一百八十七页,创作于2022年6月模型定阶的困难因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的 或 仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数 , 与 都会衰减至零值附近作小值波动当 或 在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢? 平稳时间序列数据分析第八十九张,PPT

27、共一百八十七页,创作于2022年6月样本相关系数的近似分布BarlettQuenouille平稳时间序列数据分析第九十张,PPT共一百八十七页,创作于2022年6月模型定阶经验方法95的置信区间模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。平稳时间序列数据分析第九十一张,PPT共一百八十七页,创作于2022年6月例8 选择合适的模型ARMA拟合1950年1998年北京市城乡居民定期储蓄比例序列。平稳时间序列数

28、据分析第九十二张,PPT共一百八十七页,创作于2022年6月序列偏自相关图平稳时间序列数据分析第九十三张,PPT共一百八十七页,创作于2022年6月拟合模型识别自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾 偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾 所以可以考虑拟合模型为AR(1)平稳时间序列数据分析第

29、九十四张,PPT共一百八十七页,创作于2022年6月例9 美国科罗拉多州某一加油站连续57天的OVERSHORT序列 平稳时间序列数据分析第九十五张,PPT共一百八十七页,创作于2022年6月序列自相关图平稳时间序列数据分析第九十六张,PPT共一百八十七页,创作于2022年6月序列偏自相关图平稳时间序列数据分析第九十七张,PPT共一百八十七页,创作于2022年6月拟合模型识别自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾偏自相关系数显示出

30、典型非截尾的性质。综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1) 平稳时间序列数据分析第九十八张,PPT共一百八十七页,创作于2022年6月例10 1880-1985年全球气表平均温度改变值差分序列 平稳时间序列数据分析第九十九张,PPT共一百八十七页,创作于2022年6月序列自相关图平稳时间序列数据分析第一百张,PPT共一百八十七页,创作于2022年6月序列偏自相关图平稳时间序列数据分析第一百零一张,PPT共一百八十七页,创作于2022年6月拟合模型识别自相关系数显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可以尝试使用AR

31、MA(1,1)模型拟合该序列平稳时间序列数据分析第一百零二张,PPT共一百八十七页,创作于2022年6月参数估计待估参数 个未知参数常用估计方法矩估计极大似然估计最小二乘估计平稳时间序列数据分析第一百零三张,PPT共一百八十七页,创作于2022年6月例8续 确定1950年1998年北京市城乡居民定期储蓄比例序列拟合模型的口径 拟合模型:AR(1)估计方法:极大似然估计模型口径平稳时间序列数据分析第一百零四张,PPT共一百八十七页,创作于2022年6月例9续 确定美国科罗拉多州某一加油站连续57天的OVERSHORTS序列拟合模型的口径 拟合模型:MA(1)估计方法:条件最小二乘估计模型口径平稳

32、时间序列数据分析第一百零五张,PPT共一百八十七页,创作于2022年6月例10续 确定1880-1985全球气表平均温度改变值差分序列拟合模型的口径 拟合模型:ARMA(1,1)估计方法:条件最小二乘估计模型口径平稳时间序列数据分析第一百零六张,PPT共一百八十七页,创作于2022年6月模型检验模型的显著性检验整个模型对信息的提取是否充分参数的显著性检验模型结构是否最简平稳时间序列数据分析第一百零七张,PPT共一百八十七页,创作于2022年6月模型的显著性检验目的检验模型的有效性(对信息的提取是否充分)检验对象残差序列判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残

33、差序列应该为白噪声序列 反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效.平稳时间序列数据分析第一百零八张,PPT共一百八十七页,创作于2022年6月假设条件原假设:残差序列为白噪声序列备择假设:残差序列为非白噪声序列平稳时间序列数据分析第一百零九张,PPT共一百八十七页,创作于2022年6月检验统计量LB统计量平稳时间序列数据分析第一百一十张,PPT共一百八十七页,创作于2022年6月例8续 检验1950年1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性 残差白噪声序列检验结果延迟阶数LB统计量P值检验结论65.830.3229

34、拟合模型显著有效1210.280.50501811.380.8361平稳时间序列数据分析第一百一十一张,PPT共一百八十七页,创作于2022年6月参数显著性检验目的检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简 假设条件检验统计量平稳时间序列数据分析第一百一十二张,PPT共一百八十七页,创作于2022年6月例8续 检验1950年1998年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著 参数检验结果检验参数t统计量P值结论均值46.120.0001显著6.720.0001显著平稳时间序列数据分析第一百一十三张,PPT共一百八十七页,创作于2022年6月模型优化问题提

35、出当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。优化的目的选择相对最优模型 平稳时间序列数据分析第一百一十四张,PPT共一百八十七页,创作于2022年6月AIC准则最小信息量准则(An Information Criterion) 指导思想似然函数值越大越好 未知参数的个数越少越好 AIC统计量平稳时间序列数据分析第一百一十五张,PPT共一百八十七页,创作于2022年6月SBC准则AIC准则的缺陷在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多 SBC统计量平稳时间序列数据

36、分析第一百一十六张,PPT共一百八十七页,创作于2022年6月例11 连续读取70个某次化学反应的过程数据,构成一时间序列。对该序列进行两个模型拟合,并用AIC准则和SBC准则评判例两个拟合模型的相对优劣。 结果AR(1)优于MA(2)模型AICSBCMA(2)536.4556542.2011AR(1)535.7896540.2866平稳时间序列数据分析第一百一十七张,PPT共一百八十七页,创作于2022年6月序列预测线性预测函数预测方差最小原则平稳时间序列数据分析第一百一十八张,PPT共一百八十七页,创作于2022年6月例8续 北京市城乡居民定期储蓄比例序列拟合与预测图平稳时间序列数据分析第

37、一百一十九张,PPT共一百八十七页,创作于2022年6月ARMA模型综合举例平稳时间序列数据分析例:现有201个连续的生产纪录,选择适当模型拟合该序列的发展并写出拟合模型,最后预测该序列后5年的95%预测的置信区间。 步骤: 1、平稳性检验 2、纯随机性检验(白噪声检验)3、模型识别(前提是平稳非白噪声序列)4、拟合模型 5、显著性检验(包括模型和参数的显著性检验) 6、模型优化 7、预测 第一百二十张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析1. 平稳性检验 data a; input factory ; time=_n_; cards; /*数据省略*/ ; proc

38、 gplot; plot factory*time; symbol v=diamond i=join c=blue; proc arima data=a; identify var=factory nlag=18; run; 第一百二十一张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析1. 平稳性检验 第一百二十二张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析1. 平稳性检验 由时序图和自相关图可知,序列是平稳序列 第一百二十三张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析2.纯随机性检验(白噪声检验) 由p值都小于0.05可知,序列不

39、是白噪声序列,各序列值之间有相关关系,可以对其进行研究。第一百二十四张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析3.模型识别 SAS系统提供了相对最优模型识别,只要在identify命令中增加一个可选择命令minic,就可以获得一定范围内最优模型定阶。故可将模型识别和模型优化一起考虑。第一百二十五张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析3.模型识别data a; input factory ; time=_n_; cards; /*数据省略*/ ; proc gplot; plot factory*time; symbol v=diamond i

40、=join c=blue; proc arima data=a; identify var=factory nlag=18 minic p=(0:5) q=(0:5);/*模型定阶*/ run; 第一百二十六张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析3.模型识别BIC最小信息值为1.960692,根据BIC最小信息准则,选择MA(1)模型是相对最优的 第一百二十七张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析4.拟合模型data a; input factory ; time=_n_; cards; /*数据省略*/ ; proc gplot; pl

41、ot factory*time; symbol v=diamond i=join c=blue; proc arima data=a; identify var=factory; estimate q=1 method=ml; run; 第一百二十八张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析4.拟合模型可知模型为: MA模型:第一百二十九张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析5.显著性检验 由于各延迟阶数下LB统计量的P值都显著大于0.05,可以认为这个拟合模型的残差序列属于白噪声序列,根据模型检验的判别原则,得出该拟合模型显著有效。 第一百

42、三十张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析5.显著性检验 看到对两个参数的检验t统计量的P值均小于0.0001,则两参数检验均显著,则每一个未知参数显著非零,该模型结构已经是最精简,不需要删除不显著参数。 第一百三十一张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析6.预测并作出拟合图data a; input factory ; year=_n_; cards; /*数据省略*/ ; proc arima data=a; identify var=factory; estimate q=1 method=ml; forecast id=year

43、lead=5 out=results;/*lead预测期数,id指定身份变量,out预测结果存入某数据集*/ proc gplot data=results; plot factory*year=1 forecast*year=2 l95*year=3 u95*year=3/overlay; symbol1 v=star i=join c=black; symbol2 v=none i=join c=red; symbol3 v=none i=join c=green; run; 第一百三十二张,PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析6.预测并作出拟合图第一百三十三张,

44、PPT共一百八十七页,创作于2022年6月平稳时间序列数据分析6.预测并作出拟合图预测该序列后5年的预测值及95%预测的置信区间值 第一百三十四张,PPT共一百八十七页,创作于2022年6月非平稳时间序列数据分析差分运算ARIMA模型非平稳时间序列数据分析 第一百三十五张,PPT共一百八十七页,创作于2022年6月1.差分运算差分运算的实质差分方式的选择过差分非平稳时间序列数据分析 第一百三十六张,PPT共一百八十七页,创作于2022年6月差分运算的实质差分方法是一种非常简便、有效的确定性信息提取方法Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息差分运算的实质是使用

45、自回归的方式提取确定性信息 非平稳时间序列数据分析 第一百三十七张,PPT共一百八十七页,创作于2022年6月Cramer分解定理(1961)任何一个时间序列 都可以分解为两部分的叠加:其中一部分是由多项式决定的确定性趋势成分,另一部分是平稳的零均值误差成分,即确定性影响随机性影响非平稳时间序列数据分析 第一百三十八张,PPT共一百八十七页,创作于2022年6月差分方式的选择序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响 对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息 非平稳时间序

46、列数据分析 第一百三十九张,PPT共一百八十七页,创作于2022年6月例12 1964年1999年中国纱年产量序列蕴含着一个近似线性的递增趋势。对该序列进行一阶差分运算考察差分运算对该序列线性趋势信息的提取作用 非平稳时间序列数据分析 第一百四十张,PPT共一百八十七页,创作于2022年6月差分前后时序图原序列时序图差分后序列时序图非平稳时间序列数据分析 第一百四十一张,PPT共一百八十七页,创作于2022年6月例13 尝试提取1950年1999年北京市民用车辆拥有量序列的确定性信息非平稳时间序列数据分析 第一百四十二张,PPT共一百八十七页,创作于2022年6月差分后序列时序图一阶差分二阶差

47、分非平稳时间序列数据分析 第一百四十三张,PPT共一百八十七页,创作于2022年6月例14 差分运算提取1962年1月1975年12月平均每头奶牛的月产奶量序列中的确定性信息 非平稳时间序列数据分析 第一百四十四张,PPT共一百八十七页,创作于2022年6月差分后序列时序图一阶差分1阶12步差分非平稳时间序列数据分析 第一百四十五张,PPT共一百八十七页,创作于2022年6月过差分 足够多次的差分运算可以充分地提取原序列中的非平稳确定性信息但过度的差分会造成有用信息的浪费 假设序列如下 考察一阶差分后序列和二阶差分序列的平稳性与方差 非平稳时间序列数据分析 第一百四十六张,PPT共一百八十七页

48、,创作于2022年6月比较一阶差分平稳方差小二阶差分(过差分)平稳方差大非平稳时间序列数据分析 第一百四十七张,PPT共一百八十七页,创作于2022年6月ARIMA模型ARIMA模型结构ARIMA模型建模ARIMA模型预测疏系数模型季节模型非平稳时间序列数据分析 第一百四十八张,PPT共一百八十七页,创作于2022年6月ARIMA模型结构使用场合差分平稳序列拟合模型结构非平稳时间序列数据分析 第一百四十九张,PPT共一百八十七页,创作于2022年6月ARIMA 模型族d=0ARIMA(p,d,q)=ARMA(p,q)P=0ARIMA(P,d,q)=IMA(d,q)q=0ARIMA(P,d,q)

49、=ARI(p,d)d=1, P=q=0ARIMA(P,d,q)=random walk model非平稳时间序列数据分析 第一百五十张,PPT共一百八十七页,创作于2022年6月ARIMA模型建模步骤获得观察值序列平稳性检验差分运算YN白噪声检验Y分析结束N拟合ARMA模型非平稳时间序列数据分析 第一百五十一张,PPT共一百八十七页,创作于2022年6月例15 对1952年1988年中国农业实际国民收入指数序列建模 非平稳时间序列数据分析 第一百五十二张,PPT共一百八十七页,创作于2022年6月一阶差分序列时序图非平稳时间序列数据分析 第一百五十三张,PPT共一百八十七页,创作于2022年6

50、月一阶差分序列自相关图非平稳时间序列数据分析 第一百五十四张,PPT共一百八十七页,创作于2022年6月一阶差分后序列白噪声检验延迟阶数 统计量P值613.330.01781218.330.10601824.660.1344非平稳时间序列数据分析 第一百五十五张,PPT共一百八十七页,创作于2022年6月拟合ARMA模型偏自相关图非平稳时间序列数据分析 第一百五十六张,PPT共一百八十七页,创作于2022年6月建 模定阶ARIMA(0,1,1)参数估计模型检验模型显著参数显著非平稳时间序列数据分析 第一百五十七张,PPT共一百八十七页,创作于2022年6月ARIMA模型预测原则最小均方误差预测

51、原理 Green函数递推公式非平稳时间序列数据分析 第一百五十八张,PPT共一百八十七页,创作于2022年6月例15续 对中国农业实际国民收入指数序列做为期10年的预测 非平稳时间序列数据分析 第一百五十九张,PPT共一百八十七页,创作于2022年6月疏系数模型ARIMA(p,d,q)模型是指d 阶差分后自相关最高阶数为p,移动平均最高阶数为q 的模型,通常它包含p+q个独立的未知系数:如果该模型中有部分自相关系数 或部分移动平滑系数 为零,即原模型中有部分系数省缺了,那么该模型称为疏系数模型。非平稳时间序列数据分析 第一百六十张,PPT共一百八十七页,创作于2022年6月疏系数模型类型如果只

52、是自相关部分有省缺系数,那么该疏系数模型可以简记为 为非零自相关系数的阶数如果只是移动平滑部分有省缺系数,那么该疏系数模型可以简记为 为非零移动平均系数的阶数如果自相关和移动平滑部分都有省缺,可以简记为非平稳时间序列数据分析 第一百六十一张,PPT共一百八十七页,创作于2022年6月例16 对1917年1975年美国23岁妇女每万人生育率序列建模 非平稳时间序列数据分析 第一百六十二张,PPT共一百八十七页,创作于2022年6月一阶差分非平稳时间序列数据分析 第一百六十三张,PPT共一百八十七页,创作于2022年6月自相关图非平稳时间序列数据分析 第一百六十四张,PPT共一百八十七页,创作于2022年6月偏自相关图非平稳时间序列数据分析 第一百六十五张,PPT共一百八十七页,创作于2022年6月建 模定阶ARIMA(1,4),1,0)参数估计模型检验模型显著参数显著非平稳时间序列数据分析 第一百六十六张,PPT共一百八十七页,创作于2022年6月季节模型简单季节模型乘积季节模型 非平稳时间序列数据分析 第一百六十七张,PPT共一百八十七页,创作于2022年6月简单季节模型简单季节模型是指序列中的季节效应和其它效应之间是加法关系简单季节模型通过简单的趋势差分、季节差分之后序列即可转化为平稳,它的模型结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论