版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
线性时间序列模型(含平稳时间序列模型/非平稳时间序列模型)非线性时间序列模型:ARCH类模型时间序列分析平稳时间序列模型引言大量自然界、社会经济等领域的统计指标都依年、季、月或日统计其指标值,随着时间的推移,形成了统计指标的时间序列。因此,时间序列是某一统计指标长期变动的数量表现。时间序列分析就是估算和研究某一时间序列在长期变动过程中所存在的统计规律性。定义在统计研究中,有大量的数据是按照时间顺序排列的,使用数学方法表述即用一组随机序列表示随机事件的时间序列,简记为或者。居民消费价格指数(Consumer
Price
Index),英文缩写CPI,是反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。本例给出了我国1985年—2007年的CPI年度数据时间序列图。GDP即国内生产总值,它是对一国(地区)经济在核算期内所有常住单位生产的最终产品总量的度量,常常被看成反映一个国家(地区)经济状况的重要指标。本例给出我国1978年—2007年GDP数据(单位:亿元)的时间序列图。本例给出了1992年第一季度至2008年第三季度我国GDP季度数据(单位:亿元)。本例给出了1990年12月19日—2008年11月6日上证A股指数日数据(除去节假日,共4386个数据)时序图。本例给出1980年1月—1991年10月澳大利亚红酒的月度销量(单位:公升)时序图。时间序列分析依赖于不同地应用背景,有着不同的目的分析的基本任务是揭示支配观测到的时间序列的随机规律,通过所了解的这个随机规律,我们可以理解所要考虑的动态系统,预报未来的事件,并且通过干预来控制将来事件。上述即为时间序列分析的目的。ARIMA的建模过程第一步,对时间序列进行特性分析第二步,模型的识别与建立第三步,模型的评价,并利用模型进行预测一、时间序列分析的基本概念平稳过程的特征及检验特殊数据点处理
平稳性检验特征统计量平稳时间序列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性的检验
特征统计量均值
方差自协方差自相关系数平稳时间序列的定义严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
平稳时间序列的统计定义
满足如下条件的序列称为严平稳序列满足如下条件的序列称为宽平稳序列严平稳与宽平稳的关系一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立特例不存在低阶矩的严平稳序列不满足宽平稳条件当序列服从多元正态分布时,宽平稳可以推出严平稳平稳时间序列的统计性质
常数均值自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关
延迟k自协方差函数延迟k自相关系数若{Xt}为平稳序列,假定EXt=0,由于令s=t-k,于是我们就可以用以下记号表示平稳序列的自协方差函数,即:相应的,自相关函数记为:自相关系数的性质规范性对称性平稳性的检验(图检验方法)
时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征自相关图检验平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零例题例1检验1964年——1999年中国纱年产量序列的平稳性例2检验1962年1月——1975年12月平均每头奶牛月产奶量序列的平稳性例3检验1949年——1998年北京市每年最高气温序列的平稳性例1时序图例1自相关图例2时序图例2自相关图例3时序图例3自相关图纯随机性检验
纯随机序列的定义纯随机性的性质纯随机性检验纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质
标准正态白噪声序列时序图
白噪声序列的性质纯随机性方差齐性各序列值之间没有任何相关关系,即为“没有记忆”的序列
方差齐性纯随机性检验检验原理假设条件检验统计量判别原则Barlett定理如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布假设条件原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性检验统计量Q统计量判别原则拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定例4:标准正态白噪声序列纯随机性检验样本自相关图检验结果延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。例5对1950年——1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验例5自相关图例5白噪声检验结果延迟阶数Q统计量检验Q检验统计量的值P值675.46<0.00011282.57<0.0001注:离群值、缺失值的补足1、seriesmean全体序列的均数,默认值2、meanofnearbypoints相邻若干点的均数3、medianofnearbypoints:相邻若干点的中位数4、lineartrendatpoint.该点的线性趋势,将记录号作为自变量,序列值作为应变量回归,求得该点的估计值。二、线性平稳时间序列分析时间序列的统计分析中,平稳序列是一类重要的随机序列。在这方面已经有了比较成熟的理论知识.最常用的是ARMA(AutoregressiveMovingAverage)序列。用ARMA模型去近似地描述动态数据在实际应用中有许多优点,例如它是线性模型,只要给出少量参数就可完全确定模型形式;另外,便于分析数据的结构和内在性质,也便于在最小方差意义下进行最佳预测和控制。本章将讨论ARMA模型的基本性质和特征,这是时间序列统计分析中的重要理论基础。线性过程准备工具:延迟算子和差分方程设为一步延迟算子,如果当前序列乘以一个延迟算子,就表示把当前序列值的时间向过去拨一个时刻,即延迟算子的性质
差分运算一阶差分阶差分步差分用延迟算子表示差分运算
阶差分步差分线性差分方程线性差分方程齐次线性差分方程齐次线性差分方程的解特征方程特征方程的根称为特征根,记作齐次线性差分方程的通解不相等实数根场合有相等实根场合复根场合非齐次线性差分方程的解非齐次线性差分方程的特解使得非齐次线性差分方程成立的任意一个解非齐次线性差分方程的通解齐次线性差分方程的通解和非齐次线性差分方程的特解之和线性过程的定义线性过程的因果性和可逆性在应用时间序列分析去解决实际问题时,所使用的线性过程是因果性的,即:自回归过程AR(p)线性过程及其逆转形式都是无穷和的形式,用有限和去逼近时即产生有限参数线性模型,而且许多平稳序列本身就是由有限参数线性模型刻画的。有限参数线性模型是时间序列分析中理论最基础、应用最广泛的部分。如下将讨论AR、MA和ARMA三种有限参数线性模型。AR模型的定义具有如下结构的模型称为阶自回归模型,简记为特别当时,称为中心化模型AR(P)序列中心化变换称为的中心化序列,令自回归系数多项式引进延迟算子,中心化模型又可以简记为自回归系数多项式AR模型平稳性判别判别原因AR模型是常用的平稳序列的拟合模型之一,但并非所有的AR模型都是平稳的判别方法单位根判别法平稳域判别法例1:考察如下四个模型的平稳性例1平稳序列时序图例1非平稳序列时序图AR模型平稳性判别方法特征根判别AR(p)模型平稳的充要条件是它的p个特征根都在单位圆内根据特征根和自回归系数多项式的根成倒数的性质,等价判别条件是该模型的自回归系数多项式的根都在单位圆外平稳域判别平稳域AR(1)模型平稳条件特征根平稳域AR(2)模型平稳条件特征根平稳域例1平稳性判别模型特征根判别平稳域判别结论(1)平稳(2)非平稳(3)平稳(4)非平稳平稳AR模型的统计性质均值方差协方差自相关系数偏自相关系数均值如果AR(p)模型满足平稳性条件,则有根据平稳序列均值为常数,且为白噪声序列,有推导出Green函数定义AR模型的传递形式其中系数称为Green函数Green函数递推公式原理方法待定系数法例2:求平稳AR(1)模型的方差平稳AR(1)模型的传递形式为Green函数为平稳AR(1)模型的方差协方差函数在平稳AR(p)模型两边同乘,再求期望根据得协方差函数的递推公式例3:求平稳AR(1)模型的协方差递推公式平稳AR(1)模型的方差为协方差函数的递推公式为例4:求平稳AR(2)模型的协方差平稳AR(2)模型的协方差函数递推公式为自相关系数自相关系数的定义平稳AR(P)模型的自相关系数递推公式常用AR模型自相关系数递推公式AR(1)模型AR(2)模型AR模型自相关系数的性质拖尾性呈复指数衰减例5:考察如下AR模型的自相关图例5—自相关系数按复指数单调收敛到零例5:—例5:—自相关系数呈现出“伪周期”性例5:—自相关系数不规则衰减偏自相关系数定义对于平稳AR(p)序列,所谓滞后k阶偏自相关系数就是指在给定中间k-1个随机变量的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,对影响的相关度量。用数学语言描述就是偏自相关系数的计算滞后k阶偏自相关系数实际上就等于k阶自回归模型第k个回归系数的值。偏自相关系数的截尾性AR(p)模型偏自相关系数P阶截尾例5续:考察如下AR模型的偏自相关图例5—理论偏自相关系数样本偏自相关图例5:—理论偏自相关系数样本偏自相关图例5:—理论偏自相关系数样本偏自相关图例5:—理论偏自相关系数样本偏自相关系数图MA模型的定义具有如下结构的模型称为阶自回归模型,简记为特别当时,称为中心化模型移动平均系数多项式引进延迟算子,中心化模型又可以简记为阶移动平均系数多项式MA模型的统计性质常数均值常数方差MA模型的统计性质自协方差函数P阶截尾自相关系数P阶截尾常用MA模型的自相关系数MA(1)模型MA(2)模型MA模型的统计性质偏自相关系数拖尾例6:考察如下MA模型的相关性质MA模型的自相关系数截尾
MA模型的自相关系数截尾
MA模型的偏自相关系数拖尾
MA模型的偏自相关系数拖尾
MA模型的可逆性MA模型自相关系数的不唯一性例3.6中不同的MA模型具有完全相同的自相关系数和偏自相关系数可逆的定义可逆MA模型定义若一个MA模型能够表示称为收敛的AR模型形式,那么该MA模型称为可逆MA模型可逆概念的重要性一个自相关系数列唯一对应一个可逆MA模型。可逆MA(1)模型
MA模型的可逆条件MA(q)模型的可逆条件是:MA(q)模型的特征根都在单位圆内等价条件是移动平滑系数多项式的根都在单位圆外逆函数的递推公式原理方法待定系数法递推公式例6续:考察如下MA模型的可逆性(1)—(2)
逆函数逆转形式(3)—(4)
逆函数逆转形式ARMA模型的定义具有如下结构的模型称为自回归移动平均模型,简记为特别当时,称为中心化模型系数多项式引进延迟算子,中心化模型又可以简记为阶自回归系数多项式阶移动平均系数多项式平稳条件与可逆条件ARMA(p,q)模型的平稳条件P阶自回归系数多项式的根都在单位圆外即ARMA(p,q)模型的平稳性完全由其自回归部分的平稳性决定ARMA(p,q)模型的可逆条件q阶移动平均系数多项式的根都在单位圆外即ARMA(p,q)模型的可逆性完全由其移动平滑部分的可逆性决定传递形式与逆转形式传递形式逆转形式ARMA(p,q)模型的统计性质均值协方差自相关系数ARMA模型的相关性自相关系数拖尾偏自相关系数拖尾例7:考察ARMA模型的相关性拟合模型ARMA(1,1):
并直观地考察该模型自相关系数和偏自相关系数的性质。自相关系数和偏自相关系数拖尾性样本自相关图样本偏自相关图ARMA模型相关性特征三、时间序列的模型识别前面讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p,q)统计特性。从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下:在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以为我们提供有关模型类型的试探性的考虑。对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC等信息准则。我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。如果样本的自相关系数(ACF)在滞后q+1
阶时突然截断,即在q处截尾,那么可以判定该序列为MA(q)序列。同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。如果ACF和PACF都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关的准则函数,既考虑模型对原始观测值的接近程度,又考虑模型中所含待定参数的个数,最终选取使该函数达到最小值的阶数,常用的该类准则有AIC、BIC等。实际应用中,往往是几种方法交叉使用,然后选择最为合适的阶数(p,q)作为待建模型的阶数。131自相关和偏自相关系数法在平稳时间序列分析中,最关键的过程就是利用数据去识别和建模,根据第三章讨论的内容,一个比较直观的方法,就是通过观察自相关系数(ACF)和偏自相关系数(PACF)可以对拟合模型有一个初步的识别,这是因为从理论上说,平稳AR、MA和ARMA模型的ACF和PACF有如下特性:选择模型拖尾P阶截尾AR(P)q阶截尾拖尾MA(q)拖尾拖尾ARMA(p,q)因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况。由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与都会衰减至零值附近作小值波动.当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?134135136近似分布BarlettQuenouille138139140141142143144145146147148149150151AR(p)模型定阶的F准则
1967年,瑞典控制论专家K.J.Aström教授将F检验准则用于对时间序列模型的定阶。设(1≤t≤N)是零均值平稳序列的一段样本。并用模型AR(p)
进行拟合。根据模型阶数节省原则(parsimonyprinciple),采取由低阶逐步升高的“过拟合”办法。先对观测数据拟合模型AR(p)(p=1,2,…),用递推最小二乘估计其参数并分别计算对应模型的残差平方和。根据适用的模型应具有较小的残差平方和的特点,用F准则判定模型的阶数改变后相应的残差平方和变化是否显著。153154155156157158的值随K而增长。159160161四、时间序列模型参数的统计推断
ARMA(p,q)模型参数的最小二乘估计
ARMA(p,q)模型参数的最小二乘估计
考虑以下时序模型:若et=at,即et为白噪声,此时模型为AR(P)模型,则前述四个假设都能满足。因此,对于AR(P)模型,用普通最小二乘法(OLS)估计的参数是无偏、一致估计。若,此时模型为ARMA(p,q)模型或MA(q)(p=0时)模型,此时et
不满足第3,4个条件,因此,对于ARMA模型和MA模型,普通最小二乘估计不是一致的估计。ARMA(p,q)模型的诊断检验ARMA(p,q)模型的诊断检验ARMA(p,q)模型的诊断检验ARMA(p,q)模型的诊断检验ARMA(p,q)模型的诊断检验ARMA(p,q)模型的诊断检验ARMA(p,q)模型的诊断检验ARMA(p,q)模型的优化五、平稳时间序列模型预测设平稳时间序列是一个ARMA(p,q)过程,即本章将讨论其预测问题,设当前时刻为t,已知时刻t和以前时刻的观察值我们将用已知的观察值对时刻t后的观察值
进行预测,记为,称为时间序列的第步预测值。最小均方误差预测考虑预测问题首先要确定衡量预测效果的标准,一个很自然的思想就是预测值与真值的均方误差达到最小,即设预测值与真值的均方误差
我们的工作就是寻找,使上式达到最小。条件无偏均方误差最小预测设随机序列,满足,则如果随机变量使得
达到最小值,则如果随机变量使得
达到最小值,则根据上述结论,我们得到,当时,使得
达到最小。对于ARMA模型,下列等式成立:ARMA模型的预测方差和预测区间
如果ARMA模型满足因果性,则有所以,预测误差为
由此,我们可以看到在预测方差最小的原则下,是当前样本和历史样本已知条件下得到的条件最小方差预测值。其预测方差只与预测步长有关,而与预测起始点t无关。当预测步长的值越大时,预测值的方差也越大,因此为了预测精度,ARMA模型的预测步长不宜过大,也就是说使用ARMA模型进行时间序列分析只适合做短期预测。进一步地,在正态分布假定下,有
由此可以得到
预测值的95%的置信区间为
或者
AR模型的预测首先考虑AR(1)模型
当
时,即当前时刻为t的一步预测为
当
,当前时刻为t的
步预测
对于AR(p)模型
当
时,当前时刻为t的一步预测为
当
,当前时刻为t的步预测
例1
设平稳时间序列
来自AR(2)模型
已知
,求
和
以及95%的置信区间。解:根据第三章,可以计算模型的格林函数为所以的95%的置信区间为(-1.076,3.236)
的95%的置信区间为(-2.296,3.952)例2
已知某商场月销售额来自AR(2)模型(单位:万元/月)
2006年第一季度该商场月销售额分别为:101万元,96万元,97.2万元。求该商场2006年第二季度的月销售额的95%的置信区间。
第二季度的4月、5月、6月的预测值分别为
计算模型的格林函数为4月、5月、6月的月销售额的95%的置信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多退少补的合同(2篇)
- 《高血脂的饮食疗法》课件
- 2024年海南省三亚市公开招聘警务辅助人员(辅警)笔试摸底备战测试(3)卷含答案
- 2021年四川省广元市公开招聘警务辅助人员(辅警)笔试经典练习卷(A)含答案
- 2021年海南省海口市公开招聘警务辅助人员(辅警)笔试经典自测卷(2)含答案
- 《基于任务驱动模式的软件工程与UML建模技术》课件项目三
- 2021年山西省朔州市公开招聘警务辅助人员(辅警)笔试摸底备战测试(2)卷含答案
- 2022年江西省南昌市公开招聘警务辅助人员(辅警)笔试专项训练卷(2)含答案
- 班组长安全管理培训课件2
- 《直流远供电源系统》课件
- 章节练习及参考答案----第四章相图
- 药品养护汇总分析报表
- 中医药申报书
- 不稳定型心绞痛临床路径表单
- 化肥的发展史
- 水运工程施工组织设计
- 斑蝥的药用价值与养殖
- 三维激光扫描技术与应用实例(课堂PPT)
- 消防水池施工方案
- 小学美术《多变的纸拉花》课件ppt课件
- 《数据结构》课程标准
评论
0/150
提交评论