版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
时间序列习题含答案一、时间序列1、什么是时间序列?时间序列在科研工作中,按一定时间间隔(常为等间距)对客观事物进行动态检测,由于随机因素的作用,各时间点上测得的指标都是随机变量,这种按时间顺序排列的随机变量或观测值则称为时间序列。时间序列分析只是对动态数据建立数学模型,从数量上揭示事物发展变化规律或者从动态的角度刻画某现象与其他现象之间的内在数量关系。比如,天气的数据和天气预报就是典型的时间序列和时间序列分析。2、时间序列的分解时间序列的波动往往呈现一定的特定,通常认为由3种特性组成。①趋势性(trend)变量随着时间进展,呈现单调的上升、下降,或者持平的特征,不同时间段的斜率可以不等。②季节性(seasonalfluctuation)广义的季节性就是序列的周期性,狭义的季节性则指序列根据日历种的年度、季度、月度等变化而呈现的周期性特征。③随机性(irregularvariation)规律性变化之上叠加的随机扰动,普遍存在于时间序列的观测结果中。时间序列上述的三种特性一般依照加法原理或者乘法原理相叠加。满足加法模型的时间序列模型为:Xt=Tt+St+Itt=1,2,3……Tt:趋势项部分St:周期项部分It:随机噪声部分时间序列的分析的重要任务之一就是从时间序列中将这3个部分分解出来。时间序列的趋势项和周期项可以用特定的函数进行刻画,分离出趋势项和周期项后,时间序列表现为平稳波动。平稳的时间序列历史值中往往含有未来值的信息,因此,我们就可以用历史值来对未来值进行一定程度上的预测。3、自相关函数(autocorrelationfunction,ACF)比如说一份观测值的数据绘制如下图蓝色部分,然后将该数据向右平移部分单位如橙色线条部分,那粉色面积即两个线条重合的部分,就是原始蓝色与移动后橙色相关的部分。假设,我们是向右平移了两个单位,那我们可以说这个样本自相关函数的迟滞数为2。所以自相关函数就是用来描述,任意时刻观测值序列(橙色),与之前间隔K期观测值序列(蓝色)的相关程度以及方向的度量。而需要得到观察时刻的序列与之前序列之间的间隔,一般被称为迟滞(lag)。当然这个简单举例只是为了方便参考理解,现实中的例子更加复杂,在方向、单位上都有很多变化。4、偏自相关函数(partialautocorrelationfunction,PACF)是指在自相关函数的基础上,考虑了间隔K之间的序列值。(dbq,这里我学了很久也不会,也说不明白了……)首先我们有了一组时间序列数据后,我们应该进行的步骤可大致如下所示:5、时间序列的平稳性判断时间序列平稳性的方法①数据图检验法在t-Xt平面直角坐标系中将所研究的时间序列绘成连线图,观察其是否存在周期性或趋势性。若周期性和趋势性均不明显,则可以认为该序列是平稳的。该方法简单、直观、运用方便,但对图形的观察往往靠实际经验,不同的分析者可能得出不同的结论。如将中山市2004~2009年甲肝逐月发病数序列绘成连线图,未见明显趋势性和周期性,可以认为序列是平稳的。②自相关、偏自相关函数检验法一个时间序列的自相关函数和偏自相关函数既不截尾,也不拖尾,便可以判断该序列是平稳的。截尾(cutoff)在少数几个迟滞之后,自相关函数/偏自相关函数的绝对值陡然减小至零相关的置信限以内。拖尾(tailoff)在少数几个迟滞之后,自相关函数/偏自相关函数的绝对值逐步减小至零相关的置信限以内。看上面自相关函数的图,它的绝对值逐渐减小,且逐渐降低在置信区间(横线范围内),这种情况属于拖尾。下面的偏自相关函数的图,绝对值也有降低在置信区间内,但属于陡然减小,因此这种情况属于截尾。一个零均值平稳序列的自相关函数和偏自相关函数要么截尾要么拖尾。而像下图两种情况,ACF一直超过置信区间之外,既不截尾,也不拖尾,可以判断该序列是非平稳的。除此之外,平稳性检验还有特征值检验法、参数检验法、游程检验法等。6、不平稳序列的处理当平稳性检验出时间序列不平稳时,可尝试数据预处理,处理后的数据可能会满足平稳的特点。常用的方法包括普通差分、季节差分和对数转换。差分是对原始序列的一种变换,可以消除序列中的均值漂移为表现形式的不平稳性。①普通差分(ordinarydifference)常用的有一阶差分和二阶差分一阶差分将之前时间序列中相邻的值相减,相减后的值构成一个新的时间序列,该序列也许具有平稳性。二阶差分②季节差分如果序列中包含季节成分,则可以通过季节差分消除季节影响。设季节长度为S,对于序列Zt,其季节差分为:例如,季节长度S=4,即1年中有4个季节,则对于观测时间的间隔为季度的时间序列,且波动呈现年度周期性时,通过以下公式的季节差分变换就可以消除该周期性。③对数转换当时间序列在不同时段表现为变异程度的不同,可以尝试对数转换Yt=IgXt。生成的新时间序列,其变异程度方面的不平稳性可以被纠正。7、白噪声检验白噪声(whitenoise)白噪声at是一条特殊的时间序列,从该序列中截取的片段在时域空间中平移任何不为0的距离,与抵达位置的自身序列均不存在相关性。简单来说,白噪声就代表了随机误差部分。小小理解:当我们对时间序列进行白噪声检验时,若该序列不拒绝白噪声,则说明这个序列大都都是由误差部分构成的,不具有预测意义;只有当不符合白噪声序列时,说明该序列除了误差部分之外,还含有其他部分可以用于预测的因素,因此可以进行继续分析。而在建立模型之后,一般是对模型的残差序列进行白噪声检验。一般来说,我们是希望残差越小越好,也就是我们的模型已经该有的都有了,剩下的残差都是一些随机误差因素,而不含有其他有意义的内容。如果对残差部分进行检验,发现属于白噪声序列,那说明模型该纳入的因素都纳入了,没有多余在外的了;若对残差部分的检验不属于白噪声序列,则说明还有其他有意义的的因素“流落在外”,模型没有将所有有用的因素纳入进去,可认为模型拟合得不好。白噪声检验又称为Q检验,Q近似服从自由度为(M--p-q)的卡方分布,最终根据计算的卡方值来进行判断。确定该时间序列可以用之后,我们可以对该时间序列进行建模。二、时间序列建模1、步骤时间序列建模分3个阶段:识别、估计和诊断①模型识别:根据时间序列的特点,选择一个已有的模型类别来描述,然后确定选入模型的参数数量和种类,以及它们的组合方式。
②参数估计:估计模型中的参数,并作假设检验,使模型与实际数据相匹配。
③模型诊断:检验模型与实际数据的匹配程度。2、ARIMA模型又称Box-Jenkins模型,可以概括时间序列内部相关关系。该模型有三种基本模式:自回归模型(autoregressive.AR)移动平均模型(movingaverage,MA)自回归移动平均模型(autoregressiveandmovingaverage,ARMA)当序列为平稳序列时,其模型的通用表达式为:当序列为非平稳序列,但通过差分可以使序列平稳时,采用的模型称作自回归求和移动平均(autoregressiveintegratedmovingaverage)模型,即ARIMA模型。ARIMA模型经常表示为(p,d,q),其中d为差分的阶数。具体步骤可如下对于单个因素的时间序列,计算其ACF和PACF,根据绘制的函数图形确定模型形式。一般而言,前p个PACF函数值与0的差异具有统计学意义,说明PACF函数在p处截尾,而此时ACF函数呈现拖尾趋势,提示时间序列适合用p阶自回归模型AR(p)进行拟合。反之,前q个ACF值与0的差异具有统计学意义,说明ACF在q处截尾,而此时PACF拖尾,提示时间序列适合用q阶移动平均模型MA(q)进行拟合。当ACF和PACF均拖尾时,考虑用ARIMA(p,q)模型拟合。具体啥原理我也讲不明白,可以先记着结论就是:自拖偏截——AR自截偏拖——MA都拖——ARIMA对于非平稳序列,使用ARIMA(p,d,q)模型拟合,其中d为普通差分的阶数。对于含季节成分的时序,可以尝试先用季节差分消除季节成分。首先进行模型的参数估计这一步可以通过软件或计算方法得出。结果可参考如下:我们选择模型的一个参考因素是使模型参数尽可能少,有助于降低过拟合的可能性,上图1阶模型AIC和BIC(对AIC和BIC感兴趣的具体内容可以去网上搜索学习哈)单独和相加的和的值都比2阶模型的小,因此最后选择的是1阶的自回归模型。最后可以确定一个模型,上面截图的举例最终确定的ARMA模型为:yt
=5.137+0.435yt-1
+at然后就需要对该模型进行诊断检验模型的诊断检验至少要包括以下内容:①平稳可逆性检验平稳性是要求序列的统计特征不随时间而改变。可逆性是指序列的动态变化信息可以被历史值表达。当平稳性、可逆性检验未通过时,可以通过调整差分阶数来进行改善。②残差序列检验当残差序列的自相关函数绝对值均小于
,则认为残差序列中不再包含可供建模的非随机成分,此时的残差可视作白噪声,说明拟合效果良好。③过拟合检验目的是通过该建设检验,可以剔除无统计学意义的多余参数。当对该模型诊断检验可用之后,我们就可以通过属于自变量的值来对感兴趣的内容进行预测了。对时间序列的预测除了ARIMA模型之外,还有指数平滑法。三、指数平滑法(exponentialsmoothing)对于事物未来发展的水平,新近观测值比早期观测值的预测价值更大,因而在预测时,新近观测值应比早期观测值具有更大的权重。指数平滑法就是基于这一观点,对序列中最新观测值和早期观测值赋予不同的权重,进行预测。1、公式指数平滑预测的通式:St=αxt+(1-α)St-1St
——第t期平滑值(t>0)α
——平滑系数(取值范围0<α<1)xt
——第t期实际观察值指数平滑法实现预测的本质意义:平滑预测值=历史对当前的预测值+α×当前预测的误差2、平滑系数α的确定α取值偏低时,预测值无法密切跟上序列发生的新变化α取值偏高时,预测模型过多重视新发生的随机干扰,也可能导致预测效果变差。因此如果要求模型有较高灵敏度,能够迅速跟踪新数据的变化,权重系数可取大一些;如果要求模型不要被随机扰动影响太大,权重系数可选小一些,使预测结果更主要地取决于历史情形。四、时间序列的频域分析以上我们介绍的内容,都是建立在不同时间点的观测值具有一定联系这样的假定上,建模、预测和应用效果的考核均针对时间点上的取值水平,属于时间领域的分析,简称时域(timedomain)分析。另外一类统计分析在频率领域进行,称频数(frequencydomain)分析或者谱分析(spectralanalysis)频域分析的横轴是时间,纵轴是指标的取值大小。频域分析将原始动态序列资料变换到新的空间,横轴是设定的一系列的周期,纵轴是各周期活动的强度——平移j个单位的时间序列相关性越大,则对应周期T=j的强度就越大。这个新空间被称作频域空间,这是因为周期是0.1s的波动常被称作频率是10Hz的波动(hhhhh,这里我也不太会……。五、结果报告1、时域分析基于ARIMA模型的时间序列时域分析需要报告的结果是:①自相关函数与偏自相关函数的形态②建立的数学模型③模型参数的假设检验④残差序列的白噪声化检验⑤预测应用结果2、频域分析时间序列的频域分析需要报告的结果是①周期图或谱密度图②特征峰的合理解释或可能的提示总结1、时间序列分析是依据对事物进行规律性的动态观察所得资料,建立适当的数学模型,从而刻画事物的发展演变特征,并试图对未来的取值水平进行预测。2、时间序列分析方法可以分为时域分析和频域分析两种类型。时域分析直接将观察到的资料用于计算,考察当前取值与历史值间的联系模式,假定未来一定时间内这种联系模式相对稳定,则可以根据当前获得的信息预测未来;频域分析则通过数学变换,求出总的信息中分解到的各周期组分(或频率组分)的信息分量,如果某处的信息分量与噪声水平不同,且差异有统计学意义,则认为该信息分量为时间序列的特征表达。周期图和谱密度图是频域分析的主要工具。3、如果对实际时间序列建立的模型是合适的,那么,建模后的残差序列就不应该包含非随机成分,而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能建筑监理合同(2篇)
- 2025年安徽医学高等专科学校高职单招语文2018-2024历年参考题库频考点含答案解析
- 2025年宁夏工业职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 2025年大连枫叶职业技术学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 2025至2031年中国贝雕名片盒行业投资前景及策略咨询研究报告
- 2025至2031年中国管帽产品行业投资前景及策略咨询研究报告
- 交通基础设施维护-第1篇-深度研究
- 创新融资模式探索-深度研究
- 分布式电源调度与控制-深度研究
- 2025年度物业小区广告投放效果评估与分析合同
- 苏教版四年级数学下册第三单元第二课时《常见的数量关系》课件
- 浙江省台州市2021-2022学年高一上学期期末质量评估政治试题 含解析
- 中国高血压防治指南(2024年修订版)解读课件
- 2024年浙江省中考科学试卷
- 初三科目综合模拟卷
- 2024年全国高考新课标卷物理真题(含答案)
- 足疗店营销策划方案
- XX站SCADA系统升级改造施工方案(模板)
- 偶函数讲课课件
- 中医治疗“湿疹”医案72例
- 交通工程公司乳化沥青储油罐拆除工程安全协议书
评论
0/150
提交评论