应用时间序列分析论文应用统计18陈叮5061214012_第1页
应用时间序列分析论文应用统计18陈叮5061214012_第2页
应用时间序列分析论文应用统计18陈叮5061214012_第3页
应用时间序列分析论文应用统计18陈叮5061214012_第4页
应用时间序列分析论文应用统计18陈叮5061214012_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、涔、应用时间序列分析IIII眄IlliI7大作业姓名:陈叮学号:5061214012专业班级:应用统计18院系:信息工程学院数学系时间:2017/5/22题目:对苏格兰异性结婚数据的时序分析摘要:本文以苏格兰1855年至2015年异性结蜡数据为研究对象,首先运用R软件对1855-2010年的结蜡数据绘制时序图、自相关图和做差分进行相关分析,得出一阶差分后的数据是趋于平稳的,然后根据主观确定拟合模型为MA(2),并运用R软件里面的auto.arima()函数进行模型的自动选择,得出ARIMA(0,1,2)模型即MA(2)模型最优,故我们所选择的拟合模型MA(2)是最优的,最后运用MA(2)模型预

2、测并进行预测残差检验,得出了苏格兰2011-2015年异性结蜡数据的预测值(29200.45,28905.94,28905.94,28905.94,28905.94)与实际值(29135,30534,27547,28702,28020)相比,相差不大,这说明模型拟合较好,能反映数据的真实水平,而且残差检验也表明预测残差是平均值为0且方差为常数的正态分布(服从零均值、方差不变的正态分布),这进一步说明MA(2)模型是可以提供非常合适预测的模型。关键词:苏格兰;arima()函数;auto.arima()函数;R软件;预测二、数据来源本文的数据是1855-2015年苏格兰的结婚数据(Marriag

3、es,Scotland,1855to2015),数据可以从网上(.uk/statistics-and-data/statistics/statistics-by-theme/vital-events/marriages-and-civil-partnerships/marriages-time-series-data)下载,数据见附件一。三、模型的定阶与确定3.1 模型的定阶3.1.1 序列预处理1首先,我们对苏格兰1855年至2010年的时间序列进行时序图和自相关分析,分析结果如图和图所示,程序见附录一。1855-

4、2010年苏格兰结婚数据的时序图185019001950时间2000据数婚结图苏格兰1855年至2010年异性结婚数据的时序图Lag图苏格兰1855年至2010年异性结婚数据的自相关图图显示苏格兰的结婚数值的均值和方差变动很大,随着时间的增加,具有明显的上升趋势,是典型的非平稳序列。图显示该序列的自相关系数都超出了两倍标准误差,所以进一步证明了该序列是非平稳的。综上所述,该序列是非平稳序列。对于该非平稳时间序列,首先我们对数据进行1阶差分处理,以便消除其具有的强烈的趋势性,来观察数据是否大致趋于平稳。因此得到的1阶差分时间序列图如下:图3

5、.1.1.3苏格兰1855年至2010年异性结婚数据1阶差分后的时序图1855-2010年苏格兰一阶差分结婚数据的时序图085o00001-据数分差阶一从图中我们可以看出,经过1阶差分后,该序列的平均值和方差是大致平稳的,所以我们使用ARMIA(p,1,d)模型是很合适的。通过一阶差分,我们去除了结婚数据的趋势部分,剩下了不规则部分。接下来我们可以检验不规则部分中邻项数数值是否具有相关性;如果有的话,可以帮助我们建立一个预测模型来预测苏格兰异性结婚数据的数值趋势。3.1.2 平稳性检验由图可以认为该序列一阶差分后,序列基本平稳,为了进一步判断其平稳性,考察差分序列的

6、自相关图和偏自相关图,如图五和图六所小。图自相关图显示延迟2阶、3阶、4阶和5阶时的自相关值超出了2倍标准差范围,但是其他在延迟1-25阶的自相关系数都落入2倍标准差范围以内,从而判断该序列有很强的短期相关性,是2阶截尾,所以可以初步认为1阶差分后序列平稳。图偏自相关图显示,在延迟2阶和4阶时的偏自相关系数超出了2倍标准差范围,从lag4之后缩小至0,是4阶截尾,该序列趋于平稳。综上所述,我们可以认为该序列的一阶差分序列自相关图2阶截尾和偏自相关图4阶截尾。Seriesdataseriesdiff1Lag图该序列一阶差分后的自相关图30-Seriesd

7、ataseriesdiffl10510152025Lag图该序列一阶差分后的偏自相关图3.1.3 纯随机性检验为了判断序列是否有分析价值,必须对序列进行纯随机性检验,即白噪声检验。如表所示,P值远远小于0.05的临界值,因此,拒绝原假设,即可以认定1阶差分后的序列是平稳非白噪声序列,需要建立模型来拟合该序列的变化趋势。表纯随机性检验Box.test(dataseriesdiff1,type="Ljung-Box",lag=30);Box-LjungtestData:Dataseriesdiff1X-squared=83.411Df=

8、30P-value=6.313e-073.2 模型确定3.2.1 根据阶数确定模型由该序列一阶差分的自相关图和偏自相关图,知道自相关值在滞后2阶之后为0,且偏自相关值在滞后4阶之后缩小至0,那么意味着接下来的ARIMA真型对于一阶时间序列有如下性质:1、ARMA(4,0)模型:即偏自相关值在滞后4阶之后缩小至0且自相关值缩小至0,则是一个阶层p=4自回归模型。2、ARMA(0,2)模型:即自相关图在滞后2阶之后为0且偏自相关图缩小至0,则是一个阶数q=2的移动平均模型。3、ARMA(p,q)模型:即自相关图和偏自相关都缩小至0,则是一个具有p和q大于0的混合模型。接下来我们利用简单的原则来确定

9、哪个模型是最好的:即我们认为具有最少参数的模型是最好的。ARMA(4,0)有4个参数,ARMA(0,2)有2个参数,而ARMA(p,q)至少有两个变量。因此,ARMA(0,2)模型被认为是最好的模型。ARMA(0,2)模型是二阶的移动平均模型,或者称作MA(2)。这个模型可以写作:Xt=!-11;t-12;t2(3.2.1)移动平均模型通常用于建模一个时间序列,此序列具有邻项观测值之间短期的相关特征。直观地,可以很好理解MA模型可以用来描述苏格兰异性结婚数据中的不规则部分。3.2.2 运用auto.arima()函数2自动选择模型表auto.arima()函数运行的结果代码aut

10、o.arima(dataseries);Series:dataseries最优模型ARIMA(0,1,2)Coefficients:Ma1Ma20.1022-0.4311s.e0.07630.0800sigmaA2estimatedas4121992:loglikelihood=-1399.62AIC=2805.24AICc=2805.4BIC=2814.37从表中可以得出ARIMA(0,1,2)模型最适合该序列,这与我们前面通过主观确定的模型一样,这说明ARIMA(0,1,2)非常适合拟合该序列。3.3 模型的参数检验对于ARIMA(0,1,2)模型的参数估计问题,我们运用ar

11、ima()函数来估计,估计结果如下:表3.3.1ARIMA(0,1,2)模型的参数检验代dataseriesarima=arima(dataseries,order=c(0,1,2);dataseriesarima码Call:arima(x=dataseries,order=c(0,1,2)Coefficients:Ma1Ma2续表:0.1022-0.4311s.e.0.07630.0800sigmaA2estimatedas4068802:loglikelihood=-1399.62,aic=2805.24表3.3.1显示,畲=0.1022,可=-0.4311是比较显著地参数,所以模型的方程

12、式确定为:Xt=;t-0.1022;t-0.431 模型预测以及预测误差的检验3.4.1 模型的预测预测就是要利用已观测到的样本值对序列在未来某个时刻的取值进行估计。为了对随机序列未来发展进行预测,我们对原序列进行短期(h=5)预测,并与实际值进行对比,观测预测效果,预测结果如下表所示。表运用ARIMA(0,1,2)模型预测2010-2015年的结婚数据yearPointForecast值Lo80Hi80Lo95Hi95201129200.452913526615.4031785.5025246.9533153.95201228905.94305

13、3425058.7332753.1623022.1434789.75201328905.942754724685.6433126.2522451.5435360.35201428905.942870224342.9533468.9421927.4435884.44201528905.942802024024.2633787.6321440.0536371.84表显示预测值与实际值十分接近,这说明ARIMA(0,1,2)模型的拟合效果非常好,很适合该时间序列的拟合。接下来,我们通过绘制预测图,直观的看预测效果,预测图表明预测效果很好。ForecastsfromARIMA(0,1,2

14、)图ARIMA(0,1,2)预测图3.4.2 预测误差的检验在指数平滑模型下,观测ARIMA1型的预测误差是否是平均值为0且方差为常数的正态分布(服从零均值、方差不变的正态分布)是个好主意,同时也要观测连续预测误差是否自相关。表预测误差的纯随机性检验代码Box.test(dataforecast$residuals,type="Ljung-Box",lag=30);Box-LjungtestData:dataforecast$residualsX-squared=42.036Df=30P-value=0.07107Seriesdataforeca

15、st$residualsLag图预测误差的自相关图相关图显示出在滞后1-20阶中样本自相关值都没有超出显著边界,而且Ljung-Box检验的p值为0.7107,所以我们推断在滞后1-20阶中没有明显证据说明预测误差是非零自相关的。为了调查预测误差是否是平均值为0且方差为常数的正态分布(服从零均值、方差不变的正态分布),我们可以做预测误差的时间曲线图和直方图:因此,把预测误差看作平均值为0方差为常数正态分布是合理。既然依次连续的预测误差看起来不是相关,而且看起来是平均值为0方差为常数的正态分布,那么对于苏格兰异性结婚数据,AR1MA(012)模型看起来是可以提供非常合适预测的模型。

16、Histogramofforecasterrorsforecasterrors图预测误差的分布图OOAV1O850950O002eTim图预测误差的时序图四、总结时间序列是指同一种现象在不同时间上的相继连续的观察值排列而成的一组数字序列,时间序列分析相当重要,应用也相当广泛。本文的研究对象是苏格兰异性之间的结婚数据,经过建立模型,对模型预测,选取最优模型。利用时间序列方法预测结婚数的未来变化做出改变。本文就是通过ARMIA真型对苏格兰异性之间的结婚数据作了时间序列分析的,并对其进行了预测。从而能客观的看出苏格兰异性之间的结婚数据,有利于政府做出决策。五、参考文献1王

17、燕.应用时间序列分析(第四版)M.北京:中国人民大学出版社,2005:65-102.2吴喜之,刘苗.时间序列分析R软件P§同M.北京:机械工业出版社,2016:66-67.六、附录时间序列分析的R程序data=read.csv("w.csv");datax=c(data$x);dataseries=ts(datax,freq=1,start=c(1855);plot(dataseries,xlab="时间",ylab="结婚数据”,type="o",col="red",main="18

18、55-2010年苏格兰结婚数据的时序图");acf(dataseries,lag.max=20,plot=TRUE);dataseriesdiff1=diff(dataseries);时间",ylab="阶差分数据plot(dataseriesdiff1,xlab=",type="o",col="red",main="1855-2010年苏格兰一阶差分结女昏数据的时序图);acf(dataseriesdiff1,lag.max=25,plot=TRUE);pacf(dataseriesdiff1,lag.max=25,plot=TRUE);Box.test(dataseriesdiff1,type="Ljung-Box",lag=30);auto.arima(dataseries);dataseriesarima=arima(dataseries,order=c(0,1,2);data

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论