应用统计(12)第12章时间序列预测(2011年)_第1页
应用统计(12)第12章时间序列预测(2011年)_第2页
应用统计(12)第12章时间序列预测(2011年)_第3页
应用统计(12)第12章时间序列预测(2011年)_第4页
应用统计(12)第12章时间序列预测(2011年)_第5页
已阅读5页,还剩149页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析

(方法与案例)

作者贾俊平统计学统

Statistics未来是不可预测的,不管人们掌握多少信息,都不可能存在能作出正确决策的系统方法。

——C.R.Rao统计名言第11章时间序列预测11.1时间序列的成分和预测方法11.2平稳序列的预测11.3趋势预测11.4多成分序列的预测11.5Box-Jenkins方法:ARIMA模型

Forecast学习目标时间序列的组成要素预测方法的选择与评估平稳序列的预测方法趋势序列的预测方法多成分序列的预测方法ARIMA模型

使用SPSS和Excel预测下个月的消费者信心指数是多少?消费者信心指数不仅仅是消费信心的反映,在某种程度上反映了消费者对整个宏观经济运行前景的看法一些国家都把消费者信心指数作为经济运行的一项预警指标来看待。国家统计局定期公布这类数据下表是国家统计局公布的2009年7月至2010年8月我国的消费者预期指数、消费者满意指数和消费者信心指数(%)怎样预测下个月的消费者信心指数呢?首先需要弄清楚它在2009年7月至2010年8月过去的这段时间里是如何变化的,找出其变化的模式。如果预期过去的变化模式在未来的一段时间里能够延续,就可以根据这一模式找到适当的预测模型并进行预测。本章介绍的内容就是有关时间序列的预测问题下个月的消费者信心指数是多少?日期消费者预期指数消费者满意指数消费者信心指数2009.07101.1103.6102.12009.08102.0103.8102.72009.09102.2103.7102.82009.10102.6104.0103.22009.11103.0103.8103.32009.12104.0103.8103.92010.01104.6104.8104.72010.02104.5103.7104.22010.03108.2107.5107.92010.04106.8106.2106.62010.05108.2107.7108.02010.06108.9107.8108.52010.07108.6106.4107.82010.08107.9106.2107.311.1时间序列的成分和预测方法

11.1.1时间序列的成分11.1.2预测方法的选择与评估第11章时间序列预测11.1.1时间序列的成分11.1时间序列成分和预测方法时间序列

(timesseries)按时间顺序记录的一组数据观察的时间可以是年份、季度、月份或其他任何时间形式观测时间用表示,观测值用表示时间序列的组成要素(components):趋势、季节变动、循环波动和不规则波动时间序列的组成要素(components)趋势(trend)持续向上或持续向下的变动

季节变动(seasonalfluctuation)在一年内重复出现的周期性波动循环波动(Cyclicalfluctuation)非固定长度的周期性变动不规则波动(irregularvariations)

除去趋势、季节变动和周期波动之后的随机波动称为不规则波动只含有随机波动而不存在趋势的序列也称为平稳序列(stationaryseries)四种成分与序列的关系:Yi=Ti×Si×Ci×Ii含有不同成分的时间序列平稳趋势周期季节时间序列的成分

(例题分析)【例11-1】

1990年—2005年我国人均GDP、轿车产量、金属切削机床产量和棉花产量的时间序列。绘制图形观察其所包含的成分含有不同成分的时间序列

(a)人均GDP序列(b)轿车产量序列(c)机床产量序列(d)棉花产量序列11.1.2预测方法的选择与评估11.1时间序列成分和预测方法预测方法的选择与评估

预测方法的评估一种预测方法的好坏取决于预测误差的大小预测误差是预测值与实际值的差距度量方法有平均误差(meanerror)、平均绝对误差(meanabsolutedeviation)、均方误差(meansquareerror)、平均百分比误差(meanpercentageerror)和平均绝对百分比误差(meanabsolutepercentageerror)较为常用的是均方误差(MSE)11.2平稳序列的预测

11.2.1移动平均预测11.2.2简单指数平滑预测第11章时间序列预测平稳序列的预测平稳序列(stationaryseries):不含有趋势的序列,其波动主要是随机成分所致,序列的平均值不随着时间的退役而变化通过对时间序列进行平滑以消除其随机波动,因而也称为平滑法平稳序列的预测方法有简单平均(simpleaverage)法、移动平均(movingaverage)法、简单指数平滑(simpleexponentialsmoothing)法、Box-Jenkins方法(ARIMA模型)等本节主要介绍移动平均和简单指数平滑两种方法,Box-Jenkins方法在10.5节中介绍11.2.1移动平均预测11.2平稳序列的预测移动平均预测

(movingaverage)

选择一定长度的移动间隔,对序列逐期移动求得平均数作为下一期的预测值将最近k期数据平均作为下一期的预测值

设移动间隔为k(1<k<t),则t+1期的移动平均预测值为预测误差用均方误差(MSE)

来衡量移动平均预测

(特点)

将每个观测值都给予相同的权数只使用最近期的数据,在每次计算移动平均值时,移动的间隔都为k主要适合对较为平稳的序列进行预测对于同一个时间序列,采用不同的移动步长预测的准确性是不同的选择移动步长时,可通过试验的办法,选择一个使均方误差达到最小的移动步长移动平均预测

(例题分析)

【例11-2】根据表11-1中的棉花产量数据,分别取移动间隔k=3和k=5进行移动平均预测,计算出预测误差,并将原序列和预测后的序列绘制成图形进行比较。进行移动平均预测ExcelExcel移动平均预测

(例题分析)

移动平均预测

(例题分析)

cottonMA11.2.2简单指数平滑预测11.2平稳序列的预测简单指数平滑预测

(simple

exponentialsmoothing)适合于平稳序列(没有趋势和季节变动的序列)对过去的观测值加权平均进行预测的一种方法观测值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑t+1的预测值是t期观测值与t期平滑值St的线性组合,其预测模型为

Yt为第t期的实际观测值

St

为第t期的预测值为平滑系数(0<<1)简单指数平滑预测

(平滑系数的确定)不同的会对预测结果产生不同的影响当时间序列有较大的随机波动时,宜选较小的,注重于近期的实际值时,宜选较大的

选择时,还应考虑预测误差误差均方来衡量预测误差的大小确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值简单指数平滑预测

(例题分析)指数平滑预测【例11-2续】根据表11-1中的棉花产量数据,分别取=0.3和=0.5进行指数平滑预测,计算出预测误差,并将原序列和预测后的序列绘制成图形进行比较阻尼系数=1-SPSSExcelExcel简单指数平滑预测

(例题分析—Excel输出的结果)移动平均和简单指数平滑预测

(例题比较分析)cottonS-EXP&MA用SPSS进行简单指数平滑预测

(13.0版本)第1步:选择【Analyze-TimeSeries】【ExponentialSmoothing

】,进入主对话框第2步:将预测变量(本例为“棉花产量”)选入【Variables】。在【Model】下选择【Simple】。点击【Parameters】,在【General[Alpha]-Value】后输入制定的值(本例分别取0.3和0.5)(注:若不知道指定多大的合适,可选择【GridSearch】,系统会自动搜索,初始值为0,步长为0.1,终止值为1)在【InitialValue】下选择【Custom】,并在【Starting】后输入初始值(本例选择1990年的实际值:450.77),在【Trend】后输入“0”(表示没有趋势)。点击【Continue】返回主对话框(注:初始值的默认方式是【Automatic】,此时系统会根据原始值序列自动计算适合的初始值和趋势值)点击【Save】,在【PredictCase】下点击【Predict-Through】,在【Observation】后的方框内输入要预测的要预测的观测值的时期数(本例为17,表示要预测2006年的数值)。【Continue】返回主对话框。点击【OK】指数平滑预测SPSS用SPSS进行简单指数平滑预测

(16.0版本)使用SPSS进行时间序列预测时,首先需要对观测值序列附加时间因方法是选择【Data】【Definedates】,然后在【CasesAre】下根据需要选择【Years】、【Years,quarters】等等,然后指定第一个观测值的时间【FirstCaseIs】。这样,SPSS会在观测值序列之后加上时间变量第1步:选择【Analyze-TimeSeries】【Createmodels】,进入主对话框第2步:将预测变量选入【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,在【ModelType】下选择【Simple】(进行简单指数平滑预测),点击【Continue】返回主对话框第3步:点击【Save】,在【Description】下选择需要预测的结果,如【PredictedValues】、【LowerConfidenceLimits】、【UpperConfidenceLimits】、【NoiseResiduals】等。点击【options】,在【ForecastPeriod】下选中【Firstcaseafterendofestimationperiodthroughaspecifieddate】,在【Date】框内输入要预测的时期

指数平滑预测SPSS简单指数平滑预测

(例题分析—SPSS13.0输出的结果)自动模式:1.

不知道指定多大的合适,选择【GridSearch】,系统自动搜索

2.系统自动计算合适的初始值和趋势值系统自动搜索的预测及误差平方和排序。误差最小的是=0.411.3趋势预测

11.3.1线性趋势预测11.3.2非线性趋势预测11.3.3残差自相关及其检验第11章时间序列预测趋势序列预测时间序列有常数增减的线性趋势和不同形态的非线性趋势可选择的预测模型线性趋势(lineartrend)模型回归直线Holt指数平滑模型(Holt’smodel)非线性趋势(non-lineartrend)模型指数曲线多项式11.3.1线性趋势预测11.3趋势预测线性趋势预测

(lineartrend)线性趋势:是时间序列按一个固定的常数(不变的斜率)增长或下降拟合一条线性趋势方程进行预测

t—时间变量

b0—趋势线在Y轴上的截距

b1—斜率,表示时间t

变动一个单位时观测值的平均变动量线性趋势预测

(例题分析)【例11-3】根据表11-1中人均GDP数据,用直线趋势方程预测2006年的人均GDP,并给出各年的预测值和预测误差,将实际值和预测值绘制成图形进行比较线性趋势方程:预测的R2和标准误差:R2=0.9806

2005年人均GDP增长率的预测值

线性趋势预测SPSS线性趋势预测

(例题分析)预测值预测误差置信区间SPSS线性趋势预测

(例题分析)GDPlinear11.3.2Holt指数平滑预测11.3趋势预测在简单指数平滑中,实际上是用期的平滑值作为期的预测值,它适合于较平稳的序列。当时间序列存在趋势时,简单指数平滑的预测结果总是滞后于实际值Holt指数平滑预测模型,一般简称为Holt模型(Holt’smodel),适合于含有趋势成分(或有一定的周期成分)序列的预测Holt模型使用两个参数(平滑系数)和(取值均在0和1之间)和以下三个方程Holt指数平滑预测模型

(Holt’smodel)

Holt模型的三个方程Holt指数平滑预测模型

(Holt’smodel)

平滑值趋势项更新

K期预测值

Holt模型中初始值的确定Holt指数平滑预测模型

(Holt’smodel)

HoltHolt指数平滑预测模型

(例题分析)

【例11-4】沿用例11—3。用Holt指数平滑模型预测2006年的人均GDP,并将实际值和预测值绘制成图形进行比较SPSS用SPSS进行Holt指数平滑预测

(16.0版本)第1步:选择【Analyze-TimeSeries】【Createmodels】,进入主对话框第2步:将预测变量选入【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,在【ModelType】下选择【Holt’slineartrend】。点击【Continue】返回主对话框第3步:点击【Save】,在【Description】下选择需要预测的结果,如【PredictedValues】、【LowerConfidenceLimits】、【UpperConfidenceLimits】、【NoiseResiduals】等。点击【options】,在【ForecastPeriod】下选中【Firstcaseafterendofestimationperiodthroughaspecifieddate】,在【Date】框内输入要预测的时期Holt指数平滑预测SPSSHolt指数平滑预测

(例题分析—SPSS16.0输出的结果)Holt指数平滑预测

(例题分析—SPSS16.0输出的结果)人均GDP的Holt指数模型预测Holt11.3.2非线性趋势预测11.3趋势预测时间序列以几何级数递增或递减一般形式为指数曲线

(exponentialcurve)

b0,b1为待定系数exp表示自然对数ln的反函e=2.71828182845904可线性化后使用最小二乘法可直接使用SPSS指数曲线

(例题分析)

【例11-5】根据表11-1中的轿车产量数据,用指数曲线预测2006年的轿车产量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较指数曲线趋势方程:2005年轿车产量的预测值

用SPSS进行曲线估计第1步:选择【Analyze】【Regression–CurveEstimation】选项,进入主对话框第2步:在主对话框中将被预测变量(本例为“轿车产量”)选入【Dependent】;将自变量(本例为“时间t”)选入【Variable】;在【Models】下选择【Exponential】(如果需要其他曲线,可选择【Cubic】(三次曲线)、【S】(S型曲线)等等);点击【Save】。在【SaveVariables】下选中【PredictedValues】(输出点预测值)、【Residual】(输出残差)、【PredictionIntervals】(输出95%的预测区间)。点击【Continue】回到主对话框。点击【OK】指数曲线预测SPSS用SPSS进行曲线估计

(Model中的其他曲线)【Models】下提供的其他曲线:【Quadratic】—二次曲线【Cubic】—三次曲线【Compound】—复合曲线【S】—S型曲线【Growth】—成长曲线【Power】—幂指数曲线曲线预测SPSS指数曲线

(例题分析—SPSS)预测值预测误差置信区间SPSS指数曲线

(例题分析—SPSS)carY=5.734×EXP(0.242t)Y=5.734×1.273^t)有些现象的变化形态比较复杂,它们不是按照某种固定的形态变化,而是有升有降,在变化过程中可能有几个拐点。这时就需要拟合多项式函数当只有一个拐点时,可以拟合二阶曲线,即抛物线;当有两个拐点时,需要拟合三阶曲线;当有k-1个拐点时,需要拟合k阶曲线k阶曲线函数的一般形式为可线性化后,根据最小二乘法求使用SPSS中的【Analyze】【Regression–CurveEstimation】【Models】【Cubic】得到多阶曲线多阶曲线

(例题分析)

【例11-6】根据表11-1中的金属切削机床产量数据,拟合适当的趋势曲线,预测2006年的金属切削机床产量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较三阶曲线方程:

2005年的预测值三阶趋势预测SPSS多阶曲线

(例题分析)

预测值预测误差置信区间SPSS多阶曲线

(例题分析)machinetoolCubic11.3.3残差自相关及其检验11.3趋势预测残差自相关及其检验

(autocorrelation)不同点的时间序列残差之间的相关称为自相关时间序列的残差是时间序列的观测值与相应的预测值之差对于大多数商业和经济序列来说,残差会出现连续的正值和连续的负值,也就是相邻的两个残差具有相同的正负号,时间序列残差之间的相关称为自相关相邻两期(t期和t-1期)残差之间的相关称为一阶自相关残差自相关及其检验

(自相关对预测的影响)对于自相关序列应避免使用最小二乘法拟合的回归模型进行预测最小二乘回归的基本假定之一就是残差是相互独立的随机变量自相关显然破坏了这些假定,从而使回归系数的估计不再具有最小方差的性质用最二乘模型进行预测时产生的误差比预期的要大将回归方法用于时间序列时应注意这一问题解决残差自相关的办法之一是引进观测值的滞后值作为自变量进行这种回归预测,这样的回归称为自回归残差自相关及其检验

(D-W检验)判断残差之间是否存在自相关的方法之一就是使用Durbin-Watson检验,简称D-W检验对于双侧检验提出的假设为H0:残差无自相关,H1:残差存在自相关检验统计量为检验时使用D-W检验统计量临界值表判断残差自相关及其检验

(D-W检验统计量临界值表)显著性水平为=0.05、样本量为n、自变量个数为k,统计量的临界值下限为dL和上限dU残差自相关及其检验

(D-W检验的判别)统计量的取值范围是0<d<4若统计量d<dL,拒绝原假设,存在自相关如果统计量d>dU,不拒绝原假设,没有证据表明存在自相关如果dL<d<dU,属于不确定区,无法根据Durbin-Watson统计量作出判断残差自相关及其检验

(例题分析)【例】根据表11-1中的金属机床产量序列,检验是否存在自相关统计量d=0.47<1.10,拒绝原假设,机床产量序列存在自相关

自相关及其检验

(用SPSS计算检验统计量d)【Analyze】【Regression-linear】将因变量选入【Dependent】(本例为机床产量)将自变量选入【Independent(s)】(本例为时间)主对话框点击【Statistics】,选择【Residuals】中的【Durbin-Watson】,点击【Continue】回到主对话框点击【OK】在输出结果中的“ModelSummary”给出的统计量为0.470计算D-W统计量SPSS11.4多成分序列的预测

11.4.1Winters指数平滑预测11.4.2引入季节哑变量的多元回归预测11.4.3分解预测第11章时间序列预测多成分序列的预测序列包含多种成分预测方法主要有Winters指数平滑预测模型(Winters’model)引入季节哑变量的多元回归模型(seasonalmultipleregression)预测分解(decomposition)预测等分解预测是先将时间序列的各个成分依次分解出来,尔后再进行预测11.4.1Winters指数平滑预测11.4多成分序列的预测简单指数平滑模型适合于对平稳序列(没有趋势和季节成分)的预测;Holt指数平滑模型适合于含有趋势成分但不含季节成分序列的预测如果时间序列中既含有趋势成分又含有季节成分,则可以使用Winter指数平滑模型进行预测要求数据是按季度或月份收集的,而且至少需要4年(4个季节周期长度)以上的数据Winter指数平滑模型包含三个平滑参数即、和(取值均在0和1之间)和以下四个方程Winter指数平滑预测模型

(Winter’smodel)

Winter模型的四个方程Winter指数平滑预测模型

(Winter’smodel)平滑值趋势项更新

季节项更新

K期预测值

Winter模型四个方程的含义Winter指数平滑预测模型

(Winter’smodel)平滑值趋势项更新

季节项更新

K期预测值

winter指数平滑预测模型

(例题分析)

【例11-7】下表是一家啤酒生产企业2005—2010年各季度的啤酒销售量数据。用Winter模型预测2011年各季度的啤酒销售量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较用SPSS进行Winter指数平滑预测

(13.0)第1步:选择【Analyze-TimeSeries】【ExponentialSmoothing】,进入主对话框第2步:将预测变量(本例为“销售量”)选入【Variables】。在【Model】下选中【Winters】。点击【Parameters】,在【General[Alpha]-Value】后输入指定的值;在【Trend[Gamma-Value]】后输入指定的值;在【Seasonal[Delta-Value]】后输入指定的值(若不知道指定多大的、和合适,可选择【GridSearch】,系统会自动搜寻,初始值为0,步长分别为=0.1、=0.2和,终止值为1)。在【InitialValue】下选择【Custom】,并在【Starting】后输入初始值的平滑值,在【Trend】后输入初始的趋势平滑值(如果不知到指定多少合适,可采用系统的默认方式【Automatic】,此时系统会根据原始值序列自动计算适合的初始值和趋势值)。点击【Continue】返回主对话框第3步:点击【Save】,在【PredictCase】下点击【Predict-Through】,在【Year】后的方框内输入要预测的年份(本例为2006,表示要预测2006年各季度的数值)。【Continue】返回主对话框。点击【OK】Winter指数平滑预测SPSS用SPSS进行Winter指数平滑预测

(16.0版本)第1步:选择【Analyze-TimeSeries】【Createmodels】,进入主对话框第2步:将预测变量选入【DependentVariables】。在【Method】下选择【ExponentialSmoothing】,点击【Criteria】,在【ModelType】下选【Winters‘additive】或【Winters’multiplicative】。如果序列的趋势不依赖于序列的水平,选择【Winters‘additive】,如果序列的趋势依赖于序列的水平,选择【Winters’multiplicative】第3步:点击【Save】,在【Description】下选择需要预测的结果,如【PredictedValues】、【LowerConfidenceLimits】、【UpperConfidenceLimits】、【NoiseResiduals】等。点击【options】,在【ForecastPeriod】下选中【Firstcaseafterendofestimationperiodthroughaspecifieddate】,在【Date】下的【Year】中输入要预测的年份,在【Quarter】中输入要预测的季节值个数,比如要预测2011年1~4季度的值,在【Year】中输入2011,在【Quarter】中输入4。点击【OK】Winter指数平滑预测SPSSWinter指数平滑预测

(例题分析—SPSS163.0输出的结果)Winter指数平滑预测

(例题分析—SPSS13.0输出的结果)Winterbeer11.4.2引入季节哑变量的多元回归预测11.4多成分序列的预测季节哑变量多元回归预测

(seasonalmultipleregression)用虚拟变量表示季节的多元回归预测方法若数据是按季度记录的,需要引入3个虚拟变量(一季度作为参照水平);按月记录的,则需要引入11个虚拟变量季度数据的季节性多元回归模型可表示为季节哑变量多元回归预测

(系数的解释)b0—时间序列的平均值b1—趋势成分的系数,表示趋势给时间序列带来的影响值Q2、Q3、Q3—3个季度的虚拟变量b2、b3、b4—每一个季度与参照的第一季度的平均差值季节哑变量多元回归预测

(例题分析)

【例11-8】下表是一家啤酒生产企业2005—2010年各季度的啤酒销售量数据。用分解预测法预测2011年各季度的啤酒销售量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较BEER朝日用SPSS进行哑变量回归

(只有一个哑变量:一个哑变量和一个数值自变量)第1步:选择【Analyze】,并选择【GeneralLinearModel-Univaiate】进入主对话框第2步:将因变量(销售量)选入【DependentVariable】,将自变量(性别)选入【FixedFactor(s)】,将数值自变量(时间变量t)选入【Covariate(s)】第3步:点击【Model】,并点击【Custom】;将季度[F]选入【Model】,将时间变量t[C]也选入【Model】;在【BuildTerm(s)】下选择【Maineffects】。点击【Continue】回到主对话框。点击【Options】,在【Display】下选中【Parameterestimates】(估计模型中的参数)。点击【Continue】回到主对话框。点击【OK】

哑变量回归SPSS季节哑变量多元回归预测

(例题分析—参数估计)啤酒销售量哑变量多元回归模型的检验季节哑变量多元回归预测

(例题分析—参数估计)啤酒销售量哑变量多元回归模型的估计

BEER朝日季节性哑变量元回归预测

(例题分析)季节哑变量多元回归预测

(例题分析)beer11.4.3分解预测11.4多成分序列的预测分解预测

(预测步骤)分解(decomposition)预测是适合于含有趋势、季节、循环多种成分序列预测的一种古典方法,仍得到广泛应用,因为该方法相对来说容易理解,结果易于解释,在很多情况下能给出很好的预测结果预测步骤确定并分离季节成分计算季节指数,以确定时间序列中的季节成分将季节成分从时间序列中分离出去,即用每一个观测值除以相应的季节指数,以消除季节性对消除季节成分的序列建立线性预测模型进行预测计算出最后的预测值用预测值乘以相应的季节指数,得到最终的预测值分解预测

(例题分析)

【例11-9】下表是一家啤酒生产企业2005—2010年各季度的啤酒销售量数据。用分解预测法预测2011年各季度的啤酒销售量,并计算出各期的预测值和预测误差,将实际值和预测值绘制成图形进行比较分解预测

(例题分析)beer分解预测

(第1步:确定并分离季节成分)计算季节指数以其平均数等于100%为条件而构成的反映季节变动的值表示某一月份或季度的数值占全年平均数值的大小如果现象的发展没有季节变动,则各期的季节指数应等于100%季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定分解预测

(第1步:确定并分离季节成分)季节指数计算步骤计算移动平均值(季度数据采用4项移动平均,月份数据采用12项移动平均),并将其结果进行“中心化”处理计算移动平均的比值,也称为季节比率将序列的各观测值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值,即季节指数季节指数调整各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整具体方法是:将第2步计算的每个季节比率的平均值除以它们的总平均值计算季节指数进行分解SPSSExcel分解预测

(第1步:确定并分离季节成分)分离季节成分:将原时间序列除以相应的季节指数季节因素分离后的序列反映了在没有季节因素影响的情况下时间序列的变化形态用SPSS进行分解

(例题分析)第1步:选择【Analyze-TimeSeries】【SeasonalDecomposition

】,进入主对话框第2步:将待分解变量(本例为“销售量”)选入【Variable(s)】。在【Model】下选中【Multiplicative】。点击【Continue】返回主对话框。点击【OK】进行分解SPSS分解预测

(SPSS分解的结果)

季节分离趋势和循环实际值beerdecomposition分解预测

(SPSS的分解结果)季节指数趋势和周期季节分离随机波动预测误差最终预测回归预测分解预测

(第3步:计算出最后的预测值)根据分离季节性因素的序列确定线性趋势方程根据趋势方程进行预测该预测值不含季节性因素,即在没有季节因素影响情况下的预测值计算最终的预测值将回归预测值乘以相应的季节指数实际值和最终预测值图beer11.5Box-Jenkins方法:ARIMA模型

11.5.1自相关与自相关图11.5.2Box-Jenkins方法的基本思想11.5.3ARIMA模型的识别第11章时间序列预测11.5.1自相关与自相关图11.5Box-Jenkins方法:ARIMA模型

自相关与自相关图自相关(autocorrelation)是时间序列各观测值之间的相关时间序列后期的观测值与它前面的观测值相关可以想象2007年的人均GDP与2006年的人均GDP相关,2008年与2007年相关等等自相关程度用自相关系数来度量与两个变量之间的Pearson相关系数类似自相关与自相关图

(自相关系数)自相关系数自相关与自相关图判断一个序列是否存在显著自相关的一种方法是,算出每个自相关系数的95%的置信区间,如果某个自相关系数落在这个区间内,就可以认为该自相关系数是不显著的,如果所有(或大多数)在自相关系数都落在这个区间内,就可以认为该序列不存在自相关另一种判断方法是凭经验,提出假设总体的自相关系数等于0的原假设(即不存在自相关),对于n个观测值的序列,任意的滞后期为k,如果,就拒绝原假设,表明该序列存在自相关自相关与自相关图

(自相关系数—例题分析)

【例11-10】利用例11-1中的人均GDP序列,计算滞后1期(即,k=1)的自相关系数计算自相关系数计算自相关系数绘制自相关图SPSSExcel自相关与自相关图

(自相关系数—例题分析)【例11-10】Excel输出的滞后1期人均GDP序列的自相关系数自相关与自相关图

(自相关系数—例题分析)【例11-10】SPSS输出的人均GDP序列的自相关系数SPSS【Graphs】【TimesSeries】【Autocorrelations】作图功能可直接得到不同滞后期的自相关系数及自相关图自相关与自相关图

(自相关图—例题分析)【例11-10】人均GDP序列的自相关图纵坐标是自相关函数(AFC)。两条线是自相关系数的95%的置信上限和置信下限。随着滞后期的增加,自相关系数并没有逐渐递减和趋于0,而且有多个自相关系数都超出了95%的置信区间,这表明人均GDP序列不是平稳序列自相关与自相关图

(自相关图—例题分析)【例】棉花产量序列的自相关图随着滞后期的增加,自相关系数逐渐递减和趋于0,而几乎都在95%的置信区间内,这表明棉花产量序列基本上是平稳序列

自相关与自相关图

(自相关图—例题分析)【例】啤酒销售量序列的自相关图虽然随着滞后期的增加,自相关系数逐渐递减和趋于0,但k=4及4的倍数时的自相关系数明显偏大,而且几乎都超出了95%的置信区间,有明显的周期性特征,表明啤酒销售量具有明显的季节成分

偏自相关与偏自相关图偏自相关与偏自相关图

(偏自相关图—例题分析)【例】人均GDP序列的偏自相关系数及偏自相关图偏自相关与偏自相关图

(偏自相关图—例题分析)【例】机床产量序列的偏自相关系数及偏自相关图偏自相关与偏自相关图

(偏自相关图—例题分析)【例】棉花产量序列的偏自相关系数及偏自相关图11.5.2Box-Jenkins方法的基本思想11.5Box-Jenkins方法:ARIMA模型

Box-Jenkins方法的基本思想

(与经典回归模型的区别)经典的回归预测是通过解释变量(自变量)来预测被解释变量(因变量)的一种模型。用回归模型进行预测时,预测者需要事先知道有哪些因素影响(自变量)影响被预测变量(因变量)。但现实中我们通常不知道影响预测变量的因素有哪些,这时ARIMA模型就是一个很好的选择假定时间序列数据产生于一个黑盒子(blackbox),即回归预测方法是试图寻找自变量来预测观测到的时间序列,即黑盒子观测到的时间序列解释变量(自变量)黑盒子(回归模型)观测到的时间序列Box-Jenkins方法的基本思想ARIMA该模型是利用时间序列过去的观测值来进行预测的一种方法,它不需要解释变量而Box-Jenkins方法并不是从解释变量入手,而是从观测值入手,然后试图去寻找正确的黑盒子。它可以从某一白噪声(whitenoise)序列产生出所观察到的时间序列,即由于在模型中没有用到解释变量,所以我们假设所观察的时间序列从白噪声序列开始,经过黑盒子后变成要预测的时间序列。这里的白噪声序列实际上就是一系列的纯随即数字,其特点是相邻的观测值之间没有联系;以前的观测值对预测未来的观测值没有作用白噪声序列黑盒子观测到的时间序列Box-Jenkins方法的基本思想Box-Jenkins方法是通过对时间序列实际观测值特征的分析来确定选择什么样的黑盒子将实际序列转化成白噪声序列开始时选择一个最可能的黑盒子,如果得到白噪声序列,就认为这是一个正确的模型,可以用它来进行预测。如果没有得到白噪声序列,就再尝试另一个黑盒子,直到得到白噪声序列为止。这里的黑盒子就是我们要寻找的模型由于实际中我们面对的是一个观察到的时间序列,把上述过程反过来看,如果我们让一个实际观测到的时间序列通过由我们所选择的模型这个黑盒子,若所选择的模型是正确的,那么得到的预测误差就应该是一个白噪声序列11.5.3ARIMA模型的识别11.5Box-Jenkins方法:ARIMA模型

ARIMA模型的识别

(AR模型)自回归(autoregression)模型,简称AR模型,是利用观测值Yt与以前时期的观测值之间的关系来预测值Y的一种多元回归方法。P阶AR模型为:ARIMA模型的识别

(AR模型的识别)AR模型意为着时间序列的任意一个观测值都是由以前的p个观测值的线性组合加上随机误差et如果一个实际的时间序列与AR模型相似,我们就可以用AR模型进行预测对于实际的时间序列,怎样判断它是否与AR模型相似呢?或者说,我们怎样检验一个实际的时间序列是否是AR序列呢?通常的办法是观察时间序列的自相关图和偏自相关图ARIMA模型的识别

(AR模型的识别)AR序列的自相关图和偏自相关图具有的典型特征自相关图单调递减逐步降为0或交替递减逐步降为0,而它的偏自相关图则具有明显的峰值如果一个序列的偏自相关图只有一个明显的峰值,也就是在p=1后就变得很小,而且没有什么特别的模式,这样的图形称为在p=1后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,那它就是一个AR(1)序列如果偏自相关函数有两个明显的峰值,也就是在p=2后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个AR(2)序列如果它的偏自相关函数有个明显的峰值,也就是在个值后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个AR(p)序列。这时,就可以将该序列识别为一个AR序列,进而用AR模型进行预测ARIMA模型的识别

(AR模型的识别)AR模型的识别—一个白噪声序列生产的AR(1)序列

一个峰值自相关图偏自相关图ARIMA模型的识别

(MA模型)移动平均(movingaverage)模型,简称MA模型,是利用观测值Yt作为因变量,预测Yt时产生的预测误差作为自变量。q阶MA模型为:ARIMA模型的识别

(MA模型的识别)MA模型意为着时间序列的任意一个观测值都是由目前的和以前的q个随机误差的线性组合如果一个实际的时间序列与MA模型相似,我们就可以用MA模型进行预测对于实际的时间序列,我们怎样判断它是否与MA模型相似呢?或者说,我们怎样检验一个实际的时间序列是否是MA序列呢?通常的办法仍然是观察时间序列的自相关图和偏自相关图ARIMA模型的识别

(MA模型的识别)MA序列的自相关图和偏自相关图具有的典型特征自相关图则具有明显的峰值,而它的偏自相关图单调递减逐步降为0或交替递减逐步降为0,如果一个序列的自相关图只有一个明显的峰值,也就是在q=1后就变得很小,而且没有什么特别的模式,这样的图形称为在q=1后截尾,而它的偏自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,那它就是一个MA(1)序列如果偏自相关函数有两个明显的峰值,也就是在q=2后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个MA(2)序列如果它的偏自相关函数有个明显的峰值,也就是在个值后截尾,而它的自相关函数呈现出指数衰减或正弦衰减,呈现出拖尾,它就是一个MA(q)序列。这时,就可以将该序列识别为一个MA序列,进而用MA模型进行预测ARIMA模型的识别

(MA模型的识别)MA模型的识别—一个白噪声序列生产的MA(1)序列

一个峰值自相关图偏自相关图ARIMA模型的识别

(ARMA模型)自回归移动平均(autoregression-movingaverage)模型,简称ARMA模型,是ARMA模型是由AR(p)模型和MA(q)模型混合而成的ARMA(p,q)

AR(p)模型MA(q)模型+ARIMA(p,q)ARIMA模型的识别

(ARMA模型的识别)ARMA序列的自相关图和偏自相关图具有的典型特征自相关图和偏自相关图都是逐渐趋于0而不是突然变为0,或者说自相关图和偏自相关图都拖尾为了确定模型的阶数,需要计算AR项中偏自相关系数显著不为0的项,以及MA项中自相关系数显著不为0的项。如果AR的偏自相关系数有1项显著不为0,MA的自相关系数有1项显著不为0,那这就是一个ARMA(1,1)模型ARIMA模型的识别

(ARIMA模型)使用ARMA模型进行预测时,要求时间序列必须是平稳的,即时间序列中没有趋势、季节和循环成分,其观测值的平均数不随时间的变化而变化现实中的很多序列都是非平稳的,其自相关系数的特点是:开始通常显著不为0,然后逐渐趋于0,或者在自相关图中呈现出一种伪模式(spuriouspattern)。这时使用自相关图或偏自相关图来识别模型就可能产生误判对于非平稳序列,在选择模型之前需要对其进行修正时期平稳化。消除非平稳性的办法之一就是进行差分(difference),也就是将时间序列中的每期观测值减去其前面的观测值,这称为一阶差分(firstdifference)如果原始序列中存在一个斜率不变的趋势,经过差分后就可以消除趋势成分。如果一阶差分不能消除趋势,就需要进行多次差分。比如,在一阶差分的基础上再进行一次差分,就是二阶差分,等等。如果差分后的序列是平稳的,那么它的自相关系数在k=2或k=3后则会落入随机区间,并逐渐趋于0ARIMA模型的识别

(MAIMA模型)人均GDP序列一阶差分后的自相关和偏自相关图

自相关图偏自相关图

自相关图在k=2后出现出随机波动,经一阶差分后的人均GDP序列已上不存在趋势ARIMA模型的识别

(MAIMA模型)经过差分将序列变成平稳后,通常将模型称为ARIMA(p,d,q)模型其中“I”的加入代表整合项(integrated)或差分项d表示差分的阶数p表示自回归(AR)的项数q表示移动平均(MA)的项数如果模型为ARIMA(p,0,0),就是阶自回归模型AR(p);如果模型为ARIMA(0,0,q),就是阶MA(q)模型;如果模型为ARIMA(p,0,q),就是自回归移动平均模型ARMA(p,q)ARIMA模型的识别

(MAIMA模型)ARIMA模型的识别

(MAIMA模型)ARIMA模型的识别

(ARIMA(p,d,q)模型—例题分析)

【例11-11】利用例11-1中的金属机床产量序列,选择适当的ARMA模型进行预测拟合ARIMA模型ARIMA模型的应用SPSSARIMA模型的识别

(ARIMA(p,d,q)模型—例题分析)机床产量序列一阶差分后的自相关和偏自相关图

自相关图偏自相关图

一阶差分后的序列已不存在趋势,且各有一个明显的峰值,选用ARIMA(1,1,1)模型

ARIMA模型的识别

(ARIMA(p,d,q)模型—例题分析)机床产量序列一阶差分后的自相关和偏自相关图

自相关图偏自相关图

一阶差分后的序列已不存在趋势,且各有一个明显的峰值,选用ARIMA(1,1,1)模型

ARIMA模型的识别

(用SPSS求ARIMA(p,d,q)模型)第1步:选择【Analyze-TimeSeries】【ARIMA】,进入主对话框。第2步:将预测变量(本例为“金属机床产量”)选入【Dependent】。在【Model】下的【Autoregressive-p】后p输入的值(本例为1);在【Difference-d】后输入d的值(本例为1);在【MovingAverage-q】后输入q的值(本例为1)。点击【Save】,在【PredictCase】下点击【Predict

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论