人大《统计学》第十一章时间序列分析_第1页
人大《统计学》第十一章时间序列分析_第2页
人大《统计学》第十一章时间序列分析_第3页
人大《统计学》第十一章时间序列分析_第4页
人大《统计学》第十一章时间序列分析_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统 计 学,第11章 时间序列分析,2,第11章 时间序列分析,1 时间序列的描述 2 时间序列的分解法 3 时间序列的平滑法 4 ARIMA模型,3,1 时间序列的描述,1.1 时间序列及其分类 1.2 图形描述 1.3 水平变动描述 1.4 速度变动描述,4,1.1 时间序列及其分类,时间序列定义 时间序列是同一现象按照时间顺序排列而成的一组观测值; 由现象在不同时间上的观测值和现象所属的时间构成。 时间序列分类 绝对数时间序列 时期序列 时点序列 相对数时间序列 平均数时间序列,5,1.2 图形描述,图形描述 展示时间序列特征最直观、有效的形式,通常作为时序分析的第一步。给定一个时间序列

2、,可以首先通过作图来观察数据随时间变化的规律,然后在此基础上展开分析和建模。,6,1.2 图形描述,【例11.1】表11.1以年份形式给出19962007年我国国内生产总值、年末总人口、人口自然增长率、居民消费价格指数四个时间序列,通过作图描述这四个时间序列的特征和变化趋势。 解: 根据表11.1作图,可以判断 我国国内生产总值呈现上升的趋势,并且增长率逐年增加; 年末总人口一直在增长,但增长率逐渐减少; 人口自然增长率呈现线性下降的趋势; 居民消费价格指数序列没有明显的趋势,但呈现出一定的循环变动。,7,1.2 图形描述,表11.1 国内生产总值等指标的时间序列表 资料来源:中国统计年鉴20

3、08,中国统计出版社,2008年。,8,1.2 图形描述,图11.1 不同时间序列的图形描述,9,1.3 水平变动描述,1发展水平与平均发展水平 在时间序列中,令 表示现象所属的时间, 表示现象在不同时间上的观测值,也称为发展水平。 若将整个观测期内的发展水平与参照基期 的发展水平作对比,则 对应的发展水平 称为基期发展水平。 分析研究的其他时期称为报告期,对应指标值称为报告期发展水平。平均发展水平是对整个观测期的发展水平取平均数。,10,1.3 水平变动描述,平均发展水平计算 时间序列观测值的表现形式不同,平均发展水平的计算方法不尽相同。 (1)绝对数时期序列平均发展水平即各期发展水平的简单

4、算术平均。其计算公式为:,11,1.3 水平变动描述,【例11.2】根据表11.1国内生产总值的时序数据,计算19962007年间我国的平均国内生产总值。 解:根据,(亿元),12,1.3 水平变动描述,绝对数时点序列平均发展水平计算步骤 1. 计算出相邻两个时点观测值的平均数 ,将其视为这两个时点所夹的时间段 的发展水平近似值; 2. 以时间段 为权数,对所有时间段的发展水平近似值作加权算术平均。其计算公式为 特别地,若 相等( ),计算公式为,13,1.3 水平变动描述,【例11.3】某公司一年内各个统计时点的职工人数见表11.2,计算该年度公司平均职工人数。 表11.2 职工人数统计 单

5、位:人,14,1.3 水平变动描述,解:根据 1-3月平均职工人数: (人) 4-6月平均职工人数: (人) 7-8月平均职工人数: (人) 9-12月平均职工人数: (人),(人),15,1.3 水平变动描述,【例11.4】根据表11.1年末总人口的时序数据,计算19962007年间我国的年平均人口。 解:根据,16,1.3 水平变动描述,(2)相对数或平均数时间序列的平均发展水平 相对数或平均数时间序列的观测值通常由两个绝对数相比而成,即 因此,其平均发展水平应分别计算分子和分母绝对数的平均发展水平,然后再相比得到,计算公式为:,17,1.3 水平变动描述,【例11.5】根据表11.1国内

6、生产总值和年末总人口的时序数据,计算19962007年间我国人均国内生产总值的平均发展水平。 解:根据例11.2和例11.4的计算结果,19962007年间我国年平均国内生产总值为132816.9亿元,年平均人口数为127789万人。 由,(元/人),18,1.3 水平变动描述,2增长量与平均增长量 增长量用来描述现象在观测期内增长的绝对数量,由报告期发展水平减去基期发展水平得到。 增长量按基期的选择分类 1. 逐期增长量 2. 累计增长量,19,1.3 水平变动描述,设时间序列观测值为 ( ),增长量为 。计算公式为 逐期增长量 ( ) 累计增长量 ( ) 各逐期增长量之和等于最末期的累计增

7、长量 平均增长量是各期逐期增长量的平均数,计算公式为,20,1.3 水平变动描述,【例11.6】根据表11.1国内生产总值的时序数据,计算1996-2007年我国国内生产总值的逐期增长量、累计增长量和平均增长量。 表11.3 1996-2007年国内生产总值的增长量 单位:亿元,21,1.3 水平变动描述,解:根据逐期增长量和累计增长量的公式得表11.3。 由 我国国内生产总值的平均增长量为,(亿元),22,1.4 速度变动描述,1发展速度 根据对比的基期不同,发展速度可以分为环比发展速度和定基发展速度: 环比速度描述现象逐期变化程度 定基速度描述现象在观测期内总的变化程度,23,1.4 速度

8、变动描述,设时间序列观测值为 ,发展速度为 ,计算公式为 环比发展速度: ( ) 定基发展速度: ( ) 各期环比发展速度的连乘积等于相应的定基发展速度: 相邻两个定基发展速度之商等于相应的环比发展速度:,24,1.4 速度变动描述,2增长速度(增长率) 根据基期的不同选择,增长速度可以分为环比增长速度和定基增长速度。设时间序列观测值为 ,增长速度为G,计算公式为 环比增长速度: ( ) 定基增长速度: ( ),25,1.4 速度变动描述,【例11.7】根据表11.1国内生产总值的时序数据,计算2007年的环比发展速度、环比增长速度、定基发展速度、定基增长速度;假设2008年、2009年与20

9、07年的环比增长率相等,预测2008年和2009年的国内生产总值。 解: 环比: 定基: 2008年和2009年的国内生产总值预测值为,(亿元),(亿元),26,1.4 速度变动描述,3平均发展速度与平均增长速度 平均发展速度: ( ) 平均增长速度: ( ),27,1.4 速度变动描述,【例11.8】根据表11.1中国内生产总值的时序数据,计算1996-2007年的平均发展速度、平均增长速度,并根据平均增长速度预测2008年和2009年的国内生产总值。 解:1996-2007年的平均发展速度和平均增长速度依次为 2008年和2009年的国内生产总值预测值为,(亿元),(亿元),28,1.4

10、速度变动描述,变动描述分析注意事项: 1. 正确选择基期 2. 在速度变动描述中,报告期和基期不允许有0和负数 3. 速度与水平应该结合分析: 采用增长1%的绝对值来弥补增长率分析的局限性。增长率1%的绝对值反映增长率每增加一个百分点对应的绝对增长量,该指标一般与环比增长率结合使用,其计算公式为: 增长1%的绝对值,29,2 时间序列的分解法,2.1 时间序列的分解模型 2.2 时间序列的分解步骤 2.3 利用时间序列分解模型展开预测,30,2.1 时间序列的分解模型,时间序列的变动分解 长期趋势(T) 季节变动(S) 循环变动(C) 不规则变动(I),31,2.1 时间序列的分解模型,1长期

11、趋势 长期趋势(long term trend)是时间序列在较长时期内持续上升或下降的发展态势;可以是线性的,也可以是非线性的;通常由某种固定性因素长期作用于事物产生,其发展具有持续性,有利于根据以往的观测值对未来进行预测。 2季节变动 季节波动(seasonal fluctuation)是时间序列在一年内重复出现的周期性波动; “季节”不仅指一年中的四季,还可以指一年中任何一种周期,如月、周、日、时等;季节波动多是由于自然因素和生产或生活条件的影响引起的,其波动具有重复性。,32,2.1 时间序列的分解模型,3循环变动 循环变动(cyclical fluctuation)是时间序列较长时间内

12、(通常为一年以上)上下起伏的周期性波动。循环变动是一种涨落相间的交替波动;循环变动的周期长短不一、幅度高低不同,不具有重复性。 4不规则变动 不规则变动(irregular variation)包含时间序列中所有没有明显规律性的变动;不规则变动是时间序列剔除长期趋势、季节变动、循环变动后的偶然性波动,又称剩余变动或随机变动。,33,2.1 时间序列的分解模型,构建时间序列分解模型(设 为时间序列的指标值) 1. 加法模型: 2.乘法模型:,34,2.2 时间序列的分解步骤,时间序列的分解步骤 1图形描述 2长期趋势的测定 3季节变动的测定 4循环变动的测定 5不规则变动的测定,35,2.2 时

13、间序列的分解步骤,【例11.9】表11.4是2000-2008年我国社会消费品零售总额月度时间序列。选择恰当的分解模型将该时间序列分解,并分别测算各个变动。 表11.4 2000-2008年我国社会消费品零售总额月度数据 单位:亿元,36,2.2 时间序列的分解步骤,1图形描述 。,图11.2 社会消费品零售总额月度时序图,37,2.2 时间序列的分解步骤,2长期趋势的测定 对于含有长期趋势的时间序列,首先采用移动平均法剔除季节变动和不规则变动,再对得到的新时间序列拟合长期趋势。,图11.3 零售总额长期趋势图,38,2.2 时间序列的分解步骤,3季节变动的测定 在时间序列的乘法模型中,季节变

14、动是通过季节指数来估算的;季节指数可以描述现象由于受季节因素的影响偏离其总平均水平的相对程度,可以通过按季平均法得到。 按季平均法的前提是时间序列呈水平趋势,计算步骤如下: 1. 对多年同季数据进行简单平均,以消除不规则运动。 2. 将同季平均数与总平均数作比,得到季节指数 。,39,2.2 时间序列的分解步骤,图11.4 零售总额季节指数图,40,2.2 时间序列的分解步骤,4循环变动的测定 由于循环波动的周期长短不一、波动大小不同,且常与不规则运动交织在一起,通常采用剩余法得到;剩余法是以时间序列的分解模型为基础,从时间序列中分离趋势变动、季节变动和不规则变动,从而得到循环波动; 由于分离

15、的结果容易受其他变动因素估算效果的影响,实际通常还要结合定性分析方法。 将序列 除以 ,即得到循环变动 。,41,2.2 时间序列的分解步骤,5不规则变动的测定 不规则变动没有规律可循,因此也采用剩余法得到。 将序列SI除以S,即得到不规则变动I,,42,2.3 利用时间序列分解模型展开预测,展开预测具体步骤 1. 对各个变动历史观测值的分析和建模 2. 分项预测未来值 3. 合成时间序列的预测值 注:由于不规则变动没有规律、无法预测,所以时间序列的预测模型只包含长期趋势、季节变动和循环变动三个成分。,43,2.3 利用时间序列分解模型展开预测,【例11.10】在例11.9所建变动模型的基础上

16、,对2009年1月至6月我国社会消费品零售总额进行预测。 解:按照上述步骤,可以得到2009年上半年我国社会消费品零售月度总额的预测值,如表11.8。以2009年1月为例,其长期趋势为:,(亿元),44,2.3 利用时间序列分解模型展开预测,通过循环变动C的图形我们可以判断,该序列循环变动的周期较长,相对长期趋势的波动较和缓,如图11.5所示。因此直接选取2008年6月的循环变动值作为预测值:,图11.5 零售总额的循环变动图,45,2.3 利用时间序列分解模型展开预测,已知该时间序列1月的季节指数为110.15%。根据时间序列乘法预测模型我们可以得到2009年1月我国社会消费品月度零售总额的

17、预测值: 最终得到2009年上半年6个月的预测值见表11.8。 表11.8 2009年上半年社会消费品月度零售总额预测值,(亿元),46,2.3 利用时间序列分解模型展开预测,将2009年上半年社会消费品月度零售总额预测值与2000-2008年实际值联合绘图,可以看出预测值很好地沿承了原序列的变动特征,如图11.6所示。,图11.6 零售总额的原序列与预测值图,47,3 时间序列的平滑法,平滑法基本思想 通过加权平均等方式消除随机波动的影响,使序列平滑化,从而展示其长期的发展趋势。 平滑技术分类 移动平均 指数平滑 平滑法运用 平滑时间序列,描述序列趋势 短期预测,48,3 时间序列的平滑法,

18、3.1 预测方法的评估 3.2 移动平均法 3.3 指数平滑法,49,3.1 预测方法的评估,衡量预测误差常用指标 (1)平均绝对误差(mean absolute deviation,MAD) (2)均方误差(mean square error,MSE) (3)平均绝对百分比误差(mean absolute percentage error,MAPE) 注: 为时间序列第 期观测值, 为第 期预测值。,50,3.2 移动平均法,1简单移动平均法 设时间序列已有的 期观察值为 ,取移动平均期数为 ( ),则 第 期的预测值: 第 期的预测值:,51,3.2 移动平均法,【例11.11】根据表11

19、.9中我国城市居民消费价格指数数据,分别取k=3和k=5,采用简单移动平均法计算各年城市居民消费价格指数的预测值,并对预测模型进行比较。(表11.9见书) 解:移动平均的结果如表11.9。 以3项移动平均为例,表11.9中1993年的预测值就是1990年、1991年、1992年3年的平均值;依次类推,2008年的预测值就是2005年、2006年、2007年3年的平均值。3项移动平均的均方误差是1993年至2007年误差平方的平均值。,52,3.2 移动平均法,各年城市居民消费价格指数的观测值与移动平均预测值如图11.7所示。,图11.7 消费价格指数的移动平均预测值,53,3.2 移动平均法,

20、2加权移动平均法 取移动期数为 ( ),权数为 ( ), 其中:,54,3.3 指数平滑法,指数平滑法 指数平滑法是加权移动平均法的一种特殊形式,对距离越远的观测值赋予的权重越小,并且权重随着时间间隔的增大呈指数衰减。 指数平滑法分类(依据修匀次数) 1. 一次指数平滑(适合对水平的时间序列进行预测) 2. 二次指数平滑(适合对有趋势的时间序列进行预测) 3. 多次指数平滑(适合对有趋势的时间序列进行预测),55,3.3 指数平滑法,【例11.12】根据表11.10中我国城市居民消费价格指数数据,选择 、 、 ,采用指数平滑法计算各年城市居民消费价格指数的预测值,并对预测模型进行比较。(表11

21、.10见书) 解:指数平滑的结果如表11.10。 以 为例,设 , 有 依次类推,2008年的预测值即2007年实际值与预测值的加权组合:,56,3.3 指数平滑法,各年城市居民消费价格指数的观测值与指数平滑预测值如图11.8所示。,图11.8 消费价格指数的移动平均预测,57,3.3 指数平滑法,预测结果: 平滑系数为0.1的指数平滑预测均方误差为60.79 平滑系数为0.5的指数平滑预测均方误差为37.75 平滑系数为0.9的指数平滑预测均方误差为23.82 就本例而言,平滑系数为0.9的指数平滑预测效果更好,选择104.2作为2008年我国城市居民消费价格指数的预测值。,58,4 ARI

22、MA模型,4.1 ARIMA模型简介 4.2 时间序列的自相关分析 4.3 ARIMA模型的建模,59,4.1 ARIMA模型简介,ARIMA模型 ARIMA模型是在ARMA模型基础上整合了差分运算后形成的方法,是拟合平稳序列最常用的模型。 ARMA模型描述了时间序列观察值之间的相关关系,并利用这种关系预测未来值。 ARIMA模型分类 1. 自回归模型(auto-regressive) 2. 移动平均模型(moving average) 3. 混合模型(auto-regressive and moving average),60,4.1 ARIMA模型简介,1ARMA模型 自回归模型由前面 个

23、观测值的线性组合加上随机误差项 (服从独立同分布)得到,简记为 ,其模型为 移动平均模型是当期的随机误差项和前面 个随机误差项的线性组合,简记为 ,其模型为 自回归移动平均模型是 和 的组合,简记为 ,其模型为,61,4.1 ARIMA模型简介,2差分法 设 为后移算子,有: 1阶差分 2阶差分 p阶差分 k步差分,62,4.1 ARIMA模型简介,根据非平稳时间序列的不同特点,采取合适的差分运算实现其平稳: 如果序列具有明显的线性趋势,1阶差分可以实现趋势平稳; 如果序列具有曲线趋势,通过2阶或低阶差分可实现平稳化; 如果序列变化具有季节性且波动周期为s,可以选择s步差分消除季节性波动的影响

24、; 如果差分后可以转换成平稳时间序列,也可以使用ARMA模型建模,所建模型记为 ,其中d为差分阶数。,63,4.2 时间序列的自相关分析,1自相关系数和偏自相关系数 期自相关系数反映时间序列间隔 期的观测值之间的相关程度,其计算公式为: n表示时间序列的观测值个数, 表示间隔时期数, 表示时间序列的观测值均值。自相关系数的取值范围是-1到1。 越接近1,时间序列间隔k期的观测值相关程度越大。,64,4.2 时间序列的自相关分析,期偏自相关系数描述在剔除中间观测值影响后间隔 期的观测值之间的相关程度,其计算公式为: 这里 , 表示间隔时期数, 表示自相关系数。偏自相关系数的取值范围也是-1到1。

25、 接近1,说明在中间观测值一定的条件下,时间序列间隔 期的观测值相关程度越大。,65,4.2 时间序列的自相关分析,2自相关分析图 展示自相关系数和偏自相关系数的图称为自相关分析图;自相关分析图的横坐标表示间隔期数 ,纵坐标表示间隔 期的自相关系数或偏自相关系数值;,图11.9 中国第三产业增加值序列的自相关分析图,66,4.2 时间序列的自相关分析,自相关分析图在ARIMA模型的建模中的作用 (1)平稳性检验 (2)纯随机性检验 (3)模型的识别,67,4.2 时间序列的自相关分析,(1)平稳性检验,68,4.2 时间序列的自相关分析,(2)纯随机性检验,图11.10 纯随机序列的自相关系数

26、图,69,4.2 时间序列的自相关分析,(3)模型的识别 截尾 如果自相关系数和偏自相关系数在最初的 步比较显著,之后迅速衰减为0附近的随机波动,则视为 步截尾。 拖尾 如果自相关系数衰减到0速度非常缓慢,就视为拖尾。,70,4.3 ARIMA模型的建模,ARIMA模型的建模步骤 1时间序列的预处理 2模型的建立及估计 3模型筛选及预测,71,4.3 ARIMA模型的建模,1时间序列的预处理 平稳性检验 平稳性检验主要根据自相关图法进行判断,另外,也可以适当结合时间序列的图形来判断: 对非平稳时间序列,可以结合差分运算(可以反复尝试)和平稳性检验进行平稳化处理。 非随机性检验 在时间序列差分平稳后,还需要根据自相关图进行非纯随机性检验; 时间序列的非纯随机性保证了时间序列还有相关性信息可以提取。,72,4.3 ARIMA模型的建模,2模型的建立及估计 1. 根据自相关系数和偏自相关系数的模型判别准则,初步判断模型的类型和阶数; 2. 对模型的参数进行估计 估计方法有矩估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论