版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
经济预测与决策
2参考书目
1.美]Gcorge
E,P.Box[英]GwilymM.Jenkins[美]GregoryC.Rcinsel:时间序列分析预测与控制,中国统计出版社,1997年9月2.PhilipHansFranscs:商业和经济预测中的时间序列模型,中国人民大学出版社,2002年12月3.魏武维:时间序列分析——单变量和多变量方法(第二版),中国人民大学出版社,2009年4月4.易丹辉:时间序列分析:方法与应用,中国人民大学出版社,2018年3月5.易丹辉:统计预测:方法与应用,中国人民大学出版社,2014年8月6.易丹辉:数据分析与Eviews应用,中国人民大学出版社,2014年7月
3第一章概述一、何谓经济预测二、经济预测的分类按预测范围分宏观中观微观按预测时间分长期中期短期近期按预测对象分需求供给产品按预测方法分定性定量
4
方法
特点
预测期限定性预测法
经验判断法
德尔菲法
类推法
无足够数据
新事物
事物转折根据个人或集体的经验作出判断反复集中专家意见
定量评估结果运用已有现象的变化规律
类比
短期依研究问题而定短期回归预测法
一元线性
多元线性
非线性
预测对象变化的影响因素因果关系只有一个主要影响因素
线性关系多个影响因素
线性关系一个或多个影响因素
非线性关系
短期除非结构关系相对稳定的时期较长时间序列预测法
移动平均法
指数平滑法
趋势外推法
季节预测法B-J法
马尔科夫法利用事物本身随时间变化的规律
以均值作为下一期预测值
以平滑值作为预测值
建立适宜的趋势模型外推预测反映趋势和季节变化模型
随机时间序列变化规律不同状态之间变化规律预测
短期
滞后短期中期长期趋势短期、中期短期
5三、经济预测的基本思路和过程1.明确预测目的
预测目的,包括预测解决的问题、预测的对象、预测的范围、预测期。根据预测目的,才能收集相应的数据;才能选择合适的预测方法。62.收集相应的资料
预测资料来源通常也是分为两类:
一手资料,即自己调查或者本单位登记的资料
二手资料,即已经公开发布的各种资料
无论是宏观还是微观数据,只要对预测有用,均应充分采集并利用。7
对于收集的数据,预测建模前,需要进行初步的描述性分析,观察数据的分布特征,发现数据是否有规律或是否有异常。1)数据的描述性分析
根据数据的类型采用不同的描述性分析方法。属性数据一般是进行频数分析。计算各类的频数以及百分比,可以直观地看出各个类型的分布状况。8受访者分类样本量百分比(%)性别男22047.9女23952.1合计
459100年级大一7115.5大二9019.6大三27058.8大四(及部分专业大五)286.1合计
459100专业文学、哲学、历史学7416.1理学、工学、农学19041.4管理学、经济学15433.6其他418.9合计
459100政治身份党员(含预备党员)9420.5非党员36579.5合计
459100属性数据分析
数值型资料,并且是截面数据,通常计算:均值、标准差、最小值、最大值、中位数、上、下四分位数,可以直观地看出数据的分布形式和特征。变量均值标准差最小值下四分位数
中位数上四分位数
最大值年龄(岁)393.5832363942
45102)数据的预处理
获得的数据是否有异常,或者是否能够直接建立模型,需要通过对数据的初步分析和观察进行判断,即数据需要先进行预处理,才能考虑直接利用。
时间的数据,可以通过绘制时序图,观察现象随时间变化的规律,发现不同时期变动规律是否一致,是否出现异常,以决定数据是否需要进行预处理再建模。11社会消费品零售总额时序图公路客运量时序图某地区固定电话通话次数时序图我国农村居民收入与储蓄散点图153.预测方法选择
预测对象没有足够的历史数据或者已经明显地看出不在原有规律上变化,无法构建模型预测,需要运用定性预测方法。
预测对象有足够的历史数据,影响其变化的因素也能收集到相应的历史数据,可以选择回归模型预测;若不便于寻找影响因素或影响因素没有足够相应数据,选择时间序列模型预测。
根据实际数据和可能变化的情况,进行不同情境下、不同方法的预测,供决策参考使用4.实施预测
当有几个模型均可被接受使用时,可以根据一些准则选取适宜的模型。最小信息准则对可以利用似然函数估计参数的所有模型都适用。1)AIC是赤池信息准则(Akaikeinfocriterion)的简称。其中,L是对数似然函数,n是观测值数目,k是待估计参数个数。AIC取值越小越好。2)SC是施瓦茨准则(Schwarzcriterion)的简称。其中,L、n、k的含义与AIC完全相同。SC取值越小越好。3)HQC是汉南-奎因准则(Hannan-Quinncriterion)的简称。式中各个字母含义同上。其取值也是越小越好。5.预测精度评价
任何预测对象的实际观察值都可以由某种模型加某种随机影响确定,即
观察值=模型+随机项预测对象的第i个实际观察值记作,由预测模型得到的相应的回归估计值为
,则误差为=-尽量使误差减少到最低限度,即尽可能提高预测精度,是研究预测方法,实际设计预测方案的一项重要任务。
1)标准统计度量
平均误差(MEANERROR)ME=
平均绝对误差(MEANABSOLUTEERROR)MAE=
误差平方和(SUMOFSQUAREDERROR)SSE=
均方误差(MEANSQUAREDERROR)
MSE=误差的标准差(STANDARDDEVIATIONOFERROR)SDE=2)
相对度量
百分误差(PERCENTAGEERROR)
=平均百分误差(MEANPERCENTAGEERROR)
×100MPE=/
∑平均绝对百分误差(MEANABSOLUTEPERCENTAGEERROR)MAPE=×100第二章
定性预测
一、
经验判断法预测
经验判断预测是凭借人们对客观事物长期观察的经验,通过对事物历史发展和目前状况的分析,推断其未来可能状态、趋势的预测。
预测准确程度,受到预测人员经验和分析能力高低的影响
1.个人判断预测
凭借预测人员的个人经验和对预测对象的充分了解,对其未来作出判断的预测。23
2.集体判断预测
二、德尔菲法预测1.德尔菲法的定义与特点
德尔菲法是一种定性研究方法,由组织者就拟定的问题设计调查表,通过函件分别向选定的专家组成员征询调查,经过几轮征询和反馈,获得具有统计意义的专家集体判断结果。通常在缺少足够的背景信息和历史数据,或者原始数据量太大,加工代价过高时使用。24
特点
匿名性
专家之间彼此未知的匿名方式书面进行意见征询,保证专家意见的相对独立性
反馈性
在不断的反馈与征询过程中,专家可以根据对问题了解的深入与自己的分析对原有意见进行修改或补充
结果的统计特性
采用统计方法对预测结果进行定量评价252.德尔菲法的实施1)专家选择——方法成败的关键
专家是指对预测领域或涉及的相关领域十分熟悉、很有造诣的人。根据研究主题确定专家咨询小组。所选专家的研究背景由研究内容的范围确定,一般不超过二十人。2)专家意见征询
制定专家应答问题调查表(重要工具),发放给专家。表的质量是在一定程度上决定着预测结果的准确性。
问题的类型
要求作出定量评价预测的问题。
要求作出一定说明的问题
要求作出充分说明的问题
需要向专家分别充分提供项目背景材料,提出请专家给出意见的预测或评价问题,以保证专家对所预测的问题能够作出明确的回答。3)专家意见结果处理
专家意见定量化
专家权重定量化
专家意见不一致性定量化27第三章
回归预测
回归预测是通过对观察数据的统计分析和处理,研究与确定事物间相关关系和联系形式进行预测的方法。运用回归分析法寻找预测对象与影响因素之间的因果关系,建立回归模型进行预测。
按方程中影响预测对象因素的多少,分为一元回归和多元回归;按变量之间关系是否线性,分为线性回归和非线性回归。28
一、一元线性回归预测(一)模型形式
将预测对象作为因变量Y,主要影响因素为自变量X,它们之间的线性关系,从理论上能够表述为式中:
和是固定但未知的参数,是常数项,
是回归系数,是那些除X以外,被忽略和(或)无法考虑到的因素,被称为随机项。
实际预测时,随机项是被忽略的无法预测,要得到Y的预测值,只能先估计、的值,
利用X的值和下面式子计算得到。
随机项的估计值就是模型的残差,即有
残差的大小在一定程度上反映模型预测的精度,其值越小精度越高。
模型的基本假设:1)变量X非随机,即变量X与随机项无关,X严格外生;2)变量X与Y之间存在真实的线性关系;3)随机干扰项服从期望是0,方差为
的正态分布并相互独立,即满足正态性、独立性和同方差性。31
(二)
参数估计1.最小二乘的基本思想
==+
(总平方和)(剩余平方和)(回归平方和)322.参数的计算
剩余(残差)平方和最小3.参数的意义
33(三)模型的检验和评价
1.回归系数的检验
合理性检验系数符号
系数大小
显著性检验
:=0
检验统计量=
t(n-2)式中,是参数估计时的标准差。~~34
2.回归残差的独立性检验
一般来说,残差独立,也就是不存在相关,即完全随机,则残差应该在0附近随机摆动。
残差随着GDP的变化有明显的变化规律,表明模型的残差有一定程度的相关,不满足独立性。35导致残差序列的自相关的原因
数学模型选择不合适模型中包含的自变量数目不合适序列包含很强的趋势分量滞后性3.残差的同方差性检验在经典的回归分析中,模型的残差要求是同方差。如果仅考虑两个变量在时间上的变化,残差异方差可能不明显,因而比较关注残差序列的自相关问题。若考虑截面和时序结合的数据,不仅需要关注残差序列的自相关,还要考虑异方差。
残差图4.拟合优度检验检验==
回归平方和在总平方和中的比重能够反映回归
模型对样本数据的拟合程度。
的大小表明在因变量总变异中,由回归模型可以解释的部分所占的比重。其取值在0到1之间,等于1,表明回归模型对所有的样本数据点完全拟合,即所有样本数据点均落在回归直线上,回归模型完全解释了因变量的变异;等于0,表明什么都没有解释。5.回归标准差检验相对指标
四、精度评价
MAPE
37
5.预测精度的测定
MAPE=ₓ100MAPE是模型精度评价中最常用的指标之一,不仅在回归模型使用,在时间序列模型等许多模型中都被运用。一般认为,若MAPE小于10,则模型预测精度较高;小于5,精度很高。例3.138
二、
多元线性回归预测(一)基本原理多元回归预测因自变量个数的多少,可分为二元、三元或更多元,通常以k表示自变量的个数。
多元线性回归模型在一元线性回归基本假定的基础上,增加了自变量之间无共线性。这是要求,所选择的自变量之间不能存在较高度的线性相关。共线性问题是多元线性回归中需要特别关注的问题。
多元线性回归模型的参数同样可以采用最小二乘法进行估计。39
(二)
模型检验1.回归系数的显著性检验
参数的t检验作用
检验统计量检验标准
参数t检验通不过的原因变量不是影响因变量的显著因素自变量间共线性40
2.回归方程的显著性检验
回归方程的F检验
根据方差分析的思想,可以得到总方差(MST)等于来自于回归的方差(MSR)和残差的方差(MSE),也就是MST=MSR+MSE
检验统计量F=
检验标准41
3.其它检验
和修正的()
参数的检验
残差的检验例3.2
三、含虚拟变量的回归预测
1.虚拟变量的含义当解释变量不是定量测量数据,或在不同的情况下,所产生的结果不同,就需要将解释变量区分开,可以采用设虚拟变量的方法。虚拟变量是取值仅取1或0的变量。一般,基础类型、肯定类型取值“1”,比较类型、否定类型取值“0”。
432.虚拟变量设置原则
若某一定性变量有m种情况(状态),设虚拟变量时,只能有m-1个。3.虚拟变量引入对模型的影响引入虚拟变量,对模型截距、斜率的影响对一般的线性回归模型
=++引入虚拟变量D44(1)加法形式
=+++=
==0:()E45(2)乘法形式
=E()
=
=
+
+
+:=046(3)加法、乘法同时采用
=++++
=
E()
=条件:误差项的方差在前后都是一样的
=0=0::47
4.
虚拟变量的应用
(1)
分离异常因素影响政策因素
制度因素
季节因素
季节变动:时间序列可以计算季节指数,多元回归中可以利用虚拟变量例:某地区每月天气湿度对温度的影响
制度变化:时间分期,分段回归48
(2)检验不同属性类型因素对因变量的影响解释变量为属性数据例:不同年龄、不同文化程度的行为
(3)提高模型预测精度不同属性类型样本数据合并,相当于扩大样本容量
例3.3
四、
非线性回归预测(一)模型形式
1.
一元函数曲线模型变量间关系已知
2.
多项式回归模型变量间关系未知
3.
多元函数曲线模型(二)
参数估计与检验
最小二乘法
1.
直接代换
2.
对数变换
检验
同一元和多元线性回归
例3.451第四章传统时间序列预测
时间序列是以时间顺序记录下来的一系列数据。因为时间单位不同,在一年中记录的数据频次不同。通常以年、季、月记录的数据,在一年的时间里出现的次数不多,称为低频数据;以周、日等记录的数据为高频数据;日内记录的数据,如分钟或小时,为超高频数据。52
传统时间序列模型的基本形式
长期趋势(SecularTrend),事物在一段时间内表现的一种变动倾向;季节变动(SeasonalVariation),事物被季节性规律作用产生的周期性变化。季节性规律可能是自然的,也可能是人为的。周期通常为一年(4个季或12个月);循环变动(CyclicalVariation),事物周期长短不固定的一种变化,周期通常为数年;不规则(IrregularVariation),无规律可循的一种变化,也被称为随机变动或残差变动。数据=f(趋势,季节,循环)+误差53
一、趋势外推预测
趋势模型一般形式
其中,t是时间顺序号,取自然数,如时间从1952年开始,则t以1952年为1,1953年为2,按顺序依次赋值。
时间序列呈现某种上升或下降的趋势,且无明显的季节波动时,可以用时间t综合替代所有影响因素,即以时间t为自变量,时序数值Y为因变量,建立趋势模型。Y=f(t)54
(一)模型形式
直线趋势
非线性趋势
有增长上限的曲线趋势模型
修正指数曲线模型
龚珀兹曲线模型
皮尔曲线模型56(二)模型识别
——
图形识别法
从实际数据出发,选择模型的方法。将时间序列的数据绘制成以时间t为横轴,时序观察值为纵轴的曲线图,观察其变化并与各类函数曲线模型的图形进行比较,选择较为适宜的模型。一般初选几个模型,通过模型分析后再确认合适的模型。57
(三)参数计算
——最小二乘法
直线模型本身就是反映序列与时间t的线性关系,将自变量X换为时间t即可估计。对于曲线形式的模型,类似前一章,可以通过变换使其线性化,也可以运用最小二乘估计。
58
(四)模型分析与评价
1.模型检验
采用最小二乘法估计参数,必须按照回归分析中的要求,对模型进行检验,包括参数的显著性检验、回归方程显著性检验、残差独立性检验、拟合优度检验。
2.对历史数据拟合的分析直观判断法
图、表误差分析法MAPE3.对未来趋势反映的分析
对序列近期趋势的反映
试预测
例4.1
59
(四)模型分析与评价
1.模型检验
采用最小二乘法估计参数,必须按照回归分析中的要求,对模型进行检验,包括参数的显著性检验、回归方程显著性检验、残差独立性检验、拟合优度检验。
2.对历史数据拟合的分析直观判断法
图、表误差分析法MAPE3.对未来趋势反映的分析近期趋势的反映
直观判断
误差分析试预测预测结果的可能性分析60
二、平滑预测(一)移动平均预测
1.简单平均法选择前期作为试验数据,计算平均值用以测定+1期数值,即
式中,为前期的平均值,为+1期的估计值,也就是预测值。
特点
不足=/=61
2.简单移动平均法
移动平均法是对简单平均法加以改进的预测方法。它保持平均的期数不变,总是为期,而使所求的平均值随时间变化不断移动。
这是一个递推形式,是平均的期数亦即移动步长。
的作用:平滑数据====62
从上面的式子可以看出下面的关系
也可以改写成
式中就是T+1时刻的实际值与预测值之差即误差。所以,简单移动平均预测实际上是通过当期预测误差修正当期预测值得到下一期的预测值。
特点不足例4.2===++
63
3.加权移动平均法
简单移动平均法将被平均的各期数值对预测值的作用同等看待。实际上,近期的数值往往影响较大,远离预测期的数值作用会小些。加权移动平均法正是基于这一思想,对不同时期给以不同的权数来进行预测。
式中,权重;权重确定===1
64
(二)指数平滑法
1.一次指数平滑法
一次指数平滑也称作单指数平滑,简记为SES(SingleExponentialSmoothing)。
预测模型平滑常数的作用和选择
取值接近于1时,各期历史数据的作用迅速衰减,近期数据作用最大。65
=0.1=0.3=0.5=0.90.1
0.09
0.081
0.0729
(0.1)·(0.9)4┇0.3
0.21
0.147
0.1029
(0.3)·(0.7)4┇0.5
0.25
0.125
0.0625
(0.5)·(0.5)4┇0.9
0.09
0.009
0.0009
(0.9)·(0.1)4┇不同值的作用
66
无论平滑常数
(0<<1)取值为多大,其随时间的变化呈现为一条衰减的指数函数曲线,即随着时间向过去推移各期实际值对预测值的影响按指数规律递减。
初始值的选取
一次指数平滑预测模型是一个递推形式,因此需要有一个开始给定的值。这个值就是指数平滑的初始值。一般可以选取第一期的实际观测值或前几期观测值的平均值作为初始值。特点适用于较为平稳的序列
不足滞后例4.367
2.二次指数平滑法二次指数平滑也称作双重指数平滑(doubleexponentialsmoothing),它是对一次指数平滑值再进行一次平滑。二次指数平滑是用平滑值对时序的线性趋势进行修正,建立线性平滑模型进行预测。二次指数平滑也被称为线性指数平滑。
68
1.布朗(Brown)单一参数线性指数平滑
2.霍特(Holt)双参数指数平滑
例4.469
三、季节模型
季节变动,是指客观事物由于自然条件、生产条件和生活习惯等因素的影响,随着季节的转变而呈现的周期性变动,这种周期通常为1年,或说12个月、4个季度。
时间序列的季节变动往往并不单独存在,而是伴随趋势变动存在。对于含有季节变动的时间序列,可以建立季节模型加以预测。70
(一)季节趋势乘法模型1.模型形式
=(a+bt)*(i=1,2,……,T)
式中,
=(a+bt)为趋势部分,可以是线性也可以是非线性;
为季节指数;
T为季节周期的长度712.适用条件:适用于既有季节变动,又有趋势变动且波动幅度不断变化的时间序列
3.建模:建立趋势方程求各期趋势值求样本季节指数求理论季节指数
例4.572
(二)季节趋势加法模型1.模型形式
=(a+bt)+
(i=1,2,……,T)
式中,=(a+bt)为趋势部分,可以是线性,也可以非线性; 为季节增量;
T为季节周期的长度。
732.适用条件适用于既有季节变动,又有趋势变动且波动幅度基本不变化的时间序列
3.建模建立趋势方程求各期趋势值求样本季节增量求理论季节增量例4.6
74第五章随机时间序列预测
一、概述(一)模型的引进多元线性回归自回归移动平均模型简单平均:序列平稳围绕均值波动
==
==75移动平均:近期数据对预测的影响更重要
加进新数据,则删除远离现在的数据
==
==T的作用:平滑数据T的取值:自然数
数值大小对结果的影响
76=+()
=+
以均值替代有
特点:利用误差修正,调整前期预测值
跟踪数据变化时间序列可以用过去的误差项表出
=++……++
77(二)自相关函数
1.
自相关含义时间序列诸项之间的简单相关
2.自相关系数计算公式式中:n为样本数据个数;k为滞后期;
为样本数据平均值。78自相关系数与简单相关系数一样,取值范围为[-1,+1]。其绝对值越接近于1,表明自相关程度越高。
最大滞后阶数k取、、,n为观测数据的个数。
3.自相关分析图79时序编号(t)原序列
滞后一阶序列
滞后二阶序列
YtYt-1Yt-212345678910平均值()13--813-1581341584415124411124711121471112147
1080r1=-0.188,r2=-0.201,说明序列每相邻两项之间,每隔一项之间有极弱的负相关,甚至可以忽略,认为他们几乎无关。81
(三)偏自相关
含义:时间序列,在给定了,,……,的条件下,与之间的条件相关。
偏自相关系数:
82计算公式其中,
取值同自相关系数,在正负1之间
83如已知某时间序列滞后四期的自相关系数分别为r1=0.8674,r2=0.7728,r3=0.7157,r4=0.6478,计算偏自相关系数。84结果表明,序列Yt和Yt-1有较强的关系,滞后期加大,相关程度迅速减弱。85
二、时序特性的分析
1.随机性的测定
若一个时间序列由完全随机的数字构成,那么这个序列的各项之间不会有任何相关关系,序列为纯随机序列,即完全随机的序列。纯随机序列中不会存在任何模型。
测定时序的随机性,可以根据经验方法也可以运用统计检验。
经验方法是依据时序的自相关系数。时序的自相关系数基本落入随机区间,该时间序列为纯随机序列;有较多自相关系数落入随机区间外,时间序列就是非纯随机序列。862.时序的平稳性(1)平稳的含义和判定
描述性定义:如果一个时间序列的统计特征不随时间推移而变化,即满足下面两个条件:
对于任意的时间t,其均值恒为一常数;
对于任意的时间t和s,其自相关系数只与时间间隔t-s有关,而与t和s的起始点无关,则被称为平稳时间序列。
自相关的特点:自相关系数在K等于2或3后迅速趋于零。87平稳时间序列曲线图非平稳时间序列曲线图89时序趋势的消除
非平稳性能够被消除的时间序列称为齐次非平稳时间序列。
一阶差分(逐期、短差)二阶差分
▽Yt=Yt-Yt-1(t>1)▽(▽Yt)=▽2Yt=▽(Yt-Yt-1)=▽Yt-▽Yt-1=Yt-2Yt-1-Yt-2(t>2)903.时序的季节性识别
含义:季节性是指时间序列在某一固定时间间隔上,重复出现前面的某种特性。这种规律通常由于季节变化所引起,称具有这种特性的时间序列为季节性序列。时间序列的季节周期常用的时间单位是月、季。
识别:自相关系数与0的显著性差异
查看时滞k=12,24,36,···时的自相关系数;
k=4,8,12,···时的自相关系数。
91汗衫背心零售量时序图92季节性消除:时序的季节性也可以通过差分的方法加以消除。注意差分步长
一阶季节差分(月度)二阶季节差分
93我国社会消费品零售总额序列曲线图94一阶差分后序列曲线图一阶季节差分后序列曲线图96
三、ARMA模型及其改进
1.自回归模型
AR(p)模型的一般形式模型参数约束条件=0的所有根都在单位园外。
==097AR(p)序列的自相关和偏自相关
:拖尾性:98:截尾性
99
2.移动平均模型
MA(q)
模型的一般形式
=100
MA(q)序列的自相关和偏自相关
截尾性:
101
:拖尾性1023.自回归移动平均混合模型
ARMA(p,q)
模型的一般形式
103
ARMA(p,q)序列的自相关和偏自相关
1044.ARMA模型的改进
ARIMA(p,d,q)模型模型形式或ARIMA(1,1,1)也可以写成
105
模型
模型形式其中,是季节自回归算子,P是季节自回归阶数;是季节移动平均算子,Q是季节移动平均阶数;D是季节差分阶数;s是季节周期长度。ARIMA(1,1,1)也可以写成
106
模型模型形式或ARIMA(1,1,1)也可以写成
107
四、随机时序模型的建立
1.模型的识别选择各个阶数
d,Dp,qP,Q
定阶的最小信息准则1082.参数估计
3.模型检验残差序列的自相关检验直观判断残差序列的自相关系数是否落入随机区间
检验
原假设:残差序列相互独立
检验统计量
服从(
m–p–q)分布。其中,m是最大时滞数,n为计算(e)的数据个数。
109
LM检验
检验是将有限制和无限制模型进行比较作出判断。有限制条件的模型记作R,可以写成AR(p)的形式无限制条件模型记作UR,可以写成AR(p+r)的形式或ARMA(p,r)原假设:残差序列不存在自相关,即AR(p)模型合理检验统计量LM其服从自由度为r的
分布,r是UR模型与R模型待估计参数个数之差。是UR模型的拟合优度。
例5.1我国消费品指数序列分析
110
五、时序模型预测
1.最小方差预测:使时间序列未来值的预测误差尽可能小预测误差(L)=-(L)
的方差
E((L)=E(-(L)
应达到最小。111也就是要使选择的时间序列L步预测值(L)与时间序列实际值之间距离比其它任何一点都短。
2.预测的递推形式
续例5.1
112第六章马尔科夫法
一、基本概念(一)马尔科夫链如果把随机变量序列
的参数
看作时间,其“将来”只是通过“现在”与“过去”发生联系,一旦“现在”已知,“将来”和“过去”无关。随机过程的这一特性被称为马尔可夫性,或称无后效性。马尔可夫链(简称马氏链)是时间参数
只取离散值的马尔可夫过程,也是最简单的一种马氏过程。
{}113
(二)状态及状态转移
状态是指客观事物可能出现或存在的状况。
不同的事物,不同的预测目的,有不同的状态划分。预测对象状态的划分两大类:
客观存在的状态
人为划分的状态
状态转移是指客观事物由一种状态到另一种状态的变化。
随机过程的状态和状态转移的统计特性用概率描述。
114(三)状态转移概率矩阵
1.条件概率
当A、B为两个事件时,它表示A事件出现时,B事件出现的概率。这是一个条件概率。
2.状态转移概率
客观事物可能有
,
,…,共n种状态,其每次只能处于一种状态,则每一状态都具有n个转向(包括转向自身),将这种转移的可能性用概率描述,就是状态转移概率。一步转移概率
表示由状态经过一步转移到状态的概率,记作。1153.状态转移概率矩阵将事物n个状态的转移概率依次排列,可以得到一个n行n列的矩阵=称P为状态转移概率矩阵,k步转移概率矩阵为116示例某市销售普通、一级、特级三种酱油====普通一级特级=117二、马尔科夫预测法(一)一重链状相关预测若时间序列
在t=k+1时取值的统计规律只与
在t=k时的取值有关,而与t=k以前的取值无关,称此时序为一重链状相关时间序列,或称为一重马尔可夫链。对于一重马氏链,一步转移概率矩阵全面地描述了状态之间相互转移的概率分布,可以根据它对时序未来所处的状态作出预测。预测步骤1.预测对象状态划分预测对象本身已有状态界限,可以直接利用。若不存在明显的界限,需要根据实际情况人为地划分。
2.计算初始概率初始概率是指状态出现的概率,近似地说就是状态出现的概率。=满足=1≈≈1193.计算状态的一步转移概率假定由状态
转向状态的个数为
,则一步转移概率为==(i=1,2,…,nj=1,2,…,n)一步转移概率矩阵P=
4.预测
将n个状态转移概率按大小排列成不等式,可能性最大者就是预测的结果,即可以得知预测对象经过一步转移最大可能达到的状态。
例6.1
例6.2分析预测我国以商务目的入境人次
121
(二)模型预测
实际预测中,往往需要知道经过一段时间后,预测对象可能处于的状态,这就要求建立一个能反映变化规律的数学模型。马尔可夫模型预测是利用概率建立一种随机随时序模型预测的方法,通常称为马尔可夫法。
1.预测模型式中:是预测对象=时刻的状态向量;为一步转移概率矩阵;是预测对象在=+1时的状态向量,也就是预测的结果。=
其中,=
2.适用条件
适用于具有马尔可夫性的时间序列,并且时间序列在要预测的时期内,各时刻的状态转移概率保持稳定,即每一时刻向下一时刻变化的转移概率都是一样的,均为一步转移概率。若时序的状态转移概率随不同时刻在变化,不宜用此方法。由于实际的客观事物很难长期保持同一状态转移概率,故此方法一般适用于短期预测。
3.应用例6.3企业产品用户占有率的分析预测124三、马氏链的稳定状态及其应用
经过较长一段时间以后,马氏链将逐渐趋于这样一种状态,它与初始状态无关,即有=这种状态称为稳定状态。(一)马氏链的稳态概率
马氏链达到稳定状态时的状态概率就是稳定状态概率,也称为稳态概率。它表示在稳定状态下,预测对象处于各个状态的概率。1251.马氏过程存在稳定状态的条件若马氏链的一步状态转移概率矩阵为标准概率矩阵,那么马氏链必定有稳定状态。2.稳态概率的求解(二)终极占有率预测
终极占有率是在市场竞争中达到均衡状态的用户占有率,通过求解稳态概率可以预测终极占有率。
例6.4126第七章其它预测方法
一、PanelData模型预测(一)模型的基本问题
为了能够充分揭示不同截面单位随时间的变化,可以将截面数据和时序数据结合,运用PanelData模型进行分析。Panel数据是截面数据与时序数据的结合,即不同个体在不同时间上观测的数据,或者说,随时间变化观测同一总体中不同个体的数据。
127数据的特点回归模型截面数据:研究不同个体之间的关系和规律时序模型时间数据:研究同一个体不同时间变化规律
实际数据不满足回归的要求实际数据时间过短
(二)模型的基本类型
1.基本形式
其中,…
),为外生变量向量,
…
),为参数向量,K是外生变量个数,T是时期总数.随机扰动项uit相互独立,且满足零均值、等方差.
模型类型
固定效应模型
随机效应模型模型中Ci是随机的,称为随机效应。它反映除了能够用共同的变量X能够解释的Y的变化外,不同个体之间还有的差异。如果这些差异不提取出来,随机干扰项将不是独立同分布的。这些差异虽然无法直接观测但客观存在,只能用随机效应表示,相当于在模型中引入一个不可直接观测的潜变量。
130(三)固定效应模型截面单位是总体的所有单位,则固定效应模型是一个合理的模型。通常,仅就样本进行分析,不涉及以样本推断总体时,可以使用固定效应模型。
1311.基本形式
i=1,…,Nt=1,…,T
表示所有截面单位在所有时间上的均值,即总平均值;
表示不同截面单位截距与总平均的差异,称为截面效应;
是不同时间截距与总平均的差异,称为时间效应;2.类型截距和斜率是否变化
132A.斜率相同且截距相同
B.斜率相同但截距不同
133C.截距相同但斜率不同
D.斜率和截距都不同
134
3.模型形式的检验
上述模型哪个适用,可以通过建立在最小二乘估计基础上的残差,构造F检验统计量加以判断。模型形式检验的基础是各模型的残差平方和,先从最简单的模型A开始,依次检验,一直检验到不能拒绝该类模型为止。135
4.参数估计最小二乘法
-最小二乘虚拟变量估计(LSDV)
广义最小二乘法(GLS)
两阶段最小二乘法(TSLS)
广义矩估计(GMM)136
5.模型检验参数检验合理性显著性残差检验独立性同方差性
固定效应的LR检验
固定效应的LR检验是对选用的固定效应模型是否适合进行的检验。137固定效应是否多余的检验:国定效应是多余的:固定效应不是多余的统计量是通过两个模型系数估计结果的差异构建其中,R是带限制条件,
UR是不带限制条件
m是自由度即限制的参数的个数
例7.1138二、神经网络预测神经网络预测的基本原理
神经网络(neuralnetwork)是以计算机网络系统模拟生物神经网络的智能计算系统。网络上的每个结点相当于一个神经元,可以记忆(存储)、处理一定的信息,并与其他结点并行工作。
求解一个问题是向人工神网络的某些结点输入信息,各结点处理后向其他结点输出,其他结点接受并处理后再输出,直到整个神经网工作完毕,输出最后结果。139140
2.神经网络的预测方式
神经网络模拟人类的大脑结构和思维方式,对数据变量之间的关系进行可靠的近似。每一层包含若干个神经元,通过层与层之间的神经元连接,构成一个完整的多层前馈网络结构。
常用的BP神经网络结构分为三层:输入层、中间层(或隐藏层)、输出层,每一层包含若干个神经元,通过层与层之间的神经元连接,构成一个完整的多层前馈网络结构。141假设一个神经元接收𝐷
个输入
,一个典型的神经元结构如图其中,D是输入变量的个数,从外界接受到的输入被量化为
,相应的权重系数为1表示有截距项,b为权重;一个神经元的净输入为所获得的输入信息的加权和。
142若记z为一个神经元的净输入,则上图中有净输入z经过激活函数f的作用得到神经元的活性值(Activation)a,形成最终的输出。143一个有一个隐藏层的神经网络如图其中,一个神经元的输出是另一个神经元的输入,+1项表示的是偏置项,即常数项。L1层称为输入层,L2层称为隐藏层,L3层称为输出层。144
输入层神经元的数目与解释变量数目相同;输出层神经元数目与被解释变量数目相同;中间层可以包含任意多层数以及每一层可以包含任意数目的神经元,实际应用中需要根据数据分析结果,对其进行反复调节,最终选择合适的中间层数目以及每层单元个数。145
训练神经网络实际上是在寻找一个最优的权重集合,使得目标误差函数取值最小。3.预测应用示例例7.2税收神经网络预测146第八章决策
一、决策的基本概念(一)决策的含义
决策是指在若干个可供选择的方案中,按照特定的目标,选择一个最优或最令人满意的方案的过程,其狭义的理解是指统计决策。统计决策是将未来情况的发生看做随机事件,依据经典统计推断提供的理论和方法进行决策。{}147
一个完整的决策问题,应由三个要素构成:
决策目标
目标是决策的出发点和归宿。作为决策问题的目标,应是能通过一定方式化为可测的,能直接或间接数量化的指标。在决策中,有的问题只是有一个目标,有的则需要同时满足多个目标。
自然状态
自然状态简称状态,其特点有二:一是不以决策者的主观意志为转移,在决策过程中客观存在,二是对同一决策问题几种自然状态不能并存,只能出现其中一种。决策中,不涉及改变自然状态问题,只涉及如何对它们进行数学表述或预测它们出现的概率。148
备选方案
如果在解决某个问题中,只有一个办法或一个方案,就不需要进行决策,只需要照办即可,所以凡能构成决策问题,总是存在两个或两个以上可供选择的行动方案,即备选方案。149
(二)决策的类型
按决策目标分:单目标决策
多目标决策
按自然状态种类分:确定型
不确定型
风险型
在种种自然状态出现的概率不确定情况下,决策者总能凭借以往的经验或主观动机,对未来情况的发生指定某一概率以帮助进行决策。从这一意义上说,不确定型决策也可视为风险型决策。统计决策的核心是风险型决策。150
二、决策的准则
决策准则依决策者的品格素质、偏好以及决策问题的条件的不同而不同。(一)不确定型决策准则
自然状态出现的概率未知情况下,有几种决策的准则。这些准则的应用,取决于决策者的经验和性格。1511.乐观准则决策者在决策时对客观情况抱有一种乐观态度的准则。先选出在各种自然状态下每个方案的最大收益值,再从这些最大收益值中选出最大者,与最大值相对应的方案就是决策方案。
例8.12.悲观准则决策者在决策时,对客观情况抱有一种悲观态度的准则。先选出在各种自然状态下每个方案的最小收益值,再从这些最小收益值中选出最大者,与这个最大值相对应的方案就是决策方案。
例8.23.乐观系数准则决策者在决策时,对乐观情况既不持极端保守态度,也不具有极端冒险的乐观态度,而采取某种介于其二者间温和态度的准则。决策者对客观情况持一定的乐观态度,它用乐观系数a表示,a的取值区间为【0,1】,代表决策者认为最大收益将会发生的概率。先利用乐观系数a为权数,计算每一方案最大收益值和最小收益值的加权平均值:其中,Ai:第i个方案Vij:第i个方案在第j种自然状态下的收益值E(Ai):各个方案的折衷期望收益值
从诸E(Ai)值中选择数值最大值,与其相对应的方案就是决策方案。
例8.34.等可能性准则这一准则也称为拉普拉斯准则。决策者在对未来事件发生的概率缺乏了解的情况下,没有理由认为哪一种自然状态出现的可能性大些或小些,则可假定各种自然状态出现的可能性相同,即赋予每种自然状态的出现相等的概率,或有n种自然状态,那么每种自然状态的概率都是1/n。以这相同的概率分别计算各个方案的预期收益值,再从中选取最大者,与其相对应的方案就是决策方案。
例8.45.后悔值准则
后悔值是决策者决策失误所造成的损失价值。它是在某种自然状态下,各方面中最大收益值和其他方案收益值之差,或方案中最小损失值与各方案损失值之差。
决策者将每种自然状态下的最高收益值定为该状态的理想目标值,该状态下的其它收益值与其的差值是未达到理想目标的后悔值。先找到各方案的最大后悔值,再从这些最大后悔值中挑选最小后悔值,与这个最小后悔值相对应的方案就是决策方案。
例8.5
当给出的决策问题中,未来各自然状态发生的概率无法估计时,只好采用上述准则。但如何选用一个合适的决策准则,却没有一个固定的标准。它常与决策时的客观情况、政策及有关因素、决策者的经验与性格、决策问题的特性及决策后将会对各方面产生的影响有关。
例8.1至例8.5的决策结果
决策准则
决策方案
乐观准则A2
悲观准则A1
乐观系数准则A3(a=0.6)
等可能性准则A1
后悔值准则A2156(二)风险型决策准则
风险型决策通常采用期望值准则,此外还应用最大可能性准则和效用准则。1.期望值准则利用各种自然状态出现的概率,分别求出每个方案的期望损益值(损失或收益値),再从这些值中选出最佳者,与其对应的行动方案就是决策方案。若决策目标是收入或效益,则选择收益期望值最高的方案;若决策目标是机会损失,投资或成本,则选择亏损或投资期望最低的方案。157
各个方案期望值计算式中:m:i方案可能产生的结果数目;
Pij:i方案产生j结果的概率
Vij:i方案产生j结果所带来的损益值。
例8.6158
状态
低价(
)
现价(
)
高价(
)
禁运(
)
概率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数字经济发展背景下中部地区物流行业智能化发展现状及对策研究
- 工业胶带课程设计
- 机器人matlab仿真课程设计
- 单位企业劳务派遣劳动合同(范本)
- 九年级化学:空气教案
- 肉类副产品在食品工业中的循环利用技术考核试卷
- 保健品市场发展趋势预测与应对策略考核试卷
- 畜牧业环境友好型生产考核试卷
- 铜冶炼厂的生产调度与物流优化策略考核试卷
- 长途客运安全管理与应急预案考核试卷
- (新课标)高考物理 5.4 功能关系 能量守恒定律达标训练
- 数字媒体艺术史全册完整教学课件
- 完整2024年国有企业管理人员处分条例专题课件
- 2024-2025学年七年级生物上册 第一单元 单元测试卷(冀少版)
- 基于人工智能的农产品产销对接平台构建
- 2024年四川能投兴文电力限公司招聘(高频重点提升专题训练)共500题附带答案详解
- 苏科版(2024)七年级上册数学第3章 代数式3.1字母表示数 教案
- 《物联网工程导论》课件 项目1 探寻物联网世界(6学时)
- 完整版2024年“安全生产月”全文课件
- 2023-2024学年高考数学空间向量与立体几何专项练习题(含答案)
- 人力资源服务产业园运营方案
评论
0/150
提交评论