版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计预测与决策教案
时间:2005年9月
管理预测与决策方法授课计划
•定性预测方法
・定量预测方法
♦确定性方法
A回归分析预测方法
A时间序列平滑预测方法
A趋势外推预测方法
A马尔可夫预测与决策法
♦不确定性方法
A灰色系统预测
A随机性决策分析
A模糊决策
A粗糙集理论
第一章预测概述
1.1引言
1.预测de兴起
预测于20世纪60-70年代在美国逐步兴起de
预测:预测是指对事物de演化预先做出de科学推测。广义de预测,既包括在同一时期根据已
知事物推测未知事物de静态预测,也包括根据某一事物de历史和现状推测其未来de动态预测。
狭义de预测,仅指动态预测,也就是指对事物de未来演化预先做出de科学推测。预测理论作
为通用de方法论,既可以应用于研究自然现象,又可以应用于研究社会现象,如社会预测、人
口预测、经济预测、政治预测、科技预测、军事预测、气象预测等。
2.预测de作用
正确de预测是进行科学决策de依据。政府部门或企事业单位制定发展战略、编制计划以
及日常管理决策,都需要以科学de预测工作为基础。
如“诸葛亮借东风、空城计"、以美国为首de多国部队实施de“沙漠风暴”,研究人员建立了
热能转换模型,进行了一系列模拟计算。因此,人们说第一次世界大战是化学战(火药),第二
次世界大战是物理战(原子武器),而海湾战争是数学战,指de是这场战争在战前就已对战争
de进程以及战争所涉及和影响de方方面面做出了科学预测。
制订经济计划de依据之一
提高经济效益de手段之一
提高管理水平de途径之一
1.2预测de基本原则
1.坚持正确de指导思想
2.坚持系统性原则
预测者所研究de事物和自然界de其他事物一样,都有自己de过去、现在和将来,就是存
在着一种纵de发展关系,因果关系,而这种因果关系要受某种规律de支配。将事物作为一个
互相作用和反作用de动态整体来研究,而且要将事物本身与周围de环境组合成一个系统综合
体来研究。
例如:1943年全世界估计有三亿疟疾病患者,每年有30()万人死亡,45()()万人死于瘟疫,1945
年后使用了DDT,十年内疟疾病de死亡率降低了二分之一,瘟疫病患者每年仅死亡几千人。
然而DDT除了杀死害虫外,还杀死了大量其他有益de鸟类、鱼类等动物及植物,而且外界环
境不能使DDT毒性衰减,据估计现在存留在大气层,大地以及海洋中deDDT约有十亿磅以上。
3.坚持关联性原则
4.坚持动态性原则
13预测de分类
1.按预测de范围或层次分类
(1)宏观预测
是指针对国家或部门、地区de活动进行de各种预测。它以整个社会经济发展de总图景作
为考察对象,研究经济发展中各项指标之间de联系和发展变化。如:社会商品总供给、总需求
de规模、结构、发展速度和平衡关系de预测;社会物价总水平de变动;宏观经济预测是政府
制定方针政策、编制和检查计划,调整经济结构de重要依据。
(2)微观预测
是针对基层单位de各项活动进行de各种预测。它以企业或农户生产经营发展de前景作为
考察对象,研究微观经济中各项指标间de联系和发展变化。具体商品de生产量、需求量和市
场占有率de预测等。微观经济预测,是企业制定生产经营决策,编制和检查计划de依据。
宏观预测应以微观预测为参考;微观预测应以宏观预测为指导,二者相辅相成。
2.按预测de时间长短来分类
(1)长期预测
一般是指对5年以上发展前景de预测.
(2)中期预测
一般指1年以上5年以下发展前景de预测.
(3)短期预测
一般指对3个月以上1年以下发展前景de预测
(4)近期预测
一般指对3个月以下企业生产经营状况de预测。
3.按预测方法de性质分类
(1)定性预测
指预测者通过调查研究,了解实际情况,凭自己de实践经验和理论、业务水平,对事物发
展前景de性质、方向和程度做出判断进行预测de方法。
(2)定量预测
是指根据准确、及时、系统、全面de调查资料和信息,运用软计算方法和数学模型,对事
物未来发展de规模、水平、速度和比例关系de测定。常用de定量预测方法有回归分析预测、
时间序列预测、因果分析预测、灰色系统预测、粗糙集方法、模糊集方法及神经网络等。
4.按预测时是否考虑时间因素来分类
(1)静态预测
指不包含时间变动因素,对事物在同一时期de因果关系进行预测
(2)动态预测
指包含时间变动因素,根据事物发展de历史和现状,对其未来发展前景做出de预测。
1.4预测de程序
1.明确预测任务,制定预测计划
预测计划是根据预测任务制定de预测方案,包括预测de内容、项目,预测所需de资料,
准备选用de预测方法,预测de进行和完成时间,编制预测de预算,调配力量,组织实施等。
2.搜集、审核和整理资料
筛选资料de标准有三个(1)直接有关性;(2)可靠性;(3)最新性。
3.选择预测方法和建立数学模型
数学模型也称为预测模型,是指反映经济现象过去和未来之间,原因和结果之间相互联系
和发展变化规律性de数学方程式.
4.检验模型,进行预测
模型建立之后必须经过检验才能用于预测。一般de,评价模型优劣de基本原则有以下几条:
(1)理论上合理
(2)统计可靠性高
(3)预测能力强
(4)简单适用
5.分析预测误差,评价预测结果
即分析预测值偏离实际值de程度及其产生de原因.
6.向决策者提交预测报告
1.5预测de精度和价值
1.预测精度评价指标
(1)预测误差
设某一项预测指标de实际值为X,预测值为X
令e=X-X
(2)相对误差
预测误差在实际值中所占比例de百分数称为相对误差,记为e,即
eX-X«八”
£=——=------------x1OCR/o
XX
通常才El称为预测精度
(3)平均误差
(4)平均绝对误差
(5)平均相对误差
1nY-Y
I引=±WJ£qxioo%=±WJ,'1x100%
〃/=iXjn,=|Xj
(6)均方误差
1nin
"2|」£"£&一£)2
",=In,=1
(7)均方根误差
s无卡]挣
(8)两面商
测定预测准确度de另一个指标是Janus商,计算公式如下:
Z(X,-又)2
mi=〃+l
利用预测模型对样本期外de数据进行预测,有事前预测与事后预测两种。对样本期外实际
情况已经发生de若干时期所进行de预测叫事后预测,对实际情况尚未发生de未来时期所进行
de预测叫事前预测,后者是预测de最终目de。
2.预测de价值
预测de价值可分为事实预测和非事实预测
一般说来,对于人们难以控制de事物或现象,预测de精度越高,其价值就越大,如气象预测、
地震预测等,这类预测称为事实预测。对于一些部分可控de事物,就不能按照预测de精度或
预测是否成为事实来衡量其价值。这类预测通常称为非事实性预测(指预测具有引导人们去执
行预测结果de功能。
非事实预测可分为按照对预测结果de影响效应,非事实性预测可以分为自实现预测
(self—fullfillingforcast)和自拆台预测(self-defeatingforcasting)两种。
第二章定性预测方法
・定性预测,是预测者根据自己de知识背景以及所掌握de实际情况和实践经验,对经济发
展前景de性质、方向和程度做出de判断。
・定性预测特点:需要de数据少,能考虑无法定量de因素,比较简便可行。
•在掌握de数据不多、不够准确或主要影响因素难以用数字描述,无法进行定量分析时,
定性预测就是一种行之有效de预测方法。
•由于定性预测主要靠预测者de经验和判断能力,易受主观因素加影响,主要目de不在
数量估计。为了提高定性预测de准确程度,应注意以下几个问题:
(1)应加强调查研究,努力掌握影响事物发展de有利条件、不利因素和各种活动de情况。
从而使对经济发展前景de分析判断更加接近实际。
(2)在进行调查研究,搜集资料时,应作到数据和情况并重,使定性分析定量化。也就
是通过质de分析进行量de估计,进行有数据有情况de分析判断,提高定性预测de说服力。
(3)应将定性预测和定量预测相结合,提高预测质量。在预测过程中,应先进行定性分
析,然后进行定量预测,最后再进行定性分析,对预测结果进行调整定案。这样才能深入地判
断事物发展过程de阶段性和重大转折点,提高预测de质量,为管理、决策提供依据。
2.1市场调查预测法
•常用de市场调查预测法有以下几种:
1.经济管理人员意见调查预测法
2.销售人员意见调查法
3.商品展销、定货会调查预测法
4.消费者购买意向调查预测法
2.2市场调查预测法
•为了提高预测de准确程度,在进行市场调查预测时应注意以下几个问题:
•(1)调查表不要包罗万象,应只包括和预测有关de基本内容;
•(2)要抽选出一定数目de具有代表性de调查单位;
•(3)设法取得被调查者de充分合作;
•(4)要参考统计资料和市场信息,对调查预测结果进行修正,以提高预测de准确程度;
•(5)尽量利用城市和农村住户抽样调查资料,以节省人力、物力,提高调查预测de科学
性和准确性。
2.3专家预测方法
,1.头脑风暴法
头脑风暴法:主要是通过组织专家会议,激励全体与会专家参加积极de创造性思维。
在诸多直观预测方法中,头脑风暴法占有重要地位。20世纪50年代,头脑风
暴法作为--种创造性de思维方法在预测中得到广泛运用,并日趋普及。从20世纪60年代末
期到70年代中期,实际应用中头脑风暴法在各类预测方法中所占de比重由6.2%增加到
8.1%
,2.德尔菲(Delphi)法
德尔菲(Delphi)法:德尔菲法是专家会议预测法de一种发展。它以匿名方式通过几轮函询,
征求专家们de意见。预测领导小组对每一轮de意见都进行汇总整理,作为参考资料再发给每
个专家,供他们分析判断,提出新de论证。如此多次反复,专家de意见渐趋一致,结论de可
靠性越来越大。
-德尔菲①elphi)法是美国“兰德”公司20世纪40年代首先用于技术预测de。德尔菲是古希
腊传说中de神谕之地,城中有座阿波罗神殿可以预卜未来,因而借用其名。
•近十年来,德尔菲法已成为一种广为适用de预测方法。许多决策咨询专家和决策者,常
常把德尔菲法作为一种重要de规划决策工具。斯蒂纳(GA.Steiner)在其所著作de《高层次
管理规划》一书中,把德尔菲法当作最可靠de技术预测方法。在军事领域中德尔菲法应用最为
普遍。工业科技发展和市场需求预测,国外也多采用德尔菲法。德尔菲法应用de其它领域还有:
人口预测、医疗和卫生保健预测、经营预测、教育预测、研究方案de预测、信息处理、以及各
级各类社会、经济、科技发展规划等等。
A德尔菲(Delphi)法步骤
(1)制定调查表,准备必要背景材料具体、明确、便于答复、材料客观
(2)选择专家
具有较高理论水平或具丰富实践经验de人
(3)反馈调查
A特点
(1)匿名性
(2)轮间反馈性
(3)预测结果de统计特性
A派生德尔菲法
一自从“兰德”公司首次用德尔菲法进行预测之后,很多预测学家(其中包括“兰德”公司de
专家)对德尔菲法进行了深入研究,对初始de经典德尔菲法进行了某些修正,并开发了一些派
生方法。
一派生方法分为两大类:
(1)保持经典德尔菲法基本特点;
(2)改变其中一个或几个特点。
•专家de选择
-德尔菲法是一种对于意见和价值进行判断de作业。如果应邀专家对预测主题不具有广泛
de知识,很难提出正确de意见和有价值de判断。即使预测主题比较窄和针对性很强,要物色
很多对这一专题涉及de各个领域都有很深造诣de专家也很困难,因而物色专家是德尔菲法成
败de关键,是预测领导小组de一项主要工作。
-如果预测任务仅仅关系到具体技术发展,最好同时从部门内外挑选。从外部选择专家,大
体按如下程序进行:
(1)编制征求专家应答问题一览表。
(2)根据预测问题,编制所需专家类型一览表。
(3)将问题一览表发给每个专家,询问他们能否坚持参加规定问题de预测。
(4)确定每个专家从事预测所消耗de时间和经费。
•编制调查表
•调查表一般根据实际预测问题de要求编制。
•德尔菲预测过程
经典德尔菲法一般分四轮进行。
第一轮:发给专家de第一轮调查表不带任何框框,只提出预测主题。预测领导小组对专家
填写后寄回de调查表进行汇总整理,归并同类事件,排除次要事件,用准确术语提出一个事件
一览表,并作为第二轮调查表发给每个专家。
第二轮:专家对第二轮调查表所列de每个事件作出评价,并阐明理由。领导小组对专家意
见进行统计处理。
第三轮:根据第二轮统计材料,专家再一次进行判断和预测,并充分陈述理由。有些预测
在第三轮时仅要求持异端意见de专家充分陈述理由,因为他们de依据经常是其他专家忽略de
一些外部因素或未曾研究过de一些问题。这些依据往往对其他成员重新作出判断产生影响。
第四轮:在第三轮统计结果基础上,专家再次进行预测。根据领导小组要求,有de成员要
重新做出论证。
通过四轮,专家de意见一般可以相当协调。
2.4主观概率法
主观概率:是预测者对某一事件在未来发生或不发生可能性de估计,反映个人对未来事件
de主观判断和信任程度。
•主观概率法是对市场调查预测法或专家预测法得到de定量估计结果进行集中整理de常用
方法。
客观概率,是指某一随机事件经过反复试验后,出现de频数,也就是对某一随机事件发生
de可能性大小de客观估量。如掷一枚硬币,出现国徽面和出现数字面de客观概率各为1/2。
・主观概率加权平均法
一主观概率加权平均法是以主观概率为权数,通过对各种预测意见进行加权平均,计算出
综合性预测结果de方法。
・累计概率中位数法
-累计概率中位数法是根据累计概率,确定不同预测值de中位数,对预测值进行点估计
和区间估计de方法。
2.5预兆预测法
1.预兆预测法概念
预兆预测法:就是根据预测对象前兆现象de变化情况,推断预测对象发展前景de预测方
法。
自然现象、社会现象、经济现象等之间de相互联系,有时在变动时间上呈现先后顺序。当
一种现象发生变化之后,另一种现象随之发生变化。前者de变化传递了后者即将发生变化de
信息,成为后者发生变化de前兆现象。
2.经济波动
所谓经济波动,指de是经济增长中出现上升与下降交替de循环往复运动。一个典型de经
济波动周期包括复苏、高涨、衰退和萧条四个阶段。
3.监测预警指标体系de构造
・应用预兆预测法对经济波动进行监测预警时要建立指标体系,通过对指标系统de观测和
分析来反映经济运行系统de变化,以便对经济增长中行将出现de波动态势发出警报信号,为
提早实施宏观调控提供依据,做到防患于未然。
设置指标体系要考虑三个方面de问题:
(1)指标de内容
指标de内容要与预警目标一致。
(2)指标时差关系分类
根据指标变动de时差关系,入选指标可以分为先行、同步和滞后三种类型
(3)指标选择de原则
・经济性质de重要性
・变动特征de灵敏性与稳定性
•统计上de完整性、及时性与充分性。
•4.信息指标de综合、识别与评价
(1)扩张指数方法
扩张指数方法根据扩张和半扩张指标数量比例进行指标信息de综合。计算公式是:
(2)景气对策信号方法
景气对策信号方法采用类似交通管制信号灯de方法来显示经济总体de运行状态和应当采
取de景气对策,如我国将经济运行de景气波动范围划分为过热、偏热、正常、偏冷和过冷五
个景气区,分别用红灯、黄灯、绿灯、浅蓝灯和蓝灯表示。
⑶“组合信号”预测
在实际应用中为了提高预测de准确性,还可以利用同步指标甚至是滞后指标参与预测,然
后取各个预测值de平均值作为最终预测值,称为“组合信号”预测值。
第3章回归分析预测法
3.1引言
1.回归分析de提出
,回归分析起源于生物学研究,是由英国生物学家兼统计学家高尔登(FrancisGalton
1822-1911)在19世纪末叶研究遗传学特性时首先提出来de。
•高尔登在1889年发表de著作《自然de遗传》中,提出了回归分析方法以后,很快就
应用到经济领域中来,而且这一名词也一直为生物学和统计学所沿用。
•回归de现代涵义与过去大不相同。一般说来,回归是研究因变量随自变量变化de关系形
式de分析方法。其目de在于根据已知自变量来估计和预测因变量de总平均值。
2.回归分析和相关分析
(1)函数关系
函数关系反映客观事物之间存在着严格de依存关系。在这种关系中,当一个或几个变量取
值一定时,另一个变量有确定de值与之相对应,并且这种关系可以用一个确定de数学表达式
反映出来O
一般把作为影响因素de变量称为自变量,把发生对应变化de变量称为因变量。
(2)相关关系
相关关系反映de是客观事物之间de非严格、不确定de线性依存关系。这种线性依存关系
有两个显著de特点:
①客观事物之间在数量上确实存在一定de内在联系。表现在一个变量发生数量上de变化,
要影响另一个变量也相应地发生数量上de变化。
②客观事物之间de数量依存关系不是确定de,具有一定de随机性。表现在当一个或几个
相互联系de变量取一定数值时,与之对应de另一个变量可以取若干个不同de数值。这种关系
虽然不确定,但因变量总是遵循一定规律围绕这些数值de平均数上下波动。
(3)回归分析与相关分析de关系
相关分析是以相关关系为对象,研究两个或两个以上随机变量之间线性依存关系de紧密程
度。通常用相关系数表示,多元相关时用复相关系数表示。
回归分析是对具有相关关系de变量之间de数量变化规律进行测定,研究某一随机变量(因
变量)与其他一个或几个普通变量(自变量)之间de数量变动关系,并据此对因变量进行估计
和预测de分析方法。由回归分析求出de关系式,称为回归模型
回归分析与相关分析de联系是,它们是研究客观事物之间相互依存关系de两个不可分割
de方面。在实际工作中,一般先进行相关分析,由相关系数de大小决定是否需要进行回归分析。
在相关分析de基础上建立回归模型,以便进行推算、预测,同时相关系数还是检验回归分析效
果de标准。相关分析需要回归分析来表明客观事物数量关系de具体形式,而回归分析则应建
立在相关分析de基础上。
3.回归模型de种类
(1)根据自变量de多少,回归模型可以分为一元回归模型和多元回归模型。
(2)根据回归模型de形式线性与否,回归模型可以分为线性回归模型和非线性回归模型。
(3)根据回归模型所含de变量是否有虚拟变量,回归模型可以分为普通回归模型和带虚拟
变量de回归模型。
此外,根据回归模型是否用滞后de因变量作自变量,回归模型又可分为无自回归现象de
回归模型和自回归模型。
3.2一元线性回归预测法
一元线性回归预测法,是对两个具有线性关系de变量,建立线性回归模型,根据自变量
de变动来预测因变量平均发展趋势de方法。
,1.OLS(OrdinaryLeastSquare)估计
,2.OLSde特性
・最小二乘估计量具有线性、无偏性和最小方差性等良好de性质。线性、无偏性和最
小方差性统称BLUE性质。满足BLUE性质de估计量称为BLUE估计量。
,3.回归方程de检验
•在一元线性回归模型中最常用de显著性检验方法有:
-相关系数检验法
-F检验法
-t检验法
3.3回归方程de检验
3.3.1离差平方和de分解与可决系数
在一元线性回归模型中,观测值de数值会发生波动,这种波动称为变差。变差产生de原
因如下:
①受自变量变动de影响,即x取值不同时de影响;
②受其他因素(包括观测和实验中产生de误差)de影响。为了分析这两方面de影响,需
要对总变差进行分解。
1.离差平方和de分解
Zy--X2+Z%-2
(寸=)(y)=Lyy=Q+Q2
即
总变差=剩余变差+回归变差
2.可决系数R?
2—回归变差—Q,
一总变差F
可决系数*de大小表明了在yde总变差中由自变量x变动所引起de回归变差所占de比
例,是反映变量X与y之间de线性相关关系密切程度de一个重要指标。根据上述定义,有
R2=Z也一歹>=2》-死
'刃2£(%-歹)2
3.3.2相关系数检验法
相关系数是用来衡量一元线性回归模型中两个变量之间线性相关关系强弱程度de指标。-
般说来,相关系数愈大说明两个变量之间de线性相关关系愈强。但相关系数de绝对值大到什
么程度时,才能认为两变量之间de线性相关关系是显著de,回归模型用来预测是有意义de?
对于不同组数de观测值,不同数值de显著性水平,衡量de标准是不同de。这一数量界限de
确定只有根据具体de条件和要求,通过相关系数检验法de检验才能加以判别。相关系数检验
法de步骤如下:
1.计算相关系数R;
2.根据回归模型de自由度(〃-2)和给定de显著性水平a值,从相关系数临界值表中查
出临界值J(〃一2);
3.判别。若|R|>R“(〃-2),表明两变量之间线性相关关系显著,检验通过,这时回归模
型可以用来预测;若|R|W&(n-2),表明两变量之间线性相关关系不显著,检验未通过。在
这种情况下,回归模型不能用来进行预测。这时,应分析其原因,对回归模型重新调整。
3.3.3F检验法
构造F统计量
F:♦■,一刃2一
Ea-y,)2/(»-2)Q|/(〃-2)
可以证明产服从第一自由度为1,第二自由度为n—2de户分布。对给定de显著性水平a,
查户分布表可得临界值心(1,〃—2)。
若F>F「则认为两变量之间线性相关关系显著;反之,若FW0,则认为两变量之间线
性相关关系不显著。
3.3.4,检验法
f检验法是检验a,b是否显著异于0de方法。我们以对b检验为例来说明t检验法de步骤。
构造,统计量f=2b
其中=I032'称为方de样本标准差。可以证明f=二~服
bN(〃-2)Zkbs.
从自由度为(n—2)der分布。查t分布表得临界值2)。若t>〃/2(〃—2),则认为匕显
著异于0,反之,若一2),则认为。不显著异于0。
对于a是否显著异于0de检验过程与此完全相同。
3.3.5预测区间
1.点估计
在一元线性回归模型中,对于自变量xde一个给定值,代入回归模型,就可以求得一个对
应de回归预测值,又称为点估计值。
设预测点为(玉),%),则预测值为:
y0=a+bxa
2.区间估计
所谓预测区间就是指在一定de显著性水平上,依据数理统计方法计算出de包含预测对象
未来真实值de某一区间范围。
设其预测误差为:
由于方和丸都服从正态分布,所以/也服从正态分布,其期望值与方差分别为:
E(e0)=E(y°-%)=E(y°)-E(y0)=0
0(eo)=0(yo-%)=0(yo)+0(%)=b2+:+汽工g)2
=l+LF?;cr2
n\(占7)二
所以,%~N(0,1+1+。2)
n工(七-x)_
令
通过上述分析,可以得到,在显著性水平为a时.,预测值%de预测区间为:
%干%2(〃-2电
当实际观测值较多,满足大样本条件(一般〃>30)时,式(中根式de值近似地等于
1,式中de7/2(〃-2)也近似趋于正态分布Z&/2,因此,可简化为:
年不Za/S,
3.3.5几个应当注意de问题
1.重视数据de收集和甄别
在收集数据de过程中可能会遇到以下困难:
(1)一些变量无法直接观测。
(2)数据缺失或出现异常数据。
(3)数据量不够。
(4)数据不准确、不一致、有矛盾。
2.合理确定数据de单位
在建立回归方程时,如果不同变量de单位选取不适当,导致模型中各变量de数量级差异
悬殊,往往会给建模和模型解释带来诸多不便。比如模型中有de变量用小数位表示,有de变
量用百位或千位数表示,可能会因舍入误差使模型计算de准确性受到影响。因此,适当选取变
量de单位,使模型中各变量de数量级大体一致是一种明智de做法。
3.3.6举例
例江苏省1986—2003年国内生产总值和固定资产投资完成额数据如表3.3.1所示。
表3.3.1一元线性回归模型计算表单位;亿元
固定资产投国内生产92
年份Xxy
资完成额X总值yy
1986241.23744.9458191.91554935.6179701.9
1987317.12924.33100565.1850694.6292489.3
1988371.871208.85138287.31461318449535
1989320.231321.85102547.31747287423296
1990356.31416.5126949.72006472504699
1991439.981601.38193584.42564418704575.2
1992711.72136.02506516.945625811520205
19931144.22998.16130919489889633430495
19941331.134057.391771907164624145400914
19951680.175155.252822971265766038661696
19961949.536004.2138006673605053811705388
19972203.096680.3448536064462694314717390
19982535.57199.9564287605183928018255473
19992744.657697.8275221295925643321112426
20002995.438584.7389726017366325425708967
20013304.969511.91109095459047643231417458
20023849.241063L751481664911303410840924157
20035335.812451.82847076215504732366440314
合计31828.1390323.1892905430689769996251849180.4
数据来源:《江苏统计年鉴》
试配合适当de回归模型并进行显著性检验;若2004年该省固定资产投资完成额为5922亿
元,当显著性水平a=0.05时,试估计2004年其国内生产总值de预测区间。
解:
1.绘制散点图
设国内生产总值为X固定资产投资完成额为x,绘制散点图(图略),由散点图可以看出两
者呈线性关系,可以建立一元线性回归模型。
2.设一元线性回归方程为
y=a+bx
3.计算回归系数
列表计算有关数据(见表4.8.1),并计算出回归系数估计值:
,nYxy-YxYy18x251849180-31828x90323.…”
b=-^=--〜=----------------------------------------=2.51562
2_(工x)18x92905430-318282
4E-V9032331828..Q
a=------b^—=-----------2.51562x---------=569.76
M»1818
所求回归预测方程为:y=569.76+2.51562t
4.检验线性关系de显著性
由于在一元线性回归情形,相关系数检验、尸检验、f检验de结果一致,此处仅给出相关
系数检验。
R"Z孙二不立>
—(zx)2屁y,-(zJO,
18x251849180-3182&<90323nnonn
i~~I=0.9o9y
V18x92905430-3182g•Jl8x689769995-9032^
当显著性水平a=0.05,自由度=〃一m=18—2=16时,查相关系数临界值表,得
0%(16)=0.4683,因
7?=0.9899>0.4683=心。6)
故在a=0.05de显著性水平上,检验通过,说明两变量之间线性相关关系显著。
5.预测
(1)计算估计值de标准误差
S'F^2
1689769995-569.76x9032^-2.51562x251849180“八
=J-------------------------------------------------------------------=544.9
V18-2
(2)当显著性水平a=0.05,自由度=〃-2=18—2=16时,查t分布表得:
3(2=21199
(3)当X。=5922亿元时,代入回归方程得yde点估计值为:
%=569.76+2.51562V=569.76+2.51562x5922=154691(亿元)
预测区间为:
1,1,n(XQ-^)2
干/a/2(〃-2)・S、.
i18*4]5#
1+—+------------------------------
J1818x9290543(>3182g
=15469.1+2.1199x544.9x1.52669
-15469.1+1763.5
即:当2004年全省固定资产投资完成额为5922亿元时,在e=0.05de显著性水平上,国
内生产总值de预测区间为:13705.6〜17234.6亿元之间。
•一元线性回归模型研究de是某一因变量与一个自变量之间de关系问题。但是,客观
现象之间de联系是复杂de,许多现象de变动都涉及到多个变量之间de数量关系。
•研究某一因变量与多个自变量之间de相互关系de理论和方法就是多元线性回归模型。
3.4多元线性回归预测法
3.4.1多元线性回归模型及其假设条件
设所研究de对象受多个因素玉,々,…,de影响,假定各个影响因素与yde关系是线性de,
这时就需要建立多元线性回归模型:
y=川玉+用2/+…+P,nxm+u
给定变量又否,々,…,x,”de—组观测值y,而,9”…,七卅,对应地有
y=43+/?2X2,.+•••+Pmxni+/,i=1,2,…,”
若取项de观测值恒等于1,即对任意,・有为1=1,则式变为:
♦=B\++…+i=1,2,…,〃
即
%=四+/2工2|+…+月"+«!
>2=£1+尸2%22+…+0mxm2+«2
%=4+。2%2"+•-•++»„
用矩阵形式表示为
即
Y=XB+u
其中
(\
X%、
r=号U1
多元线性回归模型de基本假设条件如下:
假设1:E(ui)=0,z=1,2,…,n
假设2:£>(«,)=E(〃;)=吠,i=1,2,.••,n
Cov(w,.,w7.)=E(ui,uj)=0,i丰j,i,j=1,2,-,n
用矩阵形式表示为
E(uu)=E
E(u;)E(U]1(2)凤〃]〃〃)
£*(〃;)
E(U2U{)E(u2ult)
E(u〃/)E(说)
,;0••-0
0cr:••-0
00•••cr;
式称为高斯一马尔可夫(Gauss-Markov)假设。
假设3:Cov(ui,xj')=0,i=1,2,--•,n\j=1,2,…,加
式要求随机扰动项“与自变量斗,々,••式,”不相关。
假设4:r[X)=m,m<n.
假设4限定矩阵Xde秩等于参数个数,即要求自变量玉,々,一了,“不相关。
由于随机扰动项包含了“非主要因素”de影响、随机变化、观测误差和模型数学形式设定
偏差等各种因素对yde影响de总和,根据中心极限定理,还可以进一步假设随机扰动向量
w服从“维正态分布,即
“〜N(0,
3.4.2模型参数de估计
与一元线性回归模型类似,我们仍采用最小二乘法估计参数向量B,设观测值与回归
方程估计值de残差向量为E,则
E^Y-Y
Y=XB
根据最小二乘法de要求,应有
E'E=(y_y)'(y_y)=min
即
E'E=(y-XB)'(Y-XB)=min
由极值原理,根据矩阵求导法则,上式对B求导,并令其等于零,则得:
dE'E_--_。(丫丫—2y初+B'X初)
~dBdBdB
=-2(yx)'+2(xx)5=0
整理得回归系数向量Bde估计值为:
B=(X%ylXY
3.4.3回归系数向量估计值de统计性质
1.回归系数向量Bde估计值©具有线性性质。
由式(5.2.2)可知,回归系数向量Bde估计值与为Yde线性组合。
2.估计值B是回归系数向量Bde无偏估计量。
回归系数向量估计值Bde数学期望
E(2)=£[(XX)TXY]
=E[(XX)TX'(XB+M)]
=E[(XX)TXXB+(XX)TX'u]
=E(B)=B
可见分是Bde无偏估计。
3.回归系数向量估计值B具有最小方差性
回归系数向量估计值Bde协方差
COV(B,fi)=£T(B-B)(B-B)[
因为与一B=(XX)TX'(X8+M)-B
=(XX)TXL
故COV(反B)=E[(XX)-、XhuX(XX)-']
=(XX)7X,E(uu)X(XX)T
=(XX)-'X'X(XX)T
式中矩阵主对角线上de元素为回归系数向量估计值Ade方差,其余元素为回归系数向量
估计值与de协方差。可以证明,回归系数向量估计值以具有最小方差性,此处从略
3.4.4多元线性回归模型de检验
•常用de检验方法有
•1.R检验法
•2.F检验法
,3.t检验法
•4.DW检验法。
在建立多元线性回归模型de过程中,为进一步分析回归模型所反映de变量之间de关系是
否符合客观实际,引入de影响因素是否有效,同样需要对回归模型进行检验。
1.R检验法
R检验法是通过复相关系数检验一组自变量玉,工2,…,七”与因变量N之间de线性相关程度
de方法,又称复相关系数检验法。与一元线性回归模型类似,可以通过对总变差de分解
22
E(y,--y)=-+Z(力一y)=C+Q2
得到多元线性回归模型之R2de计算公式。上式右边de第二项。2称为回归变差(或称回归
平方和),回归平方和反映了力与其之间de变差,这一变差由自变量…,de变动
而引起,是总变差中由自变量当,々,…,/解释de部分,它de大小反映了自变量
事,马,…,X,”de重要程度;等式右边de第一项Q称为剩余变差(或称残差平方和),它是
由观测或实验中产生de误差以及其他未加控制de因素引起de,反映de是总变差中未因变
量西,々,…,X",解释de部分。即
总变差=剩余变差+回归变差
与一元回归分析一样,也可以利用。2在总离差中所占de比重表示多元线性回归模型de复
可决系数
R2=Z他一1)2=]_Z(y一少1
Z(y,•一歹)2一寸
它可以用来衡量因变量y与自变量否,々,…,X,“之线性相关关系de密切程度。
R二
\Zb;-"
称为复相关系数。这里内说明在yde总变差中,由一组自变量西,々,…,X,”变动所引起de
变差所占de百分比;△则描述一组自变量%,…,4与因变量y之间de线性相关程度。
它们所体现是一组自变量对因变量de影响程度及其线性相关程度,所以,这里分别称它们
为复可决系数和复相关系数。
与相关系数检验法一样,复相关系数检验法de步骤为:(1)计算复相关系数;(2)
根据回归模型de自由度"一机和给定de显著性水平a值,查相关系数临界值表;(3)判
别。
在实际工作中,复相关系数de计算常用其简捷形式,如对于二元和三元de情形,其
简捷形式分别如式所示:
,AAA
iZ--y-y-Az%y
Yy--ny
J-AAAA
.Zyi-B±yJ-BEx#、
1-----------------------;----------------------
由于心是一个随自变量个数增加而递增de增函数,所以,当我们对两个具有不同自变量
个数但性质相同de回归模型进行比较时,就不能只用F作为评价回归模型优劣de标准,
还必须考虑回归模型所包含de自变量个数de影响。因此,就需要定义一个经过校正deR2,
记为R2:
歹=1_E(y,-犷(〃一利)
Z(%-刃[/'(〃-1)
这里,“一加是剩余变差£(%一少)?de自由度,”一1是总变差-自由度。
由此可见,声中体现了自变量个数/Mde影响。根据上式可得R2与R2之间de关系式如下:
曰=1一(1—R2)±1
n-m
从式可以看出:
(1)当心1时,产<解。说明尸中包含了自变量个数de影响,随着自变量玉,当,…,/
个数de增加,A?总是小于R2。
(2)尽管R2总是非负de,但户2却可能为负。若遇到R2为负数de情况,R2取值为零。
2.尸检验
尸检验是通过尸统计量检验假设“°:百=/72=i=力“=0是否成立de方法。
(1)户统计量。
ZG厂刃:/(噜D
r一人2/
Z(y「外(〃—m)
式中de%-1是回归变差厂yjde自由度,”一m是剩余变差Z(y[,Jde自由度。
可以证明产统计量服从第一自由度为,“一1,第二自由度为〃一wde尸分布。故对给定de显
著性水平a,查尸分布表可得临界值加-一㈤。若
F>Fa(m-1,n-ni)
则否定假设”o,认为一组自变量的,々,…,/与因变量y之间de回归效果显著;反之,
则不显著。一般来讲,回归效果不显著de原因有以下几种:
①影响yde因素除了一组自变量七,々,…,X,”之外,还有其他不可忽略de因素;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年离婚不离家互不干涉的婚姻协议书范文
- 《计算机网络安全防护技术(第二版)》 课件 第3章-任务3.1.1 探究古典加密技术
- 游戏音效的设计与应用
- 安全施工保证措施
- 新进厂职工安全培训试题各地真题
- 部门级安全培训试题答案新
- 班组三级安全培训试题含答案(典型题)
- 项目安全培训试题附答案【突破训练】
- 职工安全培训试题及答案【基础+提升】
- 安全标准化安全培训试题【考试直接用】
- GB/T 17775-2024旅游景区质量等级划分
- 社会主义发展史智慧树知到期末考试答案2024年
- ISO∕IEC 42001-2023人工智能管理体系(中文版)
- 中学生食品安全教育 主题班会课件(共张ppt)
- 河南省农村信用社信贷管理基本制度
- (完整版)二次根式混合运算125题(含答案)
- 初级消防设施操作员真题及答案解析二
- 六年级上学期趣味数学校本课程
- 超声波焊接作业指导书
- 初中英语语音教学的实践研究
- 跨高速公路连续梁施工方案
评论
0/150
提交评论