版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章回归分析预测法一.概述二.一元线性回归模型预测三.多元线性回归模型预测四.虚拟变量回归模型预测五.非线性回归模型预测六.自回归模型预测教学要求●清楚回归分析预测法的适用对象;●清楚回归分析与相关分析的区别;●掌握一元线性回归模型的参数估计与检验;●了解多元线性回归模型的参数估计与检验;●了解带虚拟变量的回归模型的应用条件;●清楚非线性回归模型的建模方法;教学重点
●相关分析与回归分析的基本概念;
●一元线性回归模型的建立与参数检验;教学难点
●相关系数的含义
●参数检验的作用一.概述回归分析预测法——
从各种现象的相互关系出发,通过对与预测对象有联系的现象的变动趋势分析,推算预测对象未来状态数量表现的一种方法。
xj负荷y影响因素时间x1负荷的变化空间示意图y=f(t)—时间序列模型y=f(x)—关联序列模型几个基本问题1.回归的含义2.相关关系的概念3.相关分析与回归分析的区别与联系4.相关分析与回归分析的作用5.回归分析模型的种类1.回归的含义回归——研究自变量与因变量之间关系形式的分析方法。GDP电量需求气象因素系统负荷长期预测短期预测自变量因变量2.相关关系的概念●函数关系:严格的依存关系,有数学表达式。●相关关系:非严格的,不确定的依存关系。
确定性问题(函数关系)不确定性问题(相关关系)相关关系的特点●现象之间确定存在数量上的客观内在关系。表现在:一个现象发生数量上的变化,要影响另一现象也相应地发生数量上的变化。●现象之间的依存关系不是确定的,具有一定的随机性。表现在:给定自变量的一个数值,因变量晖有若干数值和它对应,且因变量总是遵循一定规律围绕着这些数值的平均数上下波动。3.相关分析与回归分析的区别与联系●相同点:研究及测度2个及以上变量之间的关系。●不同点:相关分析
①2个随机变量及以上紧密程度。直线相关—相关系数曲线相关—相关指数多元相关—复相关系数②不分自变量与因变量。回归分析①几个随机变量与其它几个普通变量之间的数量变动关系。②需区分自变量与因变量。●相互联系——先相关分析,后回归分析。
相关分析回归分析可建模推算预测判断关联关系●相关分析是回归分析的基础;●序列相关并不一定能建立回归模型;初级高级4.相关分析与回归分析的作用●对数量关系的研究分析,深入认识现象之间的相互依存关系。●通过对回归模型,进行预测和预报。●用于补充缺少的资料。5.回归分析模型的种类●自变量多少:一元与多元●模型线性性:线性与非线性●含虚拟变量:普通回归与虚拟变量回归
(自变量为数量变量和品质变量)●含滞后量:无自回归、自回归二.一元线性回归预测模型●定义:
对两个具有线性关系的变量,配合线性回归模型,根据自变量的变动来预测因变量的平均发展趋势的方法,为一元线性回归预测法。
主要内容1.模型描述2.参数估计3.相关系数4.显著性检验5.预测及预测区间的确定6.算例1.模型描述xi:影响因素(可以控制或预先给定);ε:各种随机因素对y的影响的总和,服从正态分布,即ε~N(0,σ2);yi:预测目标,由于受随机因素的影响,是一个以回归直线上对应值为中心的正态随机变量,即y~N(a+bx,σ2);自变量因变量——一元线性回归模型总体方差——为一组观察值(xi,yi)的散点状态的估计式;2.OLS参数估计(OrdinaryLeastSquare)●基本思想:通过数学模型,配合一条较为理想的趋势线,使得原序列的观察值与估计值的离差平方和为最小;●推导3.相关系数——选择主要因素作模型的自变量的依据●离差平方和的分解离差——在一元线性回归模型中,观察值yi的取值是上下波动的,这种波动现象,~。
原因——自变量变动的影响,即x取值的不同;其它因素的影响(包括观察和实践中产生的误差等);
对1个观察值,离差为
对n个观察值,离差为
为0,证明(略)离差项的物理含义:Q1——由客观和实验中产生误差以及其它未加控制因素引起的(未解释部分)。即:由那些未被考虑的随机因素的影响产生的,且无法因回归方程的建立而消失。Q2——由于选择自变量x并建立线性回归方程而产生的,可用回归模型的建立加以说明(已解释部分)●可决系数R2R2——在总的离差中,由自变量x变动所引起的百分比。它是评价两个变量之间线性相关关系强弱的一个重要指标。0≤R2≤1●相关系数R:R——为可决系数的平方根,是一元线性方程中衡量两个变量之间相关程度的重要指标。——可不需要先求出回归模型中的剩余离差来求,直接从样本数据中计算得到,实际工作中带来方便。若代入平均数,则R的计算变为——积差法计算公式R的讨论(-1≤R≤1)●R=0说明回归离差为0,即自变量x的变动对总离差毫无影响。零相关;●│R│=1说明回归离差等于总离差,即总离差的变化完全由自变量变化所引起的。完全相关(退化成函数关系)●0<│R│<1说明自变量对x的变动对总离差有部分影响。普通相关;R为正则正相关
R为负则负相关●│R│>0.7或R2>0.49
说明自变量对x的变动对总离差的影响占一半以上。高度相关;●│R│<0.3或R2<0.09
说明自变量对x的变动对总离差的影响低于9%。低度相关;
●0.3≤│R│<0.7
说明自变量对x的变动对总离差的影响在9%~50%之间。中度相关;
4.显著性检验●目的——检查所建立的一元线性方程,是否符合变量之间的客观规律性,两变量之间是否具有显著的线性相关关系?●方法——相关系数检验法(适用于一元线性回归方程)●问题描述——相关系数的绝对值大到什么程度时?才能认为两变量之间的相关关系是显著的,回归模型用来预测是有意义的。●检测标准——与观测值的个数有关;(n)
——与不同树枝的显著性水平有关;(α)●步骤step1:计算R;Step2:由回归模型的自由度(n-2)和给定的显著性水平α,从相关系数表中查出临界值Rα(n-2);Step3:判断。若│R│≥Rα(n-2),说明两变量之间线性相关关系显著,检验通过,回归模型可用于预测;若│R│<Rα(n-2),说明两变量之间线性相关关系不显著,检验不通过,不能用于预测,需重新加以处理;5.预测值与预测区间●预测值——在一元线性回归模型中,代入给定的自变量x0,可求的一个对应的回归预测值,有时称之为点估计值;●预测区间——在一定的显著性水平上,依据数理统计方法计算出包含预测未来真实值的某一区间范围,~。,即:
或当x≥30,5.算例
1)配合适当的模型并进行显著性检验;
2)取α=0.05,x0=249时的预测值与预测区间;
197819791980198119821983198419851986198719881989x20202635525681131149163232202y195210244264294314360432481567655704趋势线解:(1)绘制散点图;(2)建立一元线性回归模型;(3)计算回归系数(4)检验相关系数的显著性(5)预测计算估计标准误差三.多元线性回归预测模型
1.多元线性回归模型2.多元线性回归模型的检验3.预测区间4.算例5.采用excel的求解1.多元线性回归模型——多个影响因素的影响问题线性关系●OLS估计残差所以求导矩阵求导,参看线性代数最小二乘法(1)R检验
——通过复相关系数检验一组自变量X1,X2,…,Xm变与因变量y之间的线性相关程度的方法,~。也称复相关系数检验法。2.多元线性回归模型的检验(R、F、t、DW)——表示一组自变量x1~xm的变动所引起的百分比。总离差:——表示一组自变量x1~xm与因变量之间的线性相关程度。问题:它与一元线性回归方程的R在形式上是相似的,但它们的含义有什么区别?R的简洁计算公式——n=3——n=4R检验步骤:Step1:计算复相关系数;Step2:根据回归模型的自由度(n-m)和给定的显著性水平α,查相关系数临界值表Rα;Step3:判别;注意:Rα是一个随自变量个数增加而递增的增函数校正R2
——体现自变量个数的影响其中:(n-m)为剩余离差的自由度(n-1)为总离差的自由度●当m>1,
●R2非负,但可能为负,当为负时,取(2)F检验——检验一组自变量x1~xm与y之间回归效果的显著性。若检验通过,表明β1,β2=,……βm≠0。其中:(m-1)为回归离差的自由度(n-m)为剩余离差的自由度检验方法:若:F>Fα(m-1),(n-m),说明x1~xm与y回归显著;F≤Fα(m-1),(n-m),说明回归效果不显著;不显著的原因:
●说明回归影响y的因素,除了一组自变量x1~xm变之外,还有其它不可忽略的因素;
●y与一组自变量x1~xm之间的关系,不是线性的;
●y与一组自变量x1~xm之间无关;对策——另选自变量或改变预测模型;
F与R2,R之间的关系(3).t检验——与R检验和F检验不同,前者是将所有的自变量作为一个整体来检验它们与y的相关程度以及回归效果;t检验则是对所求回归模型的每一个系数逐一进行检验。
其中::第j个自变量xj的回归系数;:的样本标准差;t检验步骤:Step1:计算估计标准差;S的简洁计算公式——n=3——n=4Step2:计算样本标准差(Cjj为(x’x)-1主对角线上第j个元素)Step3:计算t统计量│tj│>tα/2(n-m),(j=1~m)xj对y有显著影响。│tj│≤tα/2(n-m),xj对y无影响,应删除。(4).DW检验——检验序列相关对模型的影响;●什么是序列相关?——指数列前后期相关。可以是与前一期相关,也可以是与以前若干期都相关;常见的为时差为一期的序列相关,称之为一阶自相关。
●对于序列相关,若采用最小平方法估计参数,将会产生严重的后果:1)估计标准差S可能严重低估σ的真实值;2)样本方差可能严重低估D(βj)的真实值;3)估计回归系数可能歪曲βj的真实值;4)通常的F检验和t检验将不再有效;5)根据最小平方法估计量所作的预测将无效。方差●DW检验(Durbin-Waston准则)——一阶自相关展开式大样本时(n>30)●DW检验步骤Step1:利用最小平方法求回归模型及残差eiStep2:计算DW的值;Step3:根据给定的检验水平及自变量的个数m,从Dw检验表中差的相应的临界值DL、DU,从根据表得出检验结论。DW检验判别表与样本的容量n和自变量的个数m有关n一定时,m愈大,无结论区愈大;m一定时,n愈大,无结论区愈小;注意:若DW的统计量落入无结论区,则不能做出回归模型是否存在自相关现象的结论。DW检验判别域?当落入无结论区的解决办法:●增加样本;●调整样本;●采用其它方法进行自相关检验;?产生自相关的原因●忽略某些重要的影响因素;
●错误的选用了回归模型的数学形式;
●随机误差项ε的确是相关的(如后效性);?产生自相关时的补救办法●把略去的重要影响因素一入到模型中;●重新选择合适的回归模型形式;●增大样本容量,改变数据的准确性;3.预测区间(1)估计标准误差
(2)预测值预测误差样本方差(3)预测区间
(n<30)(n≥30)4.例题1)配合适当的模型并进行各种检验;2)取α=0.05,求x2=67,x3=58时的预测值与预测区间;197819791980198119821983198419851986198
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度农村经济:大米采购与农民增收合同
- 《资源性公用事业反垄断法规制》
- 2024年度建筑项目设计服务合同
- 《论话剧《动物园的故事》中人物的塑造》
- 《市售蔬菜典型抗生素残留检测及健康风险评价》
- 《股权激励在我国创业板上市公司的实施问题研究》
- 二零二四年度危险品仓储安全管理合同
- 《碳基金属氧化物纳米晶复合负极材料的制备与储锂性能》
- 《缺陷碳载过渡金属催化剂的制备及催化性能研究》
- 2024年度磷石膏运输招标规定
- 2024年国家公务员考试《申论》真题(副省级)及答案解析
- 医院仪器设备采购合同范例
- 2024年天津市滨海新区大港中医医院招考聘用高层次人才管理单位遴选500模拟题附带答案详解
- 2024年大学生求职面试技巧培训课件
- 2015-2024北京中考真题语文汇编:记叙文阅读
- 一年级家长会课件2024-2025学年
- 厨师培训食品安全和卫生培训考核试卷
- 2025届四川绵阳中学物理高二上期末综合测试模拟试题含解析
- DB15T 435-2020 公路风吹雪雪害防治技术规程
- 2024湖北恩施州巴东县事业单位统一考试招聘高频难、易错点练习500题附带答案详解
- 2024年酒店托管协议书酒店委托管理协议
评论
0/150
提交评论