版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十章 相关与回归分析10.1概述 一、回归预测的含义回归 (Regression) 一词是由生物学相关概念引申而来,它是英国生物学家高尔顿 (F.Galton 用来描述遗传变异现象的术语。1889年他在普用回归定律一文中指出:每个人的特点和他的亲属有相似之处,但平均地说在程度上有一定的差异。他的朋友皮尔逊后来对 1078 个家庭进行了调查,发现个子高的父母比矮的父母趋向于生育个子高的子女,但是从平均数看,父母高 , 他们的子女不一定像父母那样高 , 反之也不像 其父母那样矮。这种现象便称之为回归。后来这个名词被广泛用来表示变量间的数量 关系。v回归分析:就是研究某一个随机变量 (因变量) 与
2、其他一或几个变量 (自变量 ) 之间的数量变动关系,由回归分析求出的关系式通常称为回归模型。v回归分析预测法:就是从各种经济现象之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测法。 二、回归预测的分类两个变量之间就其关系变化来说,可以表现为两种数学模型形式,即函数型关系和统计型关系.如果用 x 表示自变量 ,y 表示因变量,同时 x 和 y 的关系在一定条件下是完全确定的,那就是函数关系。反之,则是统计型关系。 在社会经济现象中,一个变量 和另一变量尽管有密切的关系,但是由于受到众多的难以控制的因素的影响,实际观察得到的数据并不能构成函数关
3、系。例如,企业的年销售额 y 与变量 x( 人均收入、利率 的变化、产品的市场竞争状况、季节的变化及原材料的供应等 ) 对应的关系会形成一个统计分布。随自变量 x 的变化,因变量也随之有一个随机变化结果。其变化的结果所对应的曲线模型有正线性关系、负线性关系、元数量关系、向下抛物线关系、上升指数曲 线关系及下降指数曲线关系等。 在回归分析中,如果研究的因果关系涉及两个变量就叫做一元回归分析或单回归分析;如果涉及两个以上的变量,则叫做多元回归分析或复回归分析。如果变量之间的相关关系呈线性变化,则叫线性回归;如果变量之间的相关关系呈非线性变化,则叫非线性回归。 三、回归预测的一般程序v 确立相关因素
4、:相关因素又称相关变量,它是回归分析的基础。相关变量选择得准确与否会直接影响回归预测结果的准确性。v 建立数学模型:根据已知的数据资料,找出变量之间相关关系的类型,选择与其最为吻合的数学模型,代入已知数据并经过数学运算,求得有关系数或参数,从而建立预测的数学模型。v 检验和评价数学模型:建立的数学模型是否正确,必须用一套数理统计方法来加以检验,并测量其误差大小和精确 (或近似)程度。v 运用模型进行预测:数学模型经检验后如果正确,即用所建的数学模型进行预测和控制。10.2一元线性回归方程一、一元线性回归预测方程如果影响预测对象的主要因素只有一个,并且它们之间呈线性关系,那么可采用简单回归分析法
5、预测。由于这种方法只涉及一个自变量,故其又称为一元线性回归分析法。设一元线性回归方程为 :y yi i= =a+ba+bx xi i+e+ei i(i=1,2, (i=1,2, , n) , n)式中 ,n 为样本容量;为回归常数;b 为回归系数 , 即回归直线的斜率; ei 为残差值 , 又称回归余项 , ei 的平均值为零 , 其中每个ei的分布方差相同,它是用a+bxi估计因变量yi 的数值所造成的,它是估计值与实际数值之间的离差 , 即 eiei= y= yi i i i 。 实际预测时,残差项的是无法预测的 , 其目的只是借助a+bxi得到预测对象 yi 的估计值 , 所以预测模型为
6、 : i i = =a+ba+bx xi i式中,i为预测值( 又称为估计值 )a为回归常数;b为回归系数。 二、最小二乘法 (式)(式)用上述方程在预测前,还得先知道自变量的取值。如该地 2004 年人均收入的预测值为 560 元 , 则该地区 2002年耐用消费品销售额的预测值为: i i 20042004= =0.2568+2.9303 0.2568+2.9303 5.6 5.6 166.7( 166.7( 万元万元 ) )这里得到的 166.7 万元是一个点预测值,实际上的数值也许高于它,也许比它低。因此在进行回归预测时,总是在点预测为中心的基础上,在一定的可能性( 即概率 )下,给一
7、个预测区间 ( 又称为置信区间 )。若要计算点预测的置信区间,就要计算点预测值误差的标准差。三、一元线性回归预测的置信区间在回归分析中 由于总体关系有一定程度的变异 , 从实际观察值所求得的回归线只是样本回归线。 a 和 b 就只能看做是总体回归系数 A 和 B 的估计值,不同的抽样就会有不同的 和 b, 也就是说有不同的样本回归线随机因素的存在表明,给定任何一个x值就可能有许多 y 的观察值。 进行回归分析时对于 y 的变异性是有前提假定的,这些假定是 : y 是一个随机变量 , 亦即 e 是随机变量 ; 给定一个x值时 ,y 分布是正态的 ,影响 y 的其他因素的作用一般趋于互相抵消 ,
8、因此 ,E(e)=O ,y 的平均值就在给定 x 值的回归线上; 在任何x值上,y 分布的方差 ( 及标准差 ) 相等。一元线性回归标准差计算公式如下 :(式)置信区间 一元线性回归的置信概率可查t分布的双侧检验表,取置信概率为 95%时, t0.05=2.365 则预测区间为: 土土t t0.050.05S = 16.67S = 16.67土土2.3652.3650.6590.659 = = 151.11-182.28151.11-182.28 即预测2004年耐用商品销售额在 151.11 万元至 182.28 万元的概率为 95% 。 预测 区间的大小与置信概率的大小为同向关系 , 概率
9、取得越高,预测区间就越大。但是如果预测区间过宽,就会使预测结果失去意义。 一、二元线性回归 设某国每年小麦出口量的增长率和该年小麦产量的增长率及出口税率有线性关系 , 其 1994-2003 年的样本数据如图表所示。利用图表 144 的数据 , 求样本回归方程:解:为了确定回归系数要求先求回归方程,为此,需要用1994-2003年小麦出口量年增长率与产量年增长率及出口税率回归分析计算表:10.4回归模型的统计检验一.简单相关检验 变量与之间是否存在线性相关的问题,可以通过散点图用目测的方法解决,但既不精确也不方便。现在用一种量化指标,来较精确地描述两变量间的线性相关的密切程度,这个指标称为简单
10、相关系数r,其计算公式是:二、 F 检验要判定回归方程在整体上是否显著成立,即用所配合的回归方程来解释因变量的变化是否有效,此时可用 F 检验法。F 检验法的步骤如下: 1. 计算剩余平方和S余: S余 =(yi i )式中 , yi 为观察值 , i为拟合值 2计算回归平方和 S回: S回(yi yi )3. 计算统计量 F 的值 : F= S回m/ S余/ (n-m-1)式中 m 为回归方程中自变量个数。4. 查表检验显著性 :按显著性水平查 F 分布表,得到临界值F , 如果 F F , 则认为回归效果显著 , 否则即认为回归效果不显著。 对上例的回归方程做 F 检验1.计算剩余平方和:
11、S余 = (yi i)=2.04152.计算回归平方和: S回(yi yi )=112.49355 3.计算 F 值(因为是一元线性回归 , 只有一个自变量 , 所以 m = 1) F= S回m/ S余/ (n-m-1) = 112.4935/2.0415/7=385.724.查表检验显著性 :取显著性水平 =0.05;m=1, 第二自由度 n-m-1=7 。查 F 分布表得临界值 F0.05=5.59 因为 F=385.725.59, 所以回归效果显著。 四、t 检验 判定回归方程中系数 ( 参数 ) 的作用是否显著 ,可用 t 检验法。在多元回归中,如果某个自变量X对因变量 y 的作用不显著,则该前的系数就可视为0。但需要注意,回归系数同0的差异是否显著,不能根据系数绝对值的大小来判断,而要根据统计假设检验的理论进行检验,因为系数值的大小要受变量计量单位的影响。如上例中得到的回归方程 , 自变量x前的系数是2.9303, 倘若把x的单位由百元改为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东科贸职业学院《钢筋混凝土结构设计原理》2023-2024学年第一学期期末试卷
- 广东警官学院《工程结构抗震设计》2023-2024学年第一学期期末试卷
- 广东江门中医药职业学院《化工新产品开发概论》2023-2024学年第一学期期末试卷
- 广东技术师范大学《JavaScript与jQuery开发》2023-2024学年第一学期期末试卷
- 广东环境保护工程职业学院《故事片创作》2023-2024学年第一学期期末试卷
- 广东海洋大学《测绘工程案例》2023-2024学年第一学期期末试卷
- 广东工商职业技术大学《材料成形数值分析》2023-2024学年第一学期期末试卷
- 广东财贸职业学院《世界历史文选》2023-2024学年第一学期期末试卷
- 八年级物理《电功率和用电安全》课件
- 赣南医学院《音乐剧表演》2023-2024学年第一学期期末试卷
- 医疗人员廉洁从业九项准则
- 培训费收款收据模板
- 母公司与子公司之间的协同效应
- 2023-2024学年湖南长沙市中学雅培粹学校数学七年级第一学期期末预测试题含解析
- 小学道德与法治课程标准与教材研究 课件 第1-5章 小学道德与法治课程标准研究-道德教育
- 酒店行政人事年工作总结
- 钝感力读后感课件
- 云上赏花直播方案
- 钢结构防腐蚀技术与措施
- 《琵琶行并序》课件
- 2024年广东省液化石油气行业分析报告及未来发展趋势
评论
0/150
提交评论