版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中级经济师
《经济基础知识:经济学基础》
第23章相关与回归分析12023/2/3一、相关关系的概念(一)函数关系与相关关系1.函数关系
函数关系指变量之间具有的严格的确定性的依存关系。当一个或几个变量取一定的值时,另一个变量有确定值与之相对应。函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为
y=p
x(p为单价)圆的面积(S)与半径R之间的关系可表示为S=R2
企业的原材料消耗额(y)与产量(x1)
、单位产量消耗(x2)
、原材料价格(x3)之间的关系可表示为y=x1x2x3
2023/2/3xy(1)变量之间数值是一一对应的确定关系,可用一个数学表达式表示。(2)设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量;(3)各观测点落在一条线上。函数关系的特点:2023/2/32.相关关系
指客观现象之间确实存在的但数量上不是严格对应的依存关系。即变量间关系不能用函数关系精确表达,当变量x取某个值时,变量y的取值可能有几个。相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系2023/2/3相关关系的特点:xy(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量x取某个值时,变量y的取值可能有几个;(4)各观测点分布在直线附近。2023/2/3函数关系与相关关系的联系函数关系往往通过相关关系表现出来。把影响因变量变动的因素全部纳入方程,这时的相关关系就有可能转化为函数关系。相关关系经常可以用一定的函数形式去近似地描述。2023/2/3例:有数据显示世界各国平均每人拥有电视机数x及居民预期寿命y之间有很强的正相关,可否认为电视机很多的国家,居民预期寿命比较长?有人测试出火灾现场的消防员人数和该场火灾造成的损害之间有很强的正相关,可否认为派出的消防员越多造成的损害越大?(二)相关关系与因果关系因果关系∈相关关系;现象之间是因果关系同时是相关关系,但是相关关系不一定是因果关系。统计只能说明现象间有无数量上的关系,不能说明谁因谁果。确定因果关系的方法——定性分析。2023/2/3自变量:是引起某种结果变化的原因,它是可以控制、给定的值,常用x表示;因变量:是自变量变化的引起结果量,它是不确定的值,常用y表示。它们的表现形式有:一种原因引起一种结果;多种原因引起一种结果;还有变量之间是互为因果的关系。相关分析时,一般不区分原因和结果。自变量与因变量2023/2/3二、相关关系的种类
1.按相关的程度分完全相关:当一个变量的变化完全由另一个变量所决定时,称变量间的这种关系为为完全相关关系,这种严格的依存关系实际上就是函数关系。不相关:当两个变量的变化相互独立、互不影响时,称这两个变量不相关(或零相关)。不完全相关:当变量之间存在不严格的依存关系时,称为不完全相关。不完全相关关系是现实当中相关关系的主要表现形式,是相关分析的主要研究对象。2023/2/32.按相关的方向正相关:当一个变量随着另一个变量的增加(减少)而增加(减少),即两者同向变化时,称为正相关。如家庭收入与家庭支出之间的关系。负相关:当一个变量随着另一个变量的增加(减少)而减少(增加),即两者反向变化时,称为负相关。如产品产量与单位成本之间的关系,单位成本会随着产量的增加而减少。2023/2/33、
按相关的形式线性相关:当变量之间的依存关系大致呈现为线性形式,即当一个变量变动一个单位时,另一个变量也按一个大致固定的增(减)量变动,就称为线性相关。非线性相关:当变量间的关系不按固定比例变化时,就称之为非线性相关。2023/2/34.按研究变量的多少单相关:两个变量之间的相关,称为单相关。复相关:一个变量与两个或两个以上其他变量之间的相关,称为复相关。偏相关:在复相关的研究中,假定其他变量不变,专门研究其中两个变量之间的相关关系时称其为偏相关。注意:并非所有的变量之间都存在相关关系,因此需要用相关分析方法来识别和判断。一、变量之间的相关关系
13分类标准类别内含相关的程度完全相关一个变量的取值变化完全由另一个变量的取值变化所确定。称这两个变量完全相关。如价格不变的条件下,某种商品的销售总额由其销售量决定。不完全相关介于完全相关和不相关之间。大部分相关现象均属于不完全相关。不相关两个变量的取值变化彼此互不影响。如股票的价格与气温的高低。相关的方向正相关一个变量的取值由小变大,另一个变量的取值也相应的由小变大。(两个变量同方向变化)。负相关一个变量的取值由小变大,另一个变量的取值由大变小(两个变量反方向变化)相关的形式线性相关两个相关变量之间的关系大致呈现为线性关系。非线性相关两个相关变量之间的关系不表现直线的关系,而近似于某种曲线方程的关系。2023/2/3相关分析的主要内容1.确定现象之间有无关系?2.有什么样的关系?3.关系的强弱?5.是否伪关系?4.总体也有这种关系吗?2023/2/3定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。相关分析的方法2023/2/3(一)相关表相关表是一种反映变量之间相关关系的统计表。对于两个基本变量x和y,通过观察和实验,我们可以得到关于x和y的若干组数据,记为(,)(i=1,2,…,n)。将这些数据按的值由小到大(或由大到小)以序列表表示,即构成相关表。举例:某地区居民人均收入水平(x)与食品支出占生活费支出的比重(y)之间具有相关关系,编制相关表如下表:人均收入水平
(x)/元
2803403905306506707908809101050食品支出占生活费支出的比重
(y)/%68.367.566.264.956.760.254.449.050.543.62023/2/3用直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。根据上例资料绘制的相关图(二)散点图(相关图)2023/2/3(a)正相关\直线相关(b)负相关\直线相关(c)正相关\曲线相关x与y关系散点图的主要类型2023/2/3(d)负相关\曲线关系(e)负相关直线相关(相关程度较小)(f)不相关2023/2/3(三)相关系数(相关关系的测度)相关系数的意义:(1)对变量之间关系密切程度的度量;(2)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为;若是根据样本数据计算的,则称为样本相关系数,记为r;(3)对两个变量之间线性相关程度的度量称为简单相关系数;(4)将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。2023/2/31、由未分组资料计算相关系数公式:积差法以两个变量与各自均值的离差为基础,通过两个离差相乘来反映变量之间相关程度。基本公式:
其中,x和y的协方差x的标准差y的标准差相关系数的计算:2023/2/3上述公式还可以变换为其它形式,如:2023/2/32、由变量数列资料计算相关系数公式:2023/2/3-1.0+1.00-0.5+0.5无线性相关负相关程度增加r正相关程度增加完全负相关完全正相关3、相关系数取值及其意义相关系数的值介于–1与+1之间,即–1≤r≤+1。2023/2/3(1)当r>0时,表示两变量正相关,r<0时,两变量为负相关;(2)当|r|=1时,表示两变量为完全线性相关,即为函数关系;(3)当r=0时,表示两变量间无线性相关关系,它并不意味着X与Y之间不存在其他类型的关系;(4)当0<|r|<1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱;(5)通常判断的标准是:|r|<0.3为微弱相关;0.3≤|r|<0.5为低度相关;0.5≤|r|<0.8称为显著相关;
0.8≤|r|<1称为高度相关或强相关。2023/2/34、相关系数取正值或是负值,与分子有直接的关系.它可能出现以下情况:1)所有相关点都为正相关,则>0,说明两变量之间正线性相关;2)所有相关点都为负相关,则<0,说明两变量之间负线性相关;3)在全部相关点中,既有正相关、又有负相关和零相关,这时计算协方差时就会出现正负抵消。抵消的结果为正数,为正相关;为负数就是负相关。2023/2/3【例】根据上述资料,计算人均消费与人均国内生产总值的直线相关系数。2023/2/3将上表计算结果代入公式为:相关系数较大,这说明人均消费额与人均国内生产总值高度相关。2023/2/3四、相关分析中应注意的问题
(一)相关系数是说明变量之间线性联系程度的,相关系数很小的变量间可能存在非线性联系。(二)相关系数不能解释两变量间的因果关系,警惕虚假相关导致的错误结论。(三)不要在相关关系据以成立的数据范围以外,推论这种相关关系仍然保持。第二节回归分析
【本节考点】回归分析的概念一元线性回归模型30
相关分析与回归分析的联系●共同的研究对象:都是对变量间相关关系的分析●只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义●相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析●相关分析中相关系数的确定建立在回归分析的基础上相关分析与回归分析回归的古典意义:
高尔顿遗传学的回归概念
父母身高与子女身高的关系:
无论高个子或低个子的子女都有向人的平均身高回归的趋势一、回归分析的含义什么是回归分析回归分析是对具有相关关系的变量拟合数学方程,通过一个或一些变量的变化解释另一变量变化的方法。一、回归分析的含义什么是回归回归是由英国著名统计学家FrancisGalton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们父母那样高。比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量之间数量关系的方法称为回归分析。回归的现代意义一个因变量对若干解释变量依存关系的研究回归的目的(实质):
由固定的自变量去估计因变量的平均值样本总体自变量固定值估计因变量平均值回归分析的内容和步骤根据理论和对问题的分析判断,区分自变量(即解释变量)和因变量(即被解释变量);从一组样本数据出发,设法确定合适的数学方程式(即回归模型regressionmodel)描述变量间的关系;对数学方程式(回归模型)的可信程度进行统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著;利用数学方程式(回归模型),根据一个或几个自变量的取值来估计或预测因变量的取值,并给出这种估计或预测的精确程度。回归分析与相关分析的区别相关分析中,变量x
与y处于平等地位;回归分析中具有相关关系的变量之间地位是非对等的,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x
可以是随机变量,也可以是非随机的确定变量相关分析主要描述变量之间相关关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行估计和预测回归模型的类型按涉及变量多少分为:一元回归和多元回归按变量相关的形式分:线性回归和非线性回归(本节仅讨论一元回归分析问题)一个自变量两个及以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归回归分析与相关分析的关系(一)联系1.它们具有共同的研究对象。2.在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有高度相关时,进行回归分析寻求其相关的具体形式才是有意义的。39回归分析与相关分析的关系(二)区别相关分析与回归分析在研究目的和方法上具有明显的区别1、相关分析研究变量之间相关的方向和相关的程度。2、回归分析是研究变量之间相关关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要方法。40二、一元线性回归模型
1、一元线性回归模型一元线性回归模型,是研究两个变量之间相关关系的最简单的回归模型。为模型的参数;即误差项,是一个随机变量。X为自变量。一元线性回归只涉及一个自变量。描述因变量如何依赖自变量和误差项的方程称为回归模型。在现实中,模型的参数
都是未知的,需要利用样本数据去估计,采用的估计方法是最小二乘法。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计
的方法。41二、一元线性回归模型
2、回归模型的拟合效果分析一般情况下,使用估计的回归方程之前,需要对模型进行检验,其内容包括:(1)结合经济理论和经验分析回归系数的经济含义是否合理;(2)对模型进行假设检验。42二、一元线性回归模型
(3)分析估计的模型对数据的拟合效果如何(用决定系数来测度)决定系数,也称为R2,可以测度回归直线对样本数据的拟合程度。决定系数的取值在0到1之间,大体说明了回归模型所能解释的因变量变化占因变量总变化的比例。决定系数越接近1,回归直线的拟合效果越好。R2=1,说明回归直线可以解释因变量的所有变化。R2=0,说明回归直线无法解释因变量的变化,因变量的变化与自变量无关。43二、一元线性回归模型及其参数的估计
㈠一元线性回归模型的设定对于只涉及一个自变量的回归分析,若因变量y与自变量x之间为线性关系,可以用一个线性方程来表示二者之间的关系,此方程为一元线性回归模型。通常先要收集若干(n)组样本数据(xi,yi,i=1,2,…,n),然后将数据绘制散点图,若图中显示x和y之间大致呈线性关系,就可以用一元线性回归方程来描述这种关系。一元线性回归模型(理论模型)一元线性回归模型可表示为
y=b0+b1x+e此模型将变量y与x间的关系用两部分描述。一部分是由x的变化引起y线性变化的部分,即:另一部分是由其他随机因素引起y线性变化的部分,记为ε。该回归模型表达了变量x与y之间密切相关、但还没有到y由x唯一确定的密切程度的关系。模型中,一般称y为被解释变量(因变量),x为解释变量(自变量)。β0和β1为模型的参数,又称回归系数。ε为随机误差项,又称随机干扰项,表示除能用x和y之间线性关系解释的因素外的其他随机因素对y的影响。一元线性回归模型(理论模型的基本假定)误差项ε是一个不可观测的且期望值为0的随机变量,即E(ε)=0。对一个给定的x值,y的期望值为E(y)=0+
1x对于所有的x值,ε的方差σ2都相同。误差项ε是一个服从正态分布的随机变量,且相互独立,即ε~N(0,σ2)独立性意味着对于一个特定的x值,它所对应的ε与其他x值所对应的ε不相关对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关一元线性回归模型(应用模型)
由于ε为随机因素不可观测,其期望值为0,所以通常用y的数学期望E(y)
作为y的估计,即
E(y)=0+1x由于总体回归参数0和1是未知的,必须利用样本数据估计,所以用样本统计量和代替回归方程中的未知参数0和1,就得到了应用的估计一元线性回归方程式中:是y的估计值,表示对于一个给定的x值,估计的y的期望值,是估计的回归直线在y轴上的截距,是当x=0时y的期望值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重庆人文科技学院《学院通选课传统文化艺术》2021-2022学年第一学期期末试卷
- 重庆人文科技学院《程序设计与实践实验》2022-2023学年期末试卷
- 重庆财经学院《智慧城市》2022-2023学年期末试卷
- 安全质量标准化图牌板管理制度
- 重庆三峡学院《工程制图》2022-2023学年第一学期期末试卷
- 重庆三峡学院《电脑三维渲染设计》2021-2022学年期末试卷
- 重庆人文科技学院《近世代数》2022-2023学年第一学期期末试卷
- 2021医师定期考核题库及答案
- 茶叶后期管护方案
- 重庆财经学院《数据分析与挖掘》2022-2023学年期末试卷
- 2024年麻醉药品及精神药品合理应用培训考试试题
- 2024-2025学年新教材高中物理 第一章 动量守恒定律 1 动量教案 新人教版选择性必修第一册
- 农村户改厕施工协议书
- 药事管理实训报告
- 品管圈PDCA持续质量改进提高静脉血栓栓塞症规范预防率
- 儿童支气管哮喘规范化诊治建议(2020年版)
- 2023年人教版中考物理专题复习-九年级全册简答题专题
- ISO28000:2022供应链安全管理体系
- 屋顶光伏发电应急预案
- 保护性约束课件
- 当代艺术与传统文化的交流与融合
评论
0/150
提交评论