第七章 相关与回归分析课件_第1页
第七章 相关与回归分析课件_第2页
第七章 相关与回归分析课件_第3页
第七章 相关与回归分析课件_第4页
第七章 相关与回归分析课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章相关与回归分析第一节相关分析的一般问题第二节相关关系的判断第三节回归分析的一般问题第四节回归模型的建立与检测2024/11/81第七章相关与回归分析第一节相关分析

一、相关分析的意义二、相关关系的测定2024/11/82第七章相关与回归分析变量间的关系变量间的关系有两种类型:函数关系和相关关系。函数关系——是一一对应的确定关系。设有两个变量x和y,变量y完全依赖于x

,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量。例如:圆的面积(S)与半径之间的关系可表示为S=

R2

;某种商品的销售额(y)与销售量(x)之间的关系可表示为y=p

x(p为单价)2024/11/83第七章相关与回归分析相关关系——变量间确实存在、但数量上不固定的相互依存。这种关系不能用函数关系精确表达;一个变量的取值不能由另一个变量惟一地确定;当变量x取某个值时,与之相关的变量y的取值可能有若干个;各观测点分布在一条直线或曲线周围.2024/11/84第七章相关与回归分析相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度之间的关系(x)父亲身高(y)与子女身高(x)之间的关系……2024/11/85第七章相关与回归分析相关关系的特点(见154页)相关关系和函数关系,既有联系又有区别。在实际工作中,对表现为函数关系的现象的测量由于种种原因,每次观测值都不可能完全相同,这时函数关系就表现为相关关系。在研究相关关系时,又常常要用函数形式来表现,以便得到相关关系的一般数量表达式形式。因此,相关关系是相关分析的研究对象,函数关系是相关分析的必要工具。2024/11/86第七章相关与回归分析相关关系的类型1、按相关关系涉及的因素多少分为:单相关——一元相关,两变量间的相关关系;复相关——多元相关,三个(或以上)变量间的相关关系;2、按相关的表现形态分为:直线相关——观察点的分布大致呈现为一条直线;曲线相关——观察点的分布大致呈现为一条曲线2024/11/87第七章相关与回归分析3、按相关方向分为:正相关——两变量大体上呈同方向变化;负相关——两变量大体上呈反方向变化。4、按相关密切程度分:完全相关——两变量间有确定函数关系。不完全相关——两变量不存在严格函数关系。不相关——当一个变量变化,另一个变量不变化或呈不规则变化或没有依存关系。2024/11/88第七章相关与回归分析二、相关关系的测定进行相关分析的一般程序:定性分析定量分析相关表和相关图计算相关系数与判定系数2024/11/89第七章相关与回归分析(一)相关表和相关图相关表——将一个变量按大小顺序排序,另一个变量对应排列而成的表格。(见P156表9-1)相关图——也称为散点图。一对数据对应坐标图上一个点,将成对的观察数据表现为坐标图的散点而形成的图。(见P158图9—1)编制相关表、图的意义——有助于分析者判断相关的有无、方向、形态、密切程度。2024/11/810第七章相关与回归分析相关关系的图示完全正线性相关

完全负线性相关

负线性相关

正线性相关

不相关

非线性相关2024/11/811第七章相关与回归分析(二)相关系数和判定系数都是对变量之间关系密切程度的度量;判定系数=相关系数的平方;不同类型的相关,相关系数的计算方法也不同.对两个变量之间线性相关程度的度量称为简单相关系数(也称直线相关系数),常简称相关系数.此外还有复相关系数、非线性相关系数、偏相关系数3.有总体相关系数与样本相关系数之分:总体相关系数ρ——根据总体数据计算的,样本相关系数

r——根据样本数据计算的。2024/11/812第七章相关与回归分析相关关系的计算公式或化简为见P161公式〔9-2〕2024/11/813第七章相关与回归分析相关系数取值及其意义r

的取值范围是[-1,1]|r|=1,为完全相关;r=1,为完全正相关r=-1,为完全负相关

r=0,不存在线性相关关系相关;-1

r<0,为负相关;0<r

1,为正相关2024/11/814第七章相关与回归分析|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切。相关程度的三级划分法:

|r|<0.3,微相关或不相关

0.3≤|r|<0.5,低度相关

0.5≤|r|<0.8,

显著相关

r的绝对值在0.8以上的为高度相关

一般情况下,只有r的绝对值在0.5以上,才进一步进行相关分析。2024/11/815第七章相关与回归分析第三节回归分析的一般问题一.回归分析的意义一元线性回归方程的确定回归估计的标准差2024/11/816第七章相关与回归分析一、回归分析的意义从一组样本数据出发,确定变量之间的数学关系式——建立回归模型;借助于数学模型来表达变量之间的平均数量关系对这些关系式的可信程度进行各种统计检验并从某一特定变量的诸多影响因素(变量)中找出哪些变量的影响显著,哪些不显著;利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。2024/11/817第七章相关与回归分析回归分析与相关分析的区别相关分析中,变量x、变量y处于平等地位。回归分析中,y为因变量,处在被解释的地位;x为自变量,用于解释和预测因变量的变化。2.相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x

可以是随机变量,也可以是非随机的确定变量。3.相关分析主要描述两个变量之间相关关系的密切程度;回归分析揭示变量之间数量变动的统计规律性(不仅可以由回归方程揭示变量x对变量y的平均影响大小,还可以进行预测和控制)。2024/11/818第七章相关与回归分析回归模型的类型

回归模型(方程)——来表达变量之间的平均数量关系的数学模型。该模型中包含:1个因变量(被解释变量,通常为数值型的)1个或多个自变量(解释变量,通常为数值型的或分类的)包含一个自变量的回归模型称为一元回归模型;包含多个自变量的回归模型称为多元回归模型。按模型形态分,有线性回归和非线性回归。2024/11/819第七章相关与回归分析二、一元线性回归方程的确定具有线性相关关系的两个变量的关系可表示为:

y=α

+b

x线性部分反映了由于x的变化而引起的y的变化.α和

称为模型的两个待定参数。2024/11/820第七章相关与回归分析(总体)回归方程描述y的平均值或期望值如何依赖于x的方程称为(总体的)回归方程;一元线性(总体)回归方程的形式如下:

E(y)=α

+

x方程的图示是一条直线,因此也称为直线回归方程α是回归直线在y轴上的截距,是当x=0时y的期望值,是回归直线是起始值;

是直线的斜率,表示当x每变动一个单位时,y的平均变动值。2024/11/821第七章相关与回归分析样本(估计的、经验的)回归方程总体回归参数α和

是未知的,我们必须利用样本数据去估计它们;用样本统计量a、b代替回归方程中的未知参数α和,就得到了样本回归方程(估计的回归方程):拟合估计方程,就是要估计方程的参数a、b2024/11/822第七章相关与回归分析估计参数的最小二乘法

最小平方法(LS)可用于直线回归,也可用于曲线回归。用最小平方法拟合的直线来代表x与y之间的关系,所产生的估计值与实际值的误差要比其他任何直线的误差都小。1.

最小平方法——使因变量的观察值与估计值之间的离差平方和达到最小来求得a和b的方法,即:2024/11/823第七章相关与回归分析a和b

的计算公式根据最小平方法的原则,利用微分求解极值(最优值)的原理,可得求解a

和b

的标准方程组如下:2024/11/824第七章相关与回归分析三、回归估计标准误差(一)回归估计标准误差的概念实际观察值y与估计值之间差异的平均程度,是用来说明回归方程推算结果的准确程度或可靠性的分析指标,用表示计算公式为(P166页9-8)和(P166页9-9):2024/11/825第七章相关与回归分析回归估计标准差的作用

回归估计标准差反映的是因变量各实际值与其回归估计值之间的平均差异程度;表明其估计值对各实际值的代表性的强弱,其值越小,估计值(或回归方程)的代表性越强,用回归方程估计或预测的结果越准确。说明了回归直线的拟合程度(衡量回归方程的代表性,测定回归估计的精度);反映实际观察值在回归直线周围的分散状况;2024/11/826第七章相关与回归分析回归估计标准误差与一般的标准差的异同从计算公式可见:同:都是离差的平方的平均数的平方根;反映平均差异程度;衡量代表性大小。主要区别:与什么的离差、差异;衡量谁的代表性。2024/11/827第七章相关与回归分析回归估计标准差与相关系数的关系大样本条件下,近似地:或:见P167公式〔9—11〕2024/11/828第七章相关与回归分析相关系数与回归系数的关系见167页〔例9-3〕2024/11/829第七章相关与回归分析第三节线性相关的显著性检验检验两个变量之间是否存在线性相关关系,包括两个方面的检验:1.对相关系数r的显著性检验;对回归系数b的显著性检验;对于一元线性相关而言,二者等价。2024/11/830第七章相关与回归分析例根据下表提供的资料确定直线回归方程,计算估计标准误差。企业编号生产性固定资产价值总产值131852429201019320063844092155415913企业编号生产性固定资产价格总产值6502928731460381210151691022121910122516242024/11/831第七章相关与回归分析解第1步:应先确定自变量和因变量。按本题所述,生产性固定资产价值为自变量,总产值为因变量。第2步:对数据进行下列计算:2024/11/832第七章相关与回归分析(续)回归参数中:

2024/11/833第七章相关与回归分析(续)第3步:计算估计标准误差。用公式:2024/11/834第七章相关与回归分析练习题一、判断题1、在计算相关系数时,要求两个变量都是随机的;在回归分析中,要求因变量是随机的,自变量是非随机的。()2、变量X和变量Y之间存在相关关系,当X按固定数额增加时,相应地,变量Y按大致固定的数额减小,说明两变量之间存在着负直线相关关系。()2024/11/835第七章相关与回归分析(续)3、相关系数的数值越大;说明相关程度越高,相关系数的数值越小,说明相关程度越低。()4、变量之间相关关系的形式可能是多种多样的,变量间线性相关系数的大小,只能说明变量间直线相关的方向和程度。()5.估计标准误差的大小与因变量的方差无关。()2024/11/836第七章相关与回归分析二、单项选择题1、当变量X按一定数额变化时,变量Y也随之近似地按一定数额变化,这时,变量X和Y之间存在着()关系。

A、正相关B、负相关

C、直线相关D、曲线相关2、若变量X增加时,变量Y的值也增加,那么变量X和Y之间存在着()关系。

A、正相关B、负相关

C、直线相关D、曲线相关CA2024/11/837第七章相关与回归分析(续)3、如果两变量之间的相关系数为-1,说明两变量之间存在()关系。

A、无相关B、低度相关

C、高度相关D、完全相关4、在回归分析中,自变量同因变量地位不同,两变量X与Y中,Y倚X回归同X倚Y回归是()

A、同一个问题B、有联系但意义不同的问题C、一般情况下是相同的问题D、是否相同,视两相关变量的具体内容而定。DB2024/11/838第七章相关与回归分析(续)5、已知某企业棉大衣产量和生产成本有直接关系,具体说来,是直接相关关系,当产量为1000件时,其生产成本为30000元,其中不变成本为6000元。该企业总生产成本倚产量的回归方程应是()。

A2024/11/839第七章相关与回归分析2024/11/840第七章相关与回归分析第四节可线性化的曲线回归方程(非线性回归)一、配合回归曲线的问题通过定性分析或散点图判断变量之间的曲线相关形态,选择曲线模型;2. 可通过变量代换将曲线模型转换成线性形式;用最小二乘法求出线性模型中参数的估计值,再转换为原曲线模型的参数的估计值。(注:并非所有的非线性模型都可以化为线性模型)2024/11/841第七章相关与回归分析可线性化的常用曲线模型

线性化方法:令:y'=1/y,x'=1/x,则有y'

=

+

x'(一)双曲线1.基本形式:1/y=

+

/x图

<0

>02024/11/842第七章相关与回归分析线性化方法:两端取对数lgy=lg

+

lg

x令:y'=lgy,x'=lgx,则y'

=lg

+

x'(二)幂函数基本形

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论