统计学原理第5章-相关分析与回归分析-课件_第1页
统计学原理第5章-相关分析与回归分析-课件_第2页
统计学原理第5章-相关分析与回归分析-课件_第3页
统计学原理第5章-相关分析与回归分析-课件_第4页
统计学原理第5章-相关分析与回归分析-课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章相关分析与回归分析

第五章相关分析与回归分析1第一节变量间的相关关系一、相关关系的概念(注意相关关系与函数关系的区别)

(一)函数关系

它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。

例如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。第一节变量间的相关关系一、相关关系的概念(注意相关关系与函2(函数关系)(1)是一一对应的确定关系(2)设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量(3)各观测点落在一条线上

xy(函数关系)(1)是一一对应的确定关系xy3(函数关系)

函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)圆的面积(S)与半径之间的关系可表示为S=r2

企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x3

(函数关系)函数关系的例子4(二)相关关系

它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:1.现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。(二)相关关系它反映着现象之间的数量上不严格的依存关5(二)相关关系的情况1.受干扰的因果关系,如:汽车的行驶里程与耗油量,二者成正比,但受道路、风速、驾驶特点等因素影响,使这一明显的因果关系产生了波动,从而体现出非决定性的关系;2.同一原因的诸多结果之间的关系如:人的体重与裤长,它们都基本取决于身高,呈正相关关系,但二者直接不存在因果关系;3.因果关系不同而局部出现相同走势,如:我国近年来的“吸烟人数”与GDP成正相关关系,这两个变量基本上互相独立,在一段时间出现相同的走向,只能形成局部的解释,而无法找出因果关系。(二)相关关系的情况1.受干扰的因果关系,2.同一原因的诸6

在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。在具有相互依存关系的两个变量中,作为根据的变量称自变量7

相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品的消费量(y)与物价(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系相关关系的例子8(相关关系)(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量x取某个值时,变量y的取值可能有几个;(4)各观测点分布在直线周围。

xy(相关关系)(1)变量间关系不能用函数关系精确表达;9二、相关关系的种类

二、相关关系的种类101.按相关关系的性质来分,可分为:

正相关和负相关正相关是指两相关现象变化的方向是一致的。

负相关是指两相关现象变化的方向是相反的。1.按相关关系的性质来分,可分为:

正相关和负相关正相关112.按相关关系的形式来分,可分为:

线性相关和非线性相关

线性相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。

非线性相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。2.按相关关系的形式来分,可分为:

线性相关和非线性123.按相关关系涉及的因素多少来分,可分为:单相关、复相关和偏相关。

在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。

二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。

三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。3.按相关关系涉及的因素多少来分,可分为:单相关、复相关和偏13第二节简单线性相关分析

一、相关表和相关图第二节简单线性相关分析一、相关表和相关图14某市1998年—2005年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。

序号年份工资性

现金支出(万元)x城镇储蓄存款余额(万元)y119985001202199954014032000620150420017302005200290028062003970350720041050450820051170510例1某市1998年—2005年的工资性现金支出与城镇储蓄存款15统计学原理第5章-相关分析与回归分析-课件16企业按销售额分组(万元)流通费用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58例2企业按销售额分组(万元)流通费用率(%)4以下9.65417(二)相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。(二)相关图:又称散点图。将x置于横轴上,y置于纵轴上,将18二、相关系数

相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号r表示。二、相关系数相关系数是在直线相关条件下,表明两19r的测定方法:r的测定方法:20仍以上例1资料计算:序号年份x(万元)y(万元)11998500120-310-15596100240254805021999540140-270-13572900182253645032000620150-190-12536100156252375042001730200-80-75640056256000520029002809058100254506200397035016075256005625120007200410504502401755760030625420008200511705103602351296005522584600合计64802200--432400155000253300仍以上例1资料计算:序年xy11998500120-3121经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着22对r的解释如下:(即r的特点)(1)r取正值或负值决定于分子协方差;(2)r的绝对值,在0与1之间;(3)r的绝对值大小,可说明现象之间相关关系的紧密程度。对r的解释如下:(即r的特点)(1)r取正值或负值决定于分232.简捷法

2.简捷法24资料计算如下:序号年份x(万元)y(万元)x2y2xy119985001202500001440060000219995401402916001960075000320006201503844002250093000420017302005329004000014600052002900280810000784002520006200397035094090012250033950072004105045011025002025004725008200511705101368900260100596700合计6480220056812007600002035300资料计算如下:序号年份x(万元)y(万元)x2y2xy1125统计学原理第5章-相关分析与回归分析-课件26三、简单线性相关分析的特点

通过对r的计算方法的讨论,可看出二个明显特点:2.相关关系中只能计算出一个相关系数r。1.相关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;三、简单线性相关分析的特点通过对r的计算方法的讨论,可看出27第三节一元线性回归分析

在回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性(直线)回归和非线性(曲线)回归之分。第三节一元线性回归分析在回归分析中,两个变量之间的回28一、回归分析的概念

回归分析是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。一、回归分析的概念回归分析是指对具有相关关系的现象,根据29二、回归分析的方法(一)简单直线回归分析简单直线回归方程的一般形式为:

yc=a+bx

yc——因变量的估计值;x——自变量;a——回归直线在y轴上的截距;b——回归直线的斜率,称回归系数,表明x每增加一个单位,因变量yc的平均变化值b>0,x与y为正相关b<0,x与y为负相关二、回归分析的方法(一)简单直线回归分析简单直线回归方程的30

a、b的确定:

在简单直线回归方程中,a、b为待定系数,常用最小平方法来确定,即∑(y-yc)2=最小值。a、b的确定:在简单直线回归方程中,a、b为待定系数,31简单直线回归方程建立的步骤为:

①确定自变量x和因变量y;②计算x2、xy、Σx、Σy、Σx2、Σxy;③代入公式,先求b,再求a。简单直线回归方程建立的步骤为:①确定自变量x和因变量y;32仍用上例1资料得到:yc=-199.5+0.5858x表明该市工资性现金支出每增加1万元,储蓄存款余额就增加0.5858万元。仍用上例1资料得到:33举例说明b(回归系数)在经济管理中的作用:

某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:yc=77.36-1.818x,其中,x表示月产量(千件)y表示单位成本(元);a=77.36(元),表示生产这种产品在单位成本方面的条件;b=-1.818,表示月产品每增加1000件,单位成本平均降低1.818元。举例说明b(回归系数)在经济管理中的作用:某企业的某种产品34简单直线回归分析的主要特点:

1.直线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。

2.在两个现象互为根据的情况下,可以有两个回归方程:yc=a+bx称y倚x回归直线xc=c+dy称x倚y回归直线简单直线回归分析的主要特点:1.直线回归分析时,要根据35三、估计标准误差

(一)、估计标准误差的概念和作用

估计标准误差就是用来说明回归方程推算结果的准确程度的统计分析指标。以绝对值表示,其数值越小,说明推算结果的准确程度越高,回归直线的代表性也越大。用Syx表示,也可用Sy表示。三、估计标准误差(一)、估计标准误差的概念和作用估计36(二)、估计标准误差的计算方法

1.定义公式:(二)、估计标准误差的计算方法1.定义公式:37Sy和r的异同点:相同点:都具有说明相关关系密切程度的作用;不同点:(1)r越大越好,而Sy越小越好;(2)r用相对数表现,密切程度的概念比较明确Sy用绝对数表现,关系密切的程度表示得不那么明显;(3)r能说明正、负相关,Sy不能说明。Sy和r的异同点:相同点:都具有说明相关关系密切程度的作用;38四、可化为线性回归的非线性回归

拟合方法:统计上通常采用变量代换法把非线性形式转换为线性形式处理,使线性回归分析的方法也能适用于非线性回归问题的研究。四、可化为线性回归的非线性回归拟合方法:统计上通常采用39几种常见的非线性模型

指数函数线性化方法两端取对数得:lny

=ln

+

x令:y'=lny,则有y'

=ln

+

x基本形式:图像

几种常见的非线性模型指数函数线性化方法基本形式:图40几种常见的非线性模型

幂函数线性化方法两端取对数得:lgy=lg+lgx令:y'=lgy,x'=lgx,则y'=lg+x'基本形式:图像0<<1

1

=1-1<

<0

<-1

=-1几种常见的非线性模型幂函数线性化方法基本形式:图0<41几种常见的非线性模型

双曲线函数线性化方法令:y'=1/y,x'=1/x,则有y'=+x'基本形式:图像

<0

>0几种常见的非线性模型双曲线函数线性化方法基本形式:图像42几种常见的非线性模型

对数函数线性化方法x'=lgx,则有y'

=

+

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论