统计学第5章相关与回归分析_第1页
统计学第5章相关与回归分析_第2页
统计学第5章相关与回归分析_第3页
统计学第5章相关与回归分析_第4页
统计学第5章相关与回归分析_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章相关与回归分析

统计学第5章相关与回归分析共60页,您现在浏览的是第1页!教学目的与要求相关与回归分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。本章详细讲述了相关分析的概念、相关关系的确定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。统计学第5章相关与回归分析共60页,您现在浏览的是第2页!本章主要内容相关的意义和任务

简单线性相关分析回归分析估计标准误统计学第5章相关与回归分析共60页,您现在浏览的是第3页!(二)相关关系

它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:1.现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。统计学第5章相关与回归分析共60页,您现在浏览的是第4页!1.按相关关系涉及的因素多少来分,可分为:

单相关和复相关。

在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为偏相关。二因素之间的相关关系称单相关,即只涉及一个自变量和一个因变量。三个或三个以上因素的相关关系称复相关,或多元相关,即涉及二个或二个以上的自变量和因变量。二、相关关系的种类

统计学第5章相关与回归分析共60页,您现在浏览的是第5页!3.按相关关系的形式来分,可分为:

直线相关和曲线相关

直线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。

曲线相关是指两个相关现象之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。统计学第5章相关与回归分析共60页,您现在浏览的是第6页!三、相关分析的任务和内容

相关分析的主要任务,概括起来是两个方面:一方面,研究现象之间关系的密切程度,即相关分析;另一方面,研究自变量与因变量之间的变动关系,即回归分析。统计学第5章相关与回归分析共60页,您现在浏览的是第7页!第二节简单线性相关分析

一、相关表和相关图相关图,也称散布图(或散点图)。统计学第5章相关与回归分析共60页,您现在浏览的是第8页!企业按销售额分组(万元)流通费用率(%)4以下9.654~87.688~127.2512~167.0016~206.8620~246.7324~286.6428~326.6032~366.58例2统计学第5章相关与回归分析共60页,您现在浏览的是第9页!r的测定方法:统计学第5章相关与回归分析共60页,您现在浏览的是第10页!经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。统计学第5章相关与回归分析共60页,您现在浏览的是第11页!积差法公式进一步化简如下:统计学第5章相关与回归分析共60页,您现在浏览的是第12页!资料计算如下:序号年份x(万元)y(万元)x2y2xy119965001202500001440060000219975401402916001960075000319986201503844002250093000419997302005329004000014600052000900280810000784002520006200197035094090012250033950072002105045011025002025004725008200311705101368900260100596700合计6480220056812007600002035300统计学第5章相关与回归分析共60页,您现在浏览的是第13页!三、简单线性相关分析的特点

通过对r的计算方法的讨论,可看出二个明显特点:2.相关关系中只能计算出一个相关系数r。1.相关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;统计学第5章相关与回归分析共60页,您现在浏览的是第14页!一、一元线性回归总体一元线性回归分析总体一元线性回归方程的一般形式为:y

——因变量的估计值;x——自变量;——回归直线在y轴上的截距;——回归直线的斜率,称回归系数,表明x每增加一个单位,因变量y的平均变化值>0,x与y为正相关<0,x与y为负相关统计学第5章相关与回归分析共60页,您现在浏览的是第15页!配合直线回归方程的方法配合直线回归方程的过程就是求解方程系数a、b的过程,求解a、b的方法一般采用最小平方法。用最小平方法配合回归直线的基本思想是:在所有的相关点中,通过数学方法配合一条较为理想的直线,这条直线必须满足两点:2、原数列与估计线的离差平方和为最小值。即1、原数列与估计线的离差之和为零。即:第八章相关分析统计学第5章相关与回归分析共60页,您现在浏览的是第16页!简单直线回归方程建立的步骤为:

①确定自变量x和因变量y;②计算x2、xy、Σx、Σy、Σx2、Σxy;③代入公式,先求b,再求a。统计学第5章相关与回归分析共60页,您现在浏览的是第17页!举例说明b(回归系数)在经济管理中的作用:

某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:yc=77.36-1.818x,其中,x表示月产量(千件)y表示单位成本(元);a=77.36(元),表示生产这种产品在单位成本方面的条件;b=-1.818,表示月产品每增加1000件,单位成本平均降低1.818元。

统计学第5章相关与回归分析共60页,您现在浏览的是第18页!例:根据某地区家计调查资料知,每户平均月收入6800元,均方差800元,每户平均月消费支出5200元,方差40000,支出对于收入的回归系数为0.2,要求:

(1)计算收入与支出的相关系数;(2)拟合支出对于收入的回归方程;(3)估计收入每增加1元,支出平均增加额;(4)估计该地区月收入为6000元时的家庭消费支出。统计学第5章相关与回归分析共60页,您现在浏览的是第19页!例:5位同学的统计学的学习时间与成绩分数

如下表:要求:(1)编制线性回归方程;(2)计算估计标准误;(3)对学习成绩的方差进行分解分析,指出总误差平方和中有多少比重可由回归方程来解释;(4)计算学习时间与学习成绩之间的相关系数。统计学第5章相关与回归分析共60页,您现在浏览的是第20页!简单直线回归分析的主要特点:

1.直线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。

2.在两个现象互为根据的情况下,可以有两个回归方程:yc=a+bx称y倚x回归直线xc=c+dy称x倚y回归直线统计学第5章相关与回归分析共60页,您现在浏览的是第21页!统计学第5章相关与回归分析共60页,您现在浏览的是第22页!列成计算表如下:年份(n=11)手表销售量y(万只)人均货币收入x1(元)手表平均价格x2(元/只)x1yx2yx1x21973650.4102.113466405.8487153.613681.41974758.4105.313479859.52101625.614110.21975819.9110.112990270.99105767.114202.919761051.7113.9131119788.63137772.714920.919771149.7120.4127148423.88146011.915290.819781388.1131.0125181841.10173512.516375.019791944.4157.0123305270.80239161.219311.019802534.0193.5123490329.00311682.023800.519812890.0210.2114607478.00329460.023962.819823576.0228.789817831.20318264.020354.319833898.0258.7861008412.60335228.022248.2合计20660.61730.913153905911.562285638.6198258.0统计学第5章相关与回归分析共60页,您现在浏览的是第23页!统计学第5章相关与回归分析共60页,您现在浏览的是第24页!上面的方法推广到多个自变量,其回归方程为:统计学第5章相关与回归分析共60页,您现在浏览的是第25页!

某商店各个时期的商品流通费率和商品零售额资料如下:x商品零售额(万元)9.511.513.515.517.519.521.523.525.527.5y商品流通费率(%)6.04.64.03.22.82.52.42.32.22.1散点图显示出x与y的变动关系为一条递减的双曲线。经济理论和实际经验都可说明,流通费率决定于商品零售额,体现着经营的规模效益。例统计学第5章相关与回归分析共60页,您现在浏览的是第26页!统计学第5章相关与回归分析共60页,您现在浏览的是第27页!二、估计标准误差的计算方法

统计学第5章相关与回归分析共60页,您现在浏览的是第28页!三、回归方差,即Sy2统计学第5章相关与回归分析共60页,您现在浏览的是第29页!一、判断对错1、正相关指的就是因素标志和结果标志的数量变动方向都是上升的。()×2、相关系数是测定变量之间相关密切程度的唯一方法。()

×3、若变量X的值减少时,变量Y的值也减少,说明变量X和Y存在正的相关关系。()√4、若直线回归方程Yc=170-2.5X,则变量X和Y之间存在负的相关关系。()√5、估计标准误指的就是实际值Y与估计值Yc的平均误差程度。()√6、在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。()×7、回归系数b和相关系数r都可用来判断现象之间相关的密切程度。()×统计学第5章相关与回归分析共60页,您现在浏览的是第30页!三、多项选择题部分ABDE2、可用来判断现象之间相关方向的指标有()。A、估计标准误B、相关系数C、回归系数D、两个变量的协方差E、两个变量的标准差BCD1、直线回归分析中()。A、自变量是可控变量,因变量是随机的B、两个变量不是对等的关系C、利用一个回归方程,两个变量可以互相推算D、根据回归系数可判定相关的方向E、对于没有明显关系的两变量可求得两个回归方程3、在回归分析中,就两个相关变量X与Y而言,变量Y倚变量X的回归和变量X倚变量Y的回归所得的两个回归方程是不同的,这种不同表现在()。A、方程中参数估计的方法不同B、方程中参数的数值不同C、参数表示的实际意义不同D、估计标准误的计算方法不同E、估计标准误的数值不同BCE统计学第5章相关与回归分析共60页,您现在浏览的是第31页!节相关分析的意义和任务

一、相关关系的概念(注意相关关系与函数关系的区别)

(一)函数关系

它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。

例如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。统计学第5章相关与回归分析共60页,您现在浏览的是第32页!商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。

在具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。例统计学第5章相关与回归分析共60页,您现在浏览的是第33页!2.按相关关系的性质来分,可分为:

正相关和负相关正相关是指两相关现象变化的方向是一致的。

负相关是指两相关现象变化的方向是相反的。统计学第5章相关与回归分析共60页,您现在浏览的是第34页!4.

按相关程度分,可分为:

完全相关、不完全相关和不相关

完全相关就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。

不相关是指两现象之间在数量上的变化上各自独立,互不影响。

不完全相关就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关系。统计学第5章相关与回归分析共60页,您现在浏览的是第35页!相关分析的主要内容包括以下五个方面:1.判断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;2.确定相关关系的密切程度;3.测定两个变量之间的一般关系值;4.测定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;5.相关系数的显著性检验。统计学第5章相关与回归分析共60页,您现在浏览的是第36页!

某市1996年—2003年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。从表可看出,随着工资性现金支出的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。序号年份工资性

现金支出(万元)x城镇储蓄存款余额(万元)y119965001202199754014031998620150419997302005200090028062001970350720021050450820031170510例1统计学第5章相关与回归分析共60页,您现在浏览的是第37页!二、相关系数

相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号r表示。统计学第5章相关与回归分析共60页,您现在浏览的是第38页!仍以上例1资料计算:序号年份x(万元)y(万元)11996500120-310-15596100240254805021997540140-270-13572900182253645031998620150-190-12536100156252375041999730200-80-75640056256000520009002809058100254506200197035016075256005625120007200210504502401755760030625420008200311705103602351296005522584600合计64802200--432400155000253300统计学第5章相关与回归分析共60页,您现在浏览的是第39页!对r的解释如下:(即r的特点)(1)r取正值或负值决定于分子协方差;(2)r的绝对值,在0与1之间;(3)r的绝对值大小,可说明现象之间相关关系的紧密程度。统计学第5章相关与回归分析共60页,您现在浏览的是第40页!2.简捷法

统计学第5章相关与回归分析共60页,您现在浏览的是第41页!3.从单变量分组表计算相关系数

统计学第5章相关与回归分析共60页,您现在浏览的是第42页!第三节回归分析

在回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性(直线)回归和非线性(曲线)回归之分。统计学第5章相关与回归分析共60页,您现在浏览的是第43页!一、直线回归(一)简单直线回归分析简单直线回归方程的一般形式为:

yc=a+bx

yc——因变量的估计值;x——自变量;a——回归直线在y轴上的截距;b——回归直线的斜率,称回归系数,表明x每增加一个单位,因变量yc的平均变化值b>0,x与y为正相关b<0,x与y为负相关统计学第5章相关与回归分析共60页,您现在浏览的是第44页!

a、b的确定:

在简单直线回归方程中,a、b为待定系数,常用最小平方法来确定,即∑(y-yc)2=最小值。统计学第5章相关与回归分析共60页,您现在浏览的是第45页!仍用上例1资料得到:yc=-199.5+0.5858x表明该市工资性现金支出每增加1万元,储蓄存款余额就增加0.5858万元。统计学第5章相关与回归分析共60页,您现在浏览的是第46页!回归系数与相关系数的关系因为:所以:即:第八章相关分析统计学第5章相关与回归分析共60页,您现在浏览的是第47页!判定系数统计学第5章相关与回归分析共60页,您现在浏览的是第48页!从单变量分组表配合回归直线:统计学第5章相关与回归分析共60页,您现在浏览的是第49页!(二)多元线性回归分析

多元线性回归分析可以看作是一元线性回归分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:统计学第5章相关与回归分析共60页,您现在浏览的是第50页!以我国1973-1983年11年手表价格和手表销售量的实际资料为例,拟合一元线性回归方程为:

yc=9643-65x此时,回归系数b表明,手表平均价格每降低1元/只,销售量约平均增长65万只。一元线性回归模型只列入了手表平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。例统计学第5章相关与回归分析共60页,您现在浏览的是第51页!年份(n=11)197310424.4117956197411088.0917956197512122.0116641197612973.2117161197714496.1616129197817161.0015625197924649.0015129198037442.2515129198144184.0412996198252303.697921198366925.697396合计303769.55160039续表统计学第5章相关与回归分析共60页,您现在浏览的是第52页!b1表明在手表平均价格固定时,人均货币收入每增加1元,手表销售量平均增长18.6368万只;b2表明在人均货币收入固定时,手表平均价格每上升1元/只,手表销售量平均减少8.0328万只。这里的b2比原一元线性回归模型中的同一回归系数b=-65要大得多,是因为一元线性回归模型只列入了手表平均价格对销售量的影响而忽略了居民收入这一很重要的因素,在手表平均价格的影响中渗入了居民收入的影响。统计学第5章相关与回归分析共60页,您现在浏览的是第53页!二、曲线回归

拟合方法:统计上通常采用变量代换法把非线性形式转换为线性形式处理,使线性回归分析的方法也能适用于非线性回归问题的研究。统计学第5章相关与回归分析共60页,您现在浏览的是第54页!双曲线方程为:9.56.00.1050.011030.6311.54.60.0870.007560.4013.54.00.0740.005490.3015.53.20.0650.004160.2117.52.80.0570.003270.1619.52.50.0510.002630.1321.52.40.0470.002160.1123.52.30.0430.001810.1025.52.20.0390.001540.0927.52.10.0360.001320.08合计32.10.6040.040972.21统计学第5章相关与回归分析共60页,您现在浏览的是第55页!第四节估计标准误

一、估计标准误的概念和作用

估计标准误就是用来说明回归方程推

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论