统计学课件:相关与回归分析_第1页
统计学课件:相关与回归分析_第2页
统计学课件:相关与回归分析_第3页
统计学课件:相关与回归分析_第4页
统计学课件:相关与回归分析_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关与回归分析相关与回归分析第一节

相关分析的意义和种类第二节

相关关系的测定方法第三节

回归分析第一节

相关分析的意义和种类

一、相关分析的概念相关分析(Correlationanalysis)是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。现象之间的数量关系,存在着两种不同的类型,一是函数关系,另一种是相关关系。(1)函数关系:它反映着现象之间存在着严密的依存关系,在这种关系中对于某一变量的一个数量值,都有另一变量的确定值与之对应。(2)相关关系:它是指现象之间确实存在的,但关系值不固定的相互依存关系。二、回归分析与相关分析的作用1、确定特定变量之间是否存在相关关系,并根据观察资料建立比较合适的回归方程,从而分析变量之间相互关系的密切程度。2、根据一个或几个变量的数值预测或控制另一个变量的数值,并且了解这种预测或控制的精确度。3、对共同影响一个变量的许多的变量之间,找出哪些是重要因素,哪些是次要因素。三、相关分析的种类和特点(一)相关关系的种类1、按相关程度划分完全相关:Y的变化完全由X的变化确定;不相关:Y与X不相互影响,各自独立变化;不完全相关:Y与X之间有一定程度的相互影响。2、按相关方向划分正相关:X与Y同时变大或变小;负相关:X变大,Y变小或X变小,Y变大。3、按相关形式划分线性相关:Y与X的关系呈现出线性关系;非线性相关:Y与X的关系呈现出非线性关系。4、按变量多少划分单相关:指两个变量间的相关关系;复相关:指三个以上变量间的相关关系;偏相关:指多个变量情形下,固定其他变量,只

考虑其中两个变量间的相关关系。(二)相关分析的特点1、两变量是对等的关系。2、相关分析中,只能计算出一个相关系数,相关系数的绝对值在0和1之间,其值大小反映两变量间相关的密切程度。3、相关系数有正有负之分。4、相关系数计算的资料要求是:相关的两变量必须是随机的,这也是对等关系的反映。四、相关分析的主要目的和内容(一)主要目的相关分析的主要目的,就是对现象间相关关系的密切程度和变化规律进行分析,找出相互关系的模式,以便进行统计预测和推算,为制定计划、决策提供统计资料。(二)内容1、确定现象之间有无相关关系。2、确定相关关系的表现形式。3、判定相关关系的方向和密切程度。4、为达到一定密切程度的相关关系建立适当的数学模型(通常称为回归方程),以确定自变量与因变量之间数量变化的规律性。5、测定数学模型代表性大小,并根据自变量的数值,对因变量的数量变化做出具有一定概率保证度的推算和预测。第二节

相关关系的测定方法一、相关表根据资料是否分组,相关表可分为简单相关表和分组相关表。(一)简单相关表对于比较少的资料,可以不加分组,只将某一变量的变量值按从小到大的顺序,并将与它可能具有相关关系的变量的变量值与之一一对应,按其相应的变量值顺序排列,即可编制成简单相关表。【例】某厂某产品产量与单位成本相关表

产量(千件)单位成本(元)19946521995850199695119971148199812491999144820001546200117442002194120032040(二)分组相关表当原始资料很多时,可将原始资料进行分组,编制成分组相关表。1、单变量分组相关表在原始资料中有两个变量,只对其中的一个变量分组,对另一个变量不分组,并且对于分组变量计算各组相应的次数,对于不分组的变量计算平均数。这样编制的相关表,称为单变量分组相关表。(1)单项式分组相关表【例】(2)组距式分组相关表【例】某纺织厂118名工人看管机器数与劳动生产率相关关系表按看管机器数分组(台)工人人数(人)劳动生产率(米/小时)5—710148—9141710—11212212—13302513—15333216—17323718—192142∑118—2、双变量分组相关表双变量分组,就是对所研究的两个变量都加以分组。【例】某公司200名职工的工龄和时工资等级相关关系表

按工龄分组(年)按时工资级别分组(元)合计1231—56—1011—1516—2021及以上2040241600102426000128202050605020∑1006040200二、相关图相关图又称散点图,是以直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量相对应的成对数据用坐标点的形式描绘出来,用于反映两变量之间的相关关系的图形。相关关系的图示:

不相关

负线性相关

正线性相关

非线性相关

完全负线性相关完全正线性相关

三、相关系数测定变量之间相关密切程度的比较完善的指标是相关系数。(一)相关系数的计算【例】某市1998年—2005年的工资性现金支出与城镇储蓄存款余额的资料如下表:序号年份x(万元)y(万元)11998500120-310-15596100240254805021999540140-270-13572900182253645032000620150-190-12536100156252375042001730200-80-75640056256000520029002809058100254506200397035016075256005625120007200410504502401755760030625420008200511705103602351296005522584600合计64802200--432400155000253300计算结果表明:该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。2、协方差

xy2的意义它是积差平均数,是度量x,y关系的一重要指标。其作用在于:(1)显示x与y是正相关还是负相关。(2)协方差显示x与y相关程度的大小。3、标准差

x和

y的作用(1)x,y协方差是有名数,不同现象的变异情况不同,相关程度不能直接以协方差大小加以比较。标准化结果协方差化为无名数,就可以比较不同现象相关程度的高低。(2)x,y协方差数值可无限增多或减少,将变量离差标准化的结果使相关系数的绝对值不超过1,即相关系数在-1与+1之间变动,就便于说明问题:当相关系数为±1时,表明x与y完全线性相关;当相关系数为0时,表示x与y不相关;相关系数的绝对值越接近于1,表明x,y的相关程度越高。(二)相关系数的性质相关系数相关等级|r|=10.8≤|r|<10.5≤|r|<0.80.3≤|r|<0.50<|r|<0.3r=0完全线性相关高度线性相关显著线性相关低度线性相关微弱线性相关不存在线性相关(三)相关系数的简捷计算方法1、资料未分组的计算公式:2、资料分组的计算公式:第三节

回归分析一、一元线性回归分析的概念和特点(一)回归分析的概念回归分析就是对具有相关关系的两个变量之间数量变化的一般关系进行测定,确定一个与之相对应的数学表达式,以便进行估计或预测的统计方法。(二)回归的分类1、按自变量的个数分为:一元回归和多元回归。2、按照回归线的形状分为:线性回归和非线性回归。(二)一元线性回归分析的特点1、两变量中,一个是自变量,一个是因变量。2、回归方程不是抽象的数字模型,而是用自变量数值推算因变量数值的根据,必须反映变量之间关系的一般变动情况。3、对于没有明显因果关系的两个变量,可以确定两个不能互相替代的回归方程,一是以x为自变量,以y为因变量的回归直线方程;另一是以x为因变量,以y为自变量的回归直线方程,这两条回归直线方程斜率不同,意义不同。4、直线回归方程系数即斜率有正有负。5、计算回归方程的资料要求是,因变量为随机的,而自变量是给定的数值,求出回归方程后,也是给定自变量值,代入方程中,推算出因变量的一般值或平均数值。二、一元线性回归模型的建立及应用(一)一元线性回归模型的概念一元线性回归模型又称简单直线回归模型,它是根据成对的两个变量的数据而配合的直线方程。(二)一元线性回归模型的建立yc=a+bx式中:yc—直线的估计值;a—直线的起点值(数学意义上的直线纵轴上

的截距),表示当x=0时,y的估计值;b—回归系数(数学意义上的直线的斜率),

表示当x增加或减少一个单位时,y平均增

加或减少的数量。

a、b的确定:

在简单直线回归方程中,a、b为待定系数,常用最小平方法来确定,即∑(y-yc)2=最小值。

【例】为研究收入与食品支出的关系,随机抽取了10户家庭的样本(百元),请拟合样本回归方程。解:通过散点图可近似看出收入与食品支出之间呈线性关系,故设两者有关系

经济意义:当收入为0时,亦须有217.26元的食品支出;收入每增加100元,食品支出平均增加20.23元。三、一元线性回归的相关分析与方差分析(一)离差平方和的分解xyy{}}

离差分解图SST=SSR+SSE总平方和(SST){回归平方和(SSR)残差平方和(SSE){{从图中可将总变差分解(1)总平方和(SST)反映因变量的n个观察值与其均值的总离差。(2)回归平方和(SSR)反映由于x与y之间的线性关系引起的y的取值变化,也称可解释的平方和。说明自变量

x的变化对因变量y取值变化的影响。(3)残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和。(二)决定系数(r2)决定系数是回归平方和占总离差平方和的比例。决定系数接近于1,说明所有相关点都接近回归直线方程,相关程度就很高。当决定系数等于1时,相关点就落在回归直线上,即为完全相关。四、一元线性回归估计标准误差(一)估计标准误差的概念估计标准误差是因变量实际值与理论值的平均离差,是用来说明回归方程代表性大小的统计分析指标,简称为估计标准差。若估计标准差小,表明回归方程准确性高,代表性大;反之,若估计标准误差大,则表明回归直线代表性小,用它进行回归预测准确性低。(二)估计标准误差的计算方法1、根据因变量实际值和估计值的离差计算由于实际运用时变量值资料很多,所以计算公式中自由度一般可以忽略,因而估计标准误差的计算公式可写成:2、利用参数a、b的已知值计算五、曲线回归分析(一)曲线回归分析的意义在研究现象的相关关系时,并不完全呈直线关系,还会反映出某种非线性的曲线关系,因此,就应配合适当的曲线形式,为两个变量拟合一条相应的曲线作为回归线,进行曲线回归分析。(二)曲线回归方程形式的确定在对实际的客观现象进行定量分析时,选择回归方程的具体形式应遵循以下原则:方程形式应与经济学的基本理论相一致。方程有较高的拟合程度。方程的数学形式要尽可能简单。(三)曲线回归方程的求解1、二次曲线回归方程及其线性化回归方程为:yc=a+bx+cx2其线性化的方法是:设x1=x,x2=x2,则二次曲线方程变化为二元一次直线方程:yc=a+bx1+cx2,用二元一次方程求出回归参数a、b、c后,再代转去,还原为二次曲线方程。2、指数曲线回归方程及其线性化回归方程为:yc=abx它的线性化用取对数的方法化为:令lgyc=yc′,lga=a′,lgb=b′,则得:yc′=a′+b′x。用此直线方程求出a′、b′之后,再取反对数还原为指数曲线方程。3、生产函数曲线回归方程及其线性化回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论