《相关与回归》PPT课件-(2)_第1页
《相关与回归》PPT课件-(2)_第2页
《相关与回归》PPT课件-(2)_第3页
《相关与回归》PPT课件-(2)_第4页
《相关与回归》PPT课件-(2)_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 相关与回归相关分析概述相关关系的测定一元线性回归分析1可编辑ppt第一节 相关分析概述一、函数关系与相关关系正方形面积与边长;脚长与智商;销售收入和消费情况;广告投入与销售收入;GDP与精神病患者;头发长与见识短1.函数关系: 变量之间存在严格的数量关系。2. 相关关系: 变量之间存在不确定的依存关系。2可编辑ppt二、分类1.按相关关系涉及的变量多少划分:单相关、复相关、偏相关。2.按相关形式划分:线性相关和曲线相关。3.按相关的方向划分:正相关和负相关。4.按相关关系的程度划分:完全相关,不完全相关和不相关。5.按相关性质分为:真实相关和虚假相关。二、相关关系的种类3可编辑ppt相

2、关分析:研究变量之间相关方向和相关密切程度的统计分析方法。(1)确定现象之间有无相关关系,以及相关关系的表现形态(2)确定相关关系的密切程度(3)建立合适的数学模型(4)测定估计值的可靠程度 三、相关分析的内容4可编辑ppt定性分析依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。第二节 相关关系的测定5可编辑ppt一、相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。6可编辑ppt

3、二、相关系数(一)相关系数的定义1、相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标。7可编辑ppt2、相关系数r的取值范围:-1r10|r|1表示存在不同程度线性相关: |r| 0 为正相关,r 0 为负相关;|r|=0 表示不存在线性关系;|r|1 表示完全线性相关;(函数关系)8可编辑ppt 例:下表是有关15个地区某种食物需求量和地区人口增加量的资料。9可编辑ppt10可编辑ppt(1)相关关系不等于因果关系;(2)相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;(3)极端值可能影响相关系数。(4)警惕虚假相关3、使用相关系数时应注意的问题11

4、可编辑ppt第三节 一元线性回归分析回归分析通过一个变量x或一些变量(x1,x2,x3)的变化解释另一变量y的变化。即根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法回归方程回归模型反映自变量和因变量之间数学联系的表达式。某一类回归方程的总称。12可编辑ppt1、根据理论和对问题的分析判断, 区分自变量和因变量; 2、设法找出适合的数学方程式(即 回归模型)描述变量间的关系 3、对回归模型进行统计检验; 4、统计检验通过后,利用回归模型,根据解释变量去估计,预测 因变量。 一、回归分析的内容13可编辑ppt一个自变量两个及

5、两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归14可编辑ppt二、一元线性回归方程样本一元线性回归方程:斜率(回归系数)截距截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。(估计的回归方程)15可编辑ppt三、直线回归方程的求解原理最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小来求得 a 和 b 的方法。用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。16可编辑ppt17可编辑ppt例:配合回归直线18可编辑ppt19可编辑ppt思考题

6、不定向选择1、圆的面积与半径之间存在着( )A 相关关系 B 因果关系C 函数关系 D比较关系2、下列现象属于相关关系的有( )A 职工家庭收入不断增加,消费支出也相应增加 B 工人文化技术水平越高,劳动效率也越高 C 在电阻一定的电路中,电压随电流强度大小而确定 D 农作物施肥量增加,产量也随之增加。3、自变量的值按一定数量增加时,应变量相应地按等量增加数量,反之亦然,那么自变量和应变量之间存在着( ) A 正相关关系 B 负相关关系 C 直线相关关系 D 曲线相关关系 E零相关关系4、如果两个变量之间相关系数是1,则两个变量是( )A 负相关关系 B 正相关关系 C 完全相关关系 D 不完

7、全相关关系5、如果两变量将的相关系数为-1,说明两变量间( )A 高度相关关系 B 完全相关关系 C 低度相关关系 D 完全不相关20可编辑ppt四、一元线性回归方程的检验(一) 回归模型检验的种类 回归模型的检验包括理论意义检验、回归方程的检验和回归系数的检验。21可编辑ppt(二)拟合程度的评价 1、拟合程度,是指样本观测值聚集在样本回归线周围的紧密程度。2、判断回归模型拟合程度优劣最常用的数量尺度是决定系数。它是建立在对总离差平方和进行分解的基础之上的。22可编辑ppt3、离差平方和的分解因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面:由于自变量 x 的取值不

8、同造成的;除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。xyy离差分解图23可编辑ppt3、离差平方和的分解 (三个平方和的关系)2) 两端平方后求和有1)从图上看有SST = SSR + SSE总离差平方和(SST)回归平方和(SSR)残差平方和(SSE)24可编辑ppt4、决定系数 (r2 )1)回归平方和占总离差平方和的比例2)反映回归直线的拟合程度3)取值范围在 0 , 1 之间4) r2 1,说明回归方程拟合的越好;r20,说明回归方程拟合的越差5)判定系数等于相关系数的平方,即r2(r)225可编辑ppt(三)回归方程的显著性检验1、检验自变量和因变量之间的线性

9、关系是否显著具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系26可编辑ppt2、检验的步骤1)提出假设H0:线性关系不显著 2) 计算检验统计量F3)确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4)作出决策:若FF ,拒绝H0;若Ft,拒绝H0; tt=2.201,拒绝H0,表明人均收入与人均消费之间有线性关系对前例的回归系数进行显著性检验(0.05)32可编辑ppt7、Excel输出的结果33可编辑ppt五、一元线性回归方程的预测1、

10、根据自变量 x 的取值估计或预测因变量 y的取值2、估计或预测的类型点估计y 的平均值的点估计y 的个别值的点估计区间估计y 的平均值的置信区间估计34可编辑ppt3、置信区间估计(1) y 的平均值的置信区间估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值E(y0)的估计区间 ,这一估计区间称为置信区间 (2)E(y0) 在1-置信水平下的置信区间为式中:Sy为估计标准误差35可编辑ppt(3)影响区间宽度的因素1)置信水平 (1 - )区间宽度随置信水平的增大而增大2)数据的离散程度 (s)区间宽度随离散程度的增大而增大3)样本容量区间宽度随样本容量

11、的增大而减小4)用于预测的 xp与x的差异程度区间宽度随 xp与x 的差异程度的增大而增大36可编辑ppt置信区间、回归方程xpyxx置信上限置信下限37可编辑ppt第四节 多元线性相关与回归分析一、多元线性回归模型1、定义:一个因变量与两个及两个以上自变量之间的回归描述因变量 y 如何依赖于自变量 x1 ,x2 , xp 和误差项 的方程称为多元线性回归模型 b0 ,b1,b2 ,bp是参数 是被称为误差项的随机变量 y 是x1,,x2 , ,xp 的线性函数加上误差项 说明了包含在y里面但不能被p个自变量的线性关系所解释的变异性38可编辑ppt多元线性回归模型 对于 n 组实际观察数据(y

12、i ; xi1,,xi2 , ,xip ),(i=1,2,n),多元线性回归模型可表示为y1 = b0 + b1 x11+ b2 x12 + bpx1p + e1y2= b0 + b1 x21 + b2 x22 + bpx2p + e2 yn= b0 + b1 xn1 + b2 xn2 + bpxnp + en39可编辑ppt二、参数的最小二乘法根据最小二乘法的要求,可得求解各回归参数 的标准方程如下使因变量的观察值与估计值之间的离差平方和达到最小来求得 。即40可编辑ppt三、显著性检验 (线性关系的检验 )1、回归方程的检验:将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应

13、用 F 检验来分析二者之间的差别是否显著如果是显著的,因变量与自变量之间存在线性关系如果不显著,因变量与自变量之间不存在线性关系2、回归系数的检验:对每一个自变量都要单独进行检验,应用 t 检验在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验。41可编辑ppt第五节非线性相关与回归分析一、非线性函数形式的确定1、选择回归方程的具体形式应遵循以下原则:首先,方程形式应与有关实质性科学的基本理论相一致。其次,方程有较高的拟合程度。最后,方程的数学形式要尽可能简单。42可编辑ppt二、几种常见的非线性模型 (一)指数函数线性化方法两端取对数得:lny = ln + x令:y =

14、lny,则有y = ln + x基本形式:图像 43可编辑ppt二、几种常见的非线性模型 (二)幂函数线性化方法两端取对数得:lg y = lg + lg x令:y = lgy,x= lg x,则y = lg + x基本形式:图像0 1 1 = 1-1 0 -1 =-1 44可编辑ppt二、几种常见的非线性模型 (三)双曲线函数线性化方法令:y = 1/y,x= 1/x, 则有y = + x基本形式:图像 045可编辑ppt二、几种常见的非线性模型 (四)对数函数线性化方法x= lgx , 则有y = + x基本形式:图像 0 0 46可编辑ppt几种常见的非线性模型线性化方法令:y = 1/y,x= e-x, 则有y = + x基本形式:图像(五) S 型曲线47可编辑ppt三、非线性回归【例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。废品率与生产率的关系生产率(周/单位)x100020003000350040004500

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论