一元线性回归方程检验课件_第1页
一元线性回归方程检验课件_第2页
一元线性回归方程检验课件_第3页
一元线性回归方程检验课件_第4页
一元线性回归方程检验课件_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章相关与回归分析本章教学目的:相关分析是研究变量之间相互关系的一种重要的统计方法,通过本章的学习,使学生:了解相关分析的意义,相关的种类、回归分析的概念,掌握相关系数的计算和简单线性回归分析。本章教学重点:相关分析、回归分析本章教学难点:回归分析本章教学学时:6学时1/3/2023第七章相关与回归分析12/27/20221第一节相关分析的意义和内容

一、相关分析的涵义

(一)变量间依存关系1.函数关系存在严格的数量依存关系。2.相关关系存在不确定性的依存关系。(二)相关分析研究两个或两个以上变量之间的相关方向和相关程度的统计分析方法。1/3/2023第一节相关分析的意义和内容12/27/20222二、相关关系的种类(一)按变量之间相关的程度1、完全相关如销售额与销售量之间的关系(价格不变)2、完全不相关注意:虚假相关。如天气与股票价格的关系3、不完全相关如居民的收入与支出水平1/3/2023二、相关关系的种类12/27/20223(二)按相关关系涉及变量的多少1、单相关:一个变量对另一个变量的相关关系。如只研究农物产量与施肥量间的关系。2、复相关:一个变量对两个或多个变量的相关关系,称复相关。如研究农物产量与施肥量、降雨量间的关系。3、偏相关:一个变量与多个变量相关时,假定其他变量不变,只研究其中两个变量之间的相关关系,称偏相关。1/3/2023(二)按相关关系涉及变量的多少12/27/20224(三)按变量之间相关关系的表现形态1、线性相关:两种变量之间大致呈线性关系。2、非线性相关(或曲线相关):两种变量之间不呈线性关系,近似某种曲线方程的关系。1/3/2023(三)按变量之间相关关系的表现形态12/27/20225(四)对线性相关,按相关变量变化的方向1、正相关如工人工资与劳动生产率;人均消费水平与人均收入水平等。2、负相关如商品流转额与流通费用。1/3/2023(四)对线性相关,按相关变量变化的方向12/27/20226第二节线性相关的测定一、相关表(一)简单相关表机床1234567891011使用年限22344556668年维修费用(元)4005405206407406008007007609008401/3/2023第二节线性相关的测定机床1234567891011使用年7(二)单变量分组相关表使用年限机床数(台)平均维修费用224703152042690527006378781840911080合计12--1/3/2023(二)单变量分组相关表使用年限机床数(台)平均维修费用2248

(三)双变量分组相关表年维修费用(元)机床使用年限(年)合计23456891000—110000000011900—100000001001800—90000010102700—80000102003600—70000110002500—60011000002400—50010000001合计2122311121/3/2023(三)双变量分组相关表年维修费用(元)机床使用年限(年)合9二、相关图使用年限1/3/2023二、相关图使用年限12/27/202210三、相关系数(一)基本公式:最先由卡尔.皮尔逊提出衡量一元线性相关的密切程度。1/3/2023三、相关系数12/27/2022111/3/202312/27/202212(二)性质:(1)相关系数r的取值范围:-1≤r≤1(2)方向、类别r>0为正相关,r<0为负相关;r=0表示不存在线性关系;|r|=1表示完全线性相关;(3)程度0<|r|<1表示存在不同程度线性相关:|r|≤0.3为不存在线性相关0.3<|r|≤0.5为低度线性相关;0.5<|r|≤0.8为显著线性相关;|r|>0.8为高度线性相关。1/3/2023(二)性质:12/27/202213例:P254

某地区居民货币收入和社会商品零售额资料如下,试计算其相关系数,并作相关判别?

单位:亿元

年份12345678居民货币收入1213141514161820社会商品零售额10121213131415171/3/2023例:P254年份12345678居民货币收入12131415141/3/202312/27/2022151/3/202312/27/2022161/3/202312/27/202217第三节回归分析一、回归分析的概念

指在相关分析的基础上,根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化,并据以进行因变量的估计或预测的统计分析方法。二、相关分析与回归分析的关系区别:

1、相关分析中x与y对等,回归分析中x与y要确定自变量和因变量(随机变量);1/3/2023第三节回归分析12/27/2022182、相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制;3、相关分析只有一个结果;而在回归分析中,自变量与因变量互换可以拟合两个独立的回归方程。联系:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的继续和深化。1/3/20232、相关分析测定相关程度和方向,回归分析用回归模型进19三、简单线性回归1.回归分析的种类按自变量的个数分(1)一元回归(简单回归)多元回归(复回归)按回归曲线的形态分(2)线性回归非线性回归一元线性回归1/3/2023三、简单线性回归按自变量的个数分(1)一元回归(简202.一元线性回归模型1/3/20232.一元线性回归模型12/27/2022213.一元线性回归方程的几何意义一元线性回归方程的可能形态为正为负为0截距斜率1/3/20233.一元线性回归方程的几何意义一元线性回归方程的可能形态为22总体一元线性回归方程:样本一元线性回归方程:斜率(回归系数)截距

截距a表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单位,因变量y平均变动b个单位。1/3/2023总体一元线性样本一元线性回归方程:斜率(回归系数)截距234.一元线性回归方程中参数a、b的确定:基本数学要求:最小平方法1/3/20234.一元线性回归方程基本数学要求:最小平方法12/27/2024例:

某地区居民货币收入和社会商品零售额资料如下,试拟合社会商品零售额依居民货币收入变动的线性方程?(单位:亿元)年份收入x零售额y11210213123141241513514136161471815820171/3/2023例:年份收入x零售额y112102131231412415125

当居民货币收入每增加1亿元时,社会商品零售额平均增加0.7778亿元。1/3/2023当居民货币收入每增加1亿元时,社会商品零售额平261/3/202312/27/2022275.回归系数b与相关系数r的关系:四、一元线性回归方程检验(一)离差平方和的分解1.总平方和(SST)2.回归平方和(SSR)反映由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和。3.残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和。1/3/20235.回归系数b与相关系数r的关系:12/27/202228剩余平方和回归平方和总离差平方和1/3/2023剩余平方和回归平方和总离差平方和12/27/202229(二)可决系数(r2)回归平方和占总离差平方和的比例。1.取值范围在[0,1]之间;r21,说明回归方程拟合的越好;r20,说明回归方程拟合的越差;2.判定系数等于相关系数的平方,即r2=(r)21/3/2023(二)可决系数(r2)1.取值范围在[0,1]30实际分析中,只有相关系数大到一定程度时,才认为两变量的线性相关关系显著,回归方程才有意义,因此有必要进行相关系数检验。r检验步骤:①据公式计算相关系数r;②根据给定的显著水平查相关系数表(见p316),得临界值③判别:若表明x与y线性关系显著,检验通过;反之表明x与y线性相关关系不显著。1/3/2023实际分析中,只有相关系数31(三)估计标准误差是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的强。其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。可从一方面反映回归模型拟合的优劣状况。

1/3/2023(三)估计标准误差12/27/202232(四)回归方程的显著性检验——F检验

(线性关系的检验

检验自变量和因变量之间的线性关系是否显著。

具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著:

如果是显著的,两个变量之间存在线性关系;

如果不显著,两个变量之间不存在线性关系。1/3/2023(四)回归方程的显著性检验——F检验

(线性关系的检验)33提出假设H0:线性关系不显著2.计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F作出决策:若FF,拒绝H0;若F<F,接受H0回归方程的显著性检验:p311:表F分布临界值1/3/2023提出假设2.计算检验统计量F确定显著性水平,并根据分34例题:检验上面例题回归方程是否具有显著性?1/3/2023例题:检验上面例题回归方程是否具有显著性?12/27/20235五、应用相关与回归分析注意的问题1.在定性分析的基础上进行定量分析;2.要注意现象质的界限及相关关系作用的范围;3.要将各种分析指标结合应用;4.要尽可能使用大样本。

1/3/2023五、应用相关与回归分析注意的问题12/27/202236本章作业教材P289练习71/3/2023本章作业12/27/202237本章练习一、填空1.回归系数b表示

每增减一个单位时,

平均增减的倍数。2.

是建立直线回归方程最有效的方法之一。3.一个回归方程只能作一种推算,即给出

的数值,估计

的可能值。4.r=1,说明两变量

5.A与B变量之间的相关系数r=-0.95,C与D之间的相关系数r=0.85,则相关程度高的变量是

。1/3/2023本章练习12/27/202238二、选择1.下列哪两个变量之间的相关程度高()A.商品销售额和商品销售量的相关系数是0.9B.商品销售额和商业利润率的相关系数是0.76C.流通费用率与商业利润率的相关系数是-0.94D.商品销售价格与销售量的相关系数是-0.912.直线回归分析中()A.自变量是可控制量,因变量是随机的B.两个变量不是对等的关系C.利用一个回归方程,两个变量可以互相推算D.根据回归系数可判定相关的方向1/3/2023二、选择12/27/2022393.工人的薪酬(元)依劳动生产率(千元)的回归方程为y=60+100xA.如果劳动生产率等于1000元,则工人薪酬为160元;B.如果劳动生产率每增加1000元,则工人的薪酬平均提高100元;C.如果劳动生产率每增加1000元,则工人薪酬增加160元;D.如果工人薪酬为260元,则劳动生产率等于2000元;E.劳动生产率每下降1000元,则工人薪酬平均减少100元。1/3/20233.工人的薪酬(元)依劳动生产率(千元)的回归方程为y=60404.下列回归方程中,肯定错误的是()A.=10+2xr=0.52B.=500+0.1xr=0.75C.=-100+9xr=-0.86D.=-8+3.2xr=-0.93E.=140-1.8xr=0.851/3/20234.下列回归方程中,肯定错误的是()12/41第七章相关与回归分析本章教学目的:相关分析是研究变量之间相互关系的一种重要的统计方法,通过本章的学习,使学生:了解相关分析的意义,相关的种类、回归分析的概念,掌握相关系数的计算和简单线性回归分析。本章教学重点:相关分析、回归分析本章教学难点:回归分析本章教学学时:6学时1/3/2023第七章相关与回归分析12/27/202242第一节相关分析的意义和内容

一、相关分析的涵义

(一)变量间依存关系1.函数关系存在严格的数量依存关系。2.相关关系存在不确定性的依存关系。(二)相关分析研究两个或两个以上变量之间的相关方向和相关程度的统计分析方法。1/3/2023第一节相关分析的意义和内容12/27/202243二、相关关系的种类(一)按变量之间相关的程度1、完全相关如销售额与销售量之间的关系(价格不变)2、完全不相关注意:虚假相关。如天气与股票价格的关系3、不完全相关如居民的收入与支出水平1/3/2023二、相关关系的种类12/27/202244(二)按相关关系涉及变量的多少1、单相关:一个变量对另一个变量的相关关系。如只研究农物产量与施肥量间的关系。2、复相关:一个变量对两个或多个变量的相关关系,称复相关。如研究农物产量与施肥量、降雨量间的关系。3、偏相关:一个变量与多个变量相关时,假定其他变量不变,只研究其中两个变量之间的相关关系,称偏相关。1/3/2023(二)按相关关系涉及变量的多少12/27/202245(三)按变量之间相关关系的表现形态1、线性相关:两种变量之间大致呈线性关系。2、非线性相关(或曲线相关):两种变量之间不呈线性关系,近似某种曲线方程的关系。1/3/2023(三)按变量之间相关关系的表现形态12/27/202246(四)对线性相关,按相关变量变化的方向1、正相关如工人工资与劳动生产率;人均消费水平与人均收入水平等。2、负相关如商品流转额与流通费用。1/3/2023(四)对线性相关,按相关变量变化的方向12/27/202247第二节线性相关的测定一、相关表(一)简单相关表机床1234567891011使用年限22344556668年维修费用(元)4005405206407406008007007609008401/3/2023第二节线性相关的测定机床1234567891011使用年48(二)单变量分组相关表使用年限机床数(台)平均维修费用224703152042690527006378781840911080合计12--1/3/2023(二)单变量分组相关表使用年限机床数(台)平均维修费用22449

(三)双变量分组相关表年维修费用(元)机床使用年限(年)合计23456891000—110000000011900—100000001001800—90000010102700—80000102003600—70000110002500—60011000002400—50010000001合计2122311121/3/2023(三)双变量分组相关表年维修费用(元)机床使用年限(年)合50二、相关图使用年限1/3/2023二、相关图使用年限12/27/202251三、相关系数(一)基本公式:最先由卡尔.皮尔逊提出衡量一元线性相关的密切程度。1/3/2023三、相关系数12/27/2022521/3/202312/27/202253(二)性质:(1)相关系数r的取值范围:-1≤r≤1(2)方向、类别r>0为正相关,r<0为负相关;r=0表示不存在线性关系;|r|=1表示完全线性相关;(3)程度0<|r|<1表示存在不同程度线性相关:|r|≤0.3为不存在线性相关0.3<|r|≤0.5为低度线性相关;0.5<|r|≤0.8为显著线性相关;|r|>0.8为高度线性相关。1/3/2023(二)性质:12/27/202254例:P254

某地区居民货币收入和社会商品零售额资料如下,试计算其相关系数,并作相关判别?

单位:亿元

年份12345678居民货币收入1213141514161820社会商品零售额10121213131415171/3/2023例:P254年份12345678居民货币收入12131415551/3/202312/27/2022561/3/202312/27/2022571/3/202312/27/202258第三节回归分析一、回归分析的概念

指在相关分析的基础上,根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化,并据以进行因变量的估计或预测的统计分析方法。二、相关分析与回归分析的关系区别:

1、相关分析中x与y对等,回归分析中x与y要确定自变量和因变量(随机变量);1/3/2023第三节回归分析12/27/2022592、相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制;3、相关分析只有一个结果;而在回归分析中,自变量与因变量互换可以拟合两个独立的回归方程。联系:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的继续和深化。1/3/20232、相关分析测定相关程度和方向,回归分析用回归模型进60三、简单线性回归1.回归分析的种类按自变量的个数分(1)一元回归(简单回归)多元回归(复回归)按回归曲线的形态分(2)线性回归非线性回归一元线性回归1/3/2023三、简单线性回归按自变量的个数分(1)一元回归(简612.一元线性回归模型1/3/20232.一元线性回归模型12/27/2022623.一元线性回归方程的几何意义一元线性回归方程的可能形态为正为负为0截距斜率1/3/20233.一元线性回归方程的几何意义一元线性回归方程的可能形态为63总体一元线性回归方程:样本一元线性回归方程:斜率(回归系数)截距

截距a表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单位,因变量y平均变动b个单位。1/3/2023总体一元线性样本一元线性回归方程:斜率(回归系数)截距644.一元线性回归方程中参数a、b的确定:基本数学要求:最小平方法1/3/20234.一元线性回归方程基本数学要求:最小平方法12/27/2065例:

某地区居民货币收入和社会商品零售额资料如下,试拟合社会商品零售额依居民货币收入变动的线性方程?(单位:亿元)年份收入x零售额y11210213123141241513514136161471815820171/3/2023例:年份收入x零售额y112102131231412415166

当居民货币收入每增加1亿元时,社会商品零售额平均增加0.7778亿元。1/3/2023当居民货币收入每增加1亿元时,社会商品零售额平671/3/202312/27/2022685.回归系数b与相关系数r的关系:四、一元线性回归方程检验(一)离差平方和的分解1.总平方和(SST)2.回归平方和(SSR)反映由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和。3.残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和。1/3/20235.回归系数b与相关系数r的关系:12/27/202269剩余平方和回归平方和总离差平方和1/3/2023剩余平方和回归平方和总离差平方和12/27/202270(二)可决系数(r2)回归平方和占总离差平方和的比例。1.取值范围在[0,1]之间;r21,说明回归方程拟合的越好;r20,说明回归方程拟合的越差;2.判定系数等于相关系数的平方,即r2=(r)21/3/2023(二)可决系数(r2)1.取值范围在[0,1]71实际分析中,只有相关系数大到一定程度时,才认为两变量的线性相关关系显著,回归方程才有意义,因此有必要进行相关系数检验。r检验步骤:①据公式计算相关系数r;②根据给定的显著水平查相关系数表(见p316),得临界值③判别:若表明x与y线性关系显著,检验通过;反之表明x与y线性相关关系不显著。1/3/2023实际分析中,只有相关系数72(三)估计标准误差是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的强。其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。可从一方面反映回归模型拟合的优劣状况。

1/3/2023(三)估计标准误差12/27/202273(四)回归方程的显著性检验——F检验

(线性关系的检验

检验自变量和因变量之间的线性关系是否显著。

具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著:

如果是显著的,两个变量之间存在线性关系;

如果不显著,两个变量之间不存在线性关系。1/3/2023(四)回归方程的显著性检验——F检验

(线性关系的检验)74提出假设H0:线性关系不显著2.计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F作出决策:若FF,拒绝H0;若F<F

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论