第五章相关与回归分析_第1页
第五章相关与回归分析_第2页
第五章相关与回归分析_第3页
第五章相关与回归分析_第4页
第五章相关与回归分析_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非统计学专业选修课程沈阳大学经济学院统计学系 侯振明目 录第一章第一章 总论总论第二章第二章 统计数据的搜集、处理与显示统计数据的搜集、处理与显示第三章第三章 统计综合指标统计综合指标第四章第四章 参数估计与假设检验参数估计与假设检验第五章第五章 相关与回归分析相关与回归分析第六章第六章 时间序列分析与预测时间序列分析与预测第七章第七章 统计指数方法统计指数方法目目 录录第五章第五章 相关与回归分析相关与回归分析 【学习目标】通过对本章的学习,掌握相关分析和回归【学习目标】通过对本章的学习,掌握相关分析和回归分析的意义、必须掌握简单相关系数的计算及一元线性回归分析的意义、必须掌握简单相关系数的

2、计算及一元线性回归方程的建立与应用;了解相关系数的检验及回归方程的拟合方程的建立与应用;了解相关系数的检验及回归方程的拟合优度和显著性检验。重点与难点:相关系数的计算、一元线优度和显著性检验。重点与难点:相关系数的计算、一元线性回归模型的建立与应用。性回归模型的建立与应用。 (一)函数关系 第八章第八章 相关与回归分析相关与回归分析 函数关系:函数关系:是指现象之间存在着严格的依存关系,亦是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一自变量或几个自变量的每即当其它条件不变时,对于某一自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这一数值,都有因变量的一

3、个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。种关系可以用一个确定的数学表达式反映出来。 (二)相关关系(二)相关关系 相关关系:相关关系:当一个或若干个变量当一个或若干个变量X X取一定值时,与之相取一定值时,与之相对应的另一个变量对应的另一个变量Y Y的值虽然不确定,但却按某种规律在一的值虽然不确定,但却按某种规律在一定范围内变化,变量之间的这种关系被称为不确定的统计定范围内变化,变量之间的这种关系被称为不确定的统计关系或相关关系。例如,居民的可支配收入与消费支出的关系或相关关系。例如,居民的可支配收入与消费支出的关系。关系。案例分析案例分析相相关关 原来他们调查的

4、原来他们调查的是一群年龄不同的儿是一群年龄不同的儿童,脚长的儿童比脚童,脚长的儿童比脚短的儿童年龄大短的儿童年龄大赶快回去量一赶快回去量一下儿子的脚长下儿子的脚长我要把脚拉我要把脚拉长一点!长一点! 一家研究机构一家研究机构有一项惊人的发现:有一项惊人的发现:统计数据显示,脚长统计数据显示,脚长的儿童拼写能力比的儿童拼写能力比 脚短的儿童强。脚短的儿童强。因因果果第八章第八章 相关与回归分析相关与回归分析 第八章第八章 相关与回归分析相关与回归分析 按变量按变量多少分多少分单相关,也叫一元相关单相关,也叫一元相关复相关,也叫多元相关复相关,也叫多元相关按相关按相关形式分形式分线性相关,也叫直线

5、相关线性相关,也叫直线相关非线性相关,也叫曲线相关非线性相关,也叫曲线相关按相关按相关方向分方向分正相关正相关两变量同向变动两变量同向变动负相关负相关两变量反向变动两变量反向变动按相关按相关程度分程度分完全相关、不完全相关、不相关完全相关、不完全相关、不相关第八章第八章 相关与回归分析相关与回归分析 是研究变量之间关系性质和紧密程是研究变量之间关系性质和紧密程度的一种统计分析方法。度的一种统计分析方法。 目的:目的:是揭示现象之间是揭示现象之间是否存在相关关系是否存在相关关系,确,确定相关关系的定相关关系的表现形式表现形式以及确定现象变量间相关关系以及确定现象变量间相关关系的的密切程度和方向密

6、切程度和方向。 相关分析的方法相关分析的方法 在定性判断的基础上,把具有相关关在定性判断的基础上,把具有相关关系的两个量的具体数值按照一定顺序平行排列在一张系的两个量的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互关系,这种表就称为表上,以观察它们之间的相互关系,这种表就称为相相关表关表。第八章第八章 相关与回归分析相关与回归分析 第八章第八章 相关与回归分析相关与回归分析 将某一变量按其取值的大小排列,然后再将与将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到其相关的另一变量的对应值平行排列,便得到简单简单相关表相关表。 企业编号企业编号月产量(

7、千吨)月产量(千吨)X X生产费用生产费用( (万元万元)Y)Y1 12 23 34 45 56 61.21.22.02.03.13.13.83.85.05.06.16.1626286868080110110115115132132 第八章第八章 相关与回归分析相关与回归分析 工人看管织机台数工人看管织机台数(台)工工 人人 数数(人)时劳动生产率时劳动生产率(米)5-75-77-97-9 9-11 9-1111-1311-1313-1513-1515-1715-1717-1917-19101014142121303033333232212114141717222225253232373742

8、42某纺织厂工人看管织机台数和时劳动生产率相关表某纺织厂工人看管织机台数和时劳动生产率相关表 第八章第八章 相关与回归分析相关与回归分析熟悉程度熟悉程度居住时间居住时间1313年以下年以下13-3013-30年年3030年以上年以上总计总计不熟悉不熟悉熟熟 悉悉总总 计计25255050757530308080110110404095951351359595225225320320居住时间与对百货商场的熟悉程度的双变量分组表居住时间与对百货商场的熟悉程度的双变量分组表 第八章第八章 相关与回归分析相关与回归分析 假定对于某项私家车购买意向的调查,最初以教育水平假定对于某项私家车购买意向的调查,

9、最初以教育水平和私家车拥有情况进行分析,对和私家车拥有情况进行分析,对10001000人调查的结果用二维列人调查的结果用二维列联表表示如:联表表示如:教育程度和私家车拥有状况的教育程度和私家车拥有状况的双变量双变量分析分析私家车拥有状况私家车拥有状况受教育程度受教育程度本科及以上本科及以上本科以下本科以下有有无无32%32%68%68%8080人人170170人人20%20%80%80%150150人人600600人人被调查者人数被调查者人数100%100%250250人人100%100%750750人人 第八章第八章 相关与回归分析相关与回归分析 从上表中可以看出,文化程度越高的人拥有私家车

10、的比从上表中可以看出,文化程度越高的人拥有私家车的比例越高,这和实际情况不太相符,于是我们引入收入变量,例越高,这和实际情况不太相符,于是我们引入收入变量,作三变量的交叉列表分析:作三变量的交叉列表分析:教育程度、收入与私家车拥有状况的三变量分析教育程度、收入与私家车拥有状况的三变量分析私家车私家车拥有状况拥有状况收入水平收入水平低收入者低收入者按受教育程度分组按受教育程度分组高收入者高收入者按受教育程度分组按受教育程度分组本科及以上本科及以上本科以下本科以下本科及以上本科及以上本科以下本科以下有有无无20%20%(2020)80%80%(8080)20%20%(140140) 80%80%(

11、560560)40%40%(6060) 60%60%(9090)40%40%(2020)60%60%(3030)被调查人数被调查人数100%100%(100100人)人)100%100%(700700人)人) 100%100%(150150人)人) 100%100%(5050人)人) 第八章第八章 相关与回归分析相关与回归分析 2.2.相关图:相关图:把相关表上一一对应的具体数值把相关表上一一对应的具体数值在直角坐标系中用点标出来而形成的散点图则称为相在直角坐标系中用点标出来而形成的散点图则称为相关图。关图。xy直线直线正相关正相关xy直线直线负相关负相关xy曲线曲线相关相关xy不不相关相关

12、第八章第八章 相关与回归分析相关与回归分析 利用相关图和相关表,可以更直观、更形象地表现变利用相关图和相关表,可以更直观、更形象地表现变量之间的相互关系。但这只是初步的判断,是相关分析的量之间的相互关系。但这只是初步的判断,是相关分析的开始。为了说明现象之间相关关系的密切程度,就要计算开始。为了说明现象之间相关关系的密切程度,就要计算相关系数。相关系数。 是直线相关条件下说明两个现象是直线相关条件下说明两个现象之间相关关系密切程度和方向的统计分析指标。也之间相关关系密切程度和方向的统计分析指标。也叫叫直线相关系数直线相关系数或或简单相关系数。简单相关系数。 若相关系数是根据总体全部数据计算的,

13、称为若相关系数是根据总体全部数据计算的,称为总体相关系数总体相关系数,记为,记为 ; 若是根据样本数据计算的,则称为若是根据样本数据计算的,则称为样本相关系样本相关系数数,记为,记为r r。 第八章第八章 相关与回归分析相关与回归分析22()()()()ttttxxyyrxxyy简单相关系数的计算公式为:简单相关系数的计算公式为:或化简为或化简为: : 2222yynxxnyxxynr(1)1)相关系数取值范围在相关系数取值范围在 -1 -1和和 +1 +1之间,即:之间,即:1r11r1(2)r2)r为正,表明变量正相关;为正,表明变量正相关;r r为负,表明变量负相关。为负,表明变量负相关

14、。(3)r3)r数值越接近于数值越接近于11或或 +1 +1,表示相关系数越强;越接近于,表示相关系数越强;越接近于0 0,表示相关系数越弱。如果,表示相关系数越弱。如果r=r=1 1,表示两个现象完全直线性,表示两个现象完全直线性相关。如果相关。如果r=0r=0,则表示两个现象完全不相关(非直线相关)。,则表示两个现象完全不相关(非直线相关)。(4)4)判断两变量线性相关密切程度的具体标准为:判断两变量线性相关密切程度的具体标准为:称为高度相关。称为显著相关;称为低度相关;称为微弱相关;,0 .18 .0,08.5 .0,5 .03 .0, 3 .00rrrr 第八章第八章 相关与回归分析相

15、关与回归分析 第八章第八章 相关与回归分析相关与回归分析序号序号能源消耗量能源消耗量(十万吨(十万吨)x x工业总产值工业总产值(亿元)(亿元)y yx x2 2y y2 2X yX y1 12 23 34 45 56 67 78 89 9101011111212131314141515161635353838404042424949525254545959626264646565686869697171727276762424252524242828323231313737404041414040474750504949515148485858122512251444144416001600

16、17641764240124012704270429162916348134813844384440964096422542254624462447614761504150415184518457765776 576 576 625 625 576 576 784 78410241024 961 96113691369160016001681168116001600220922092500250024012401260126012304230433643364 840 840 950 950 960 96011761176156815681612161219981998236023602542

17、254225602560305530553400340033813381362136213456345644084408合计合计916916625625550865508626175261753788737887 第八章第八章 相关与回归分析相关与回归分析依据上述资料,计算依据上述资料,计算工业总产值与能源消耗工业总产值与能源消耗量二者的量二者的相关系数,并判断相关程度和相关方向。相关系数,并判断相关程度和相关方向。将上表所得计算资料代入相关系数公式得:将上表所得计算资料代入相关系数公式得:9757. 0625261751691655086166259163788716222222 yynxx

18、nyxxynr 对于一个二元总体,假定它服从二元正态分布,对于一个二元总体,假定它服从二元正态分布,可以采用可以采用 统计量进行检验:统计量进行检验:212rNrt它服从自由度为它服从自由度为N-2N-2的的t t分布分布t目的目的: :是检验总体两变量间线性相关性是否显著是检验总体两变量间线性相关性是否显著 第八章第八章 相关与回归分析相关与回归分析 根据给定的显著性水平根据给定的显著性水平 ,确定临界值确定临界值 ;2t 计算检验统计量并做出决策。计算检验统计量并做出决策。 确定原假设的拒绝规则确定原假设的拒绝规则: :22ntt22ntt 提出假设:提出假设:0:0:10HH 构造检验统

19、计量:构造检验统计量:2122ntrNrt步步骤骤 第八章第八章 相关与回归分析相关与回归分析 20.025200.97 8 210.9710.2910.29262.447tttntH有:拒绝,表示总体的两变量间线性相关性显著。0:0:,05.0,97.0, 810HHrn提出假设:则解:已知 当当 成立时,则统计量成立时,则统计量00:H2122ntrNrt 第八章第八章 相关与回归分析相关与回归分析第八章第八章 相关与回归分析相关与回归分析 回归分析:回归分析:是指在相关分析的基础上,把变量之间是指在相关分析的基础上,把变量之间的具体变动关系模型化,求出关系方程式,找出一个能够的具体变动关

20、系模型化,求出关系方程式,找出一个能够反映变量间变化关系的函数关系式,并据此进行估计和推反映变量间变化关系的函数关系式,并据此进行估计和推算。算。 回归分析的作用:回归分析的作用:可以将相关变量之间不确定、不可以将相关变量之间不确定、不规则的数量关系一般化、规范化。从而可以根据自变量的规则的数量关系一般化、规范化。从而可以根据自变量的某一个给定值推断出因变量的可能值(或估计值)。某一个给定值推断出因变量的可能值(或估计值)。根据变量多少分根据变量多少分简单回归简单回归多元回归多元回归根据变量形式分根据变量形式分直线回归直线回归曲线回归曲线回归 第八章第八章 相关与回归分析相关与回归分析 在回归

21、分析中,最简单最基本的方程模型为一元线性回在回归分析中,最简单最基本的方程模型为一元线性回归模型。一元线性回归分析的归模型。一元线性回归分析的总体回归模型总体回归模型为:为: iiiuxy10 第八章第八章 相关与回归分析相关与回归分析也称为直线回归方程。也称为直线回归方程。的平均变动值。单位时,每变动一个归系数,表示当是直线的斜率,称为回的期望值;时轴上的截距,是当为回归直线在yxyxy100式中:式中: 总体回归方程中的总体回归方程中的回归参数回归参数 和和 是未知的,是未知的,必需利用样本数据去估计。用样本统计量必需利用样本数据去估计。用样本统计量 和和 代代替回归方程中的未知参数替回归

22、方程中的未知参数 和和 ,就得到了估计的,就得到了估计的回归方程:回归方程:其中:其中:0 xy101的平均变动值。个单位时,每变动一归系数,表示当是直线的斜率,称为回期望值;的时轴上的截距,是当为估计的回归直线在yxyxy0第八章第八章 相关与回归分析相关与回归分析 xynxnyxxnyxxyn22)(。公式为:和乘法确定参数小二建立方程式,应依据最参数,根据已知变量为待定和中一元线性回归方程xxy第八章第八章 相关与回归分析相关与回归分析 序号序号能源消耗量能源消耗量(十万吨(十万吨)x x工业总产值工业总产值(亿元)(亿元)y yx x2 2y y2 2X yX y1 12 23 34

23、45 56 67 78 89 910101111121213131414151516163535383840404242494952525454595962626464656568686969717172727676242425252424282832323131373740404141404047475050494951514848585812251225144414441600160017641764240124012704270429162916348134813844384440964096422542254624462447614761504150415184518457765776

24、 576 576 625 625 576 576 784 78410241024 961 96113691369160016001681168116001600220922092500250024012401260126012304230433643364 840 840 950 950 960 96011761176156815681612161219981998236023602542254225602560305530553400340033813381362136213456345644084408合计合计9169166256255508655086261752617537887378

25、87第八章第八章 相关与回归分析相关与回归分析 依据上述资料,建立工业总产值对能源消耗量的线依据上述资料,建立工业总产值对能源消耗量的线性回归方程。性回归方程。【分析】建立回归方程前,应验证工业总产值与能源消耗量之【分析】建立回归方程前,应验证工业总产值与能源消耗量之间是否存在应有的相关关系,这是拟合工业总产值对能源消耗间是否存在应有的相关关系,这是拟合工业总产值对能源消耗量的线性回归方程时必须具备的基本前提。量的线性回归方程时必须具备的基本前提。9757. 0625261751691655086166259163788716222222 yynxxnyxxynr将计算资料代入相关系数公式得:

26、将计算资料代入相关系数公式得:第八章第八章 相关与回归分析相关与回归分析 【分析】因为工业总产值与能源消耗量之间存在高度【分析】因为工业总产值与能源消耗量之间存在高度正相关关系(正相关关系( ),所以可以拟),所以可以拟合工业总产值对能源消耗量的线性回归方程。合工业总产值对能源消耗量的线性回归方程。9520.0,9757.02rr公式,得:和将上述已知条件代入。,由计算表可知:,:设一元线性回归方程为3788726175550866259161622xyyxyxnxy第八章第八章 相关与回归分析相关与回归分析 ;第八章第八章 相关与回归分析相关与回归分析5142. 6169167961. 01

27、66257961. 091655086166259163788716222 xyxxnyxxynxxy7961. 05142. 67961. 0 ;第八章第八章 相关与回归分析相关与回归分析家庭家庭收入收入 x x支出支出 y yx x2 2y y2 2X yX y1 12 23 34 45 56 67 78 89 910102020303033334040151513132626383835354343 7 7 9 9 9 91111 5 5 4 4 8 81010 9 91010 400 400 900 9001089108916001600 225 225 169 169 676 676144414441225122518491849 49 49 81 81 81 81121121 25 25 16 16 64 64100100 81 81100100140140270270297297440440 75 75 52 52208208380380315315430430合计合计29329382829577957771871826072607【例二】【例二】为研究家庭收入和食品支出的关系,随机抽取为研究家庭收入和食品支出的关系,随机抽取了了1010个家庭做样本,得到数据如表。个家庭做样本,得到数据如表。如果相关分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论