第9章相关与回归_第1页
第9章相关与回归_第2页
第9章相关与回归_第3页
第9章相关与回归_第4页
第9章相关与回归_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章第六章 相关与回归相关与回归 n第一节第一节 相关与回归分析的基本问题相关与回归分析的基本问题n第二节第二节 直线相关与简单直线回归分析直线相关与简单直线回归分析n第三节第三节 曲线相关与曲线回归分析曲线相关与曲线回归分析n第四节第四节 时间数列自身相关与自身回归分析时间数列自身相关与自身回归分析n第五节第五节 复相关与复回归分析复相关与复回归分析n第六节第六节 应用相关与回归分析应注意的问题应用相关与回归分析应注意的问题 第一节第一节 相关与回归分析的基本问题相关与回归分析的基本问题一、相关的概念与种类(一) 函数关系n反映现象之间存在着严格的依存关系,也就是说两者之间具有确定性的对应

2、关系,这种关系可用一个数学表达式表示( (二二) ) 相关关系相关关系n反映现象之间存在着反映现象之间存在着不严格的依存关系不严格的依存关系,也就是说两者,也就是说两者之间之间不具有确定性的对应关系不具有确定性的对应关系,即无法用数学公式表示,即无法用数学公式表示相关关系的种类相关关系的种类 n1.1.按相关关系涉及的因素多少可分为按相关关系涉及的因素多少可分为 单相关和复相关单相关和复相关n2.2.按相关关系的形式可分为按相关关系的形式可分为 直线相关和曲线相关直线相关和曲线相关n3.3.按相关关系的性质可分为按相关关系的性质可分为 正相关和负相关正相关和负相关n4.4.按相关程度可分为按相

3、关程度可分为 完全相关、不完全相关和不相关完全相关、不完全相关和不相关第一节第一节 相关与回归分析的基本问题相关与回归分析的基本问题二、回归的概念和种类二、回归的概念和种类n研究研究一个随机变量一个随机变量Y Y对对另一个变量另一个变量(X)(X)或或一组变量一组变量(X(X1 1,X X2 2,X Xk k) )的的相依关系相依关系的统计分析方法。又称一元或者多的统计分析方法。又称一元或者多元回归分析元回归分析n研究研究一个或多个随机变量一个或多个随机变量Y Y1 1 ,Y Y2 2 ,Y Yi i与与另一些变量另一些变量X X1 1、X X2 2,X Xk k之间的之间的关系关系的统计方法

4、。又称多重回归分的统计方法。又称多重回归分析。通常称析。通常称Y Y1 1,Y Y2 2,Y Yi i为因变量,为因变量,X X1 1、X X2 2,X Xk k为为自变量自变量第一节第一节 相关与回归分析的基本问题相关与回归分析的基本问题 1.1.按变量的多少可分为按变量的多少可分为 一元回归和多元回归一元回归和多元回归 2. 2.是否是线性可分为是否是线性可分为 线性回归和非线性回归线性回归和非线性回归 3. 3.是否有滞后关系可分为是否有滞后关系可分为 自身回归和无自身回归自身回归和无自身回归第一节第一节 相关与回归分析的基本问题相关与回归分析的基本问题n三、三、相关与回归分析的区别与联

5、系相关与回归分析的区别与联系n四、相关与回归分析的作用四、相关与回归分析的作用n五、相关与回归分析的步骤五、相关与回归分析的步骤第二节第二节 直线相关与简单直线回归分直线相关与简单直线回归分析析一、相关图与相关表二、简单直线回归分析三、直线相关分析四、估计标准误差五、相关与回归在计算上的联系相关图与相关表相关图,也称散布图相关图,也称散布图( (或散点图或散点图) )。P P206206 简简单单相相关关表表 根根据据总总体体单单位位的的原原始始资资料料汇汇编编的的相相关关表表分分组组相相关关表表 将将原原始始资资料料进进行行分分组组而而编编制制的的相相关关表表单单变变量量分分组组表表 按按自

6、自变变量量分分组组 双双变变量量分分组组表表 按按自自变变量量和和因因变变量量均均分分组组年份年份旅游收入(亿元)旅游收入(亿元)旅游人数旅游人数其中其中:(百万人次百万人次)城镇居民城镇居民农村居民农村居民19941023.5 52420531919951375.7 62924638319961638.4 63925638319972112.7 64425938519982391.2 69525044519992831.9 71928443520003175.5 74432941520013522.4 78437540920023878.4 87838549320033442.3 87035

7、151920044710.7 110245964320055285.9 121249671620066229.7 139457681820077770.6 161061299820088749.3 17127031009200910183.7 1902903999201012579.8 210310651038201119305.4 26411687954201222706.2 295719331024 例例1:国内旅游人数与国内旅游收入相关表:国内旅游人数与国内旅游收入相关表国内旅游人数与国内旅游收入相关国内旅游人数与国内旅游收入相关图图例2:单变量分组相关表序号序号月收入月收入人数人数月平

8、均支出月平均支出n1 856 2 799.50 n2 858 2 800.50 n3 862 3 806.00 n4 865 4 812.00 n5 870 2 820.00 n6 880 5 848.80 n7 885 4 854.75 n8 898 7 860.72 n9 902 5 863.40 n10 915 6 868.83 n合计合计 40月收入单变量与月支出分组相关图例3:双变量分组相关表序号家庭月支出855865865875875885885895895905905915序号序号123456頻数頻数组中值组中值8608708808909009101895905900112885

9、8958901138758858801124865875870115855865860527684585585012418783584584032278825835830112981582582022108058158102351179580580055頻数頻数765413641第二节第二节 直线相关与简单直线回归分直线相关与简单直线回归分析析二二 简单直线回归分析简单直线回归分析1 1、特点、特点P206P2062 2、简单直线回归方程:最小二乘法、简单直线回归方程:最小二乘法一、直线回归一、直线回归( (一一) ) 简单直线回归分析简单直线回归分析简简单直线回归方程的一般形式为:单直线回归

10、方程的一般形式为: y=a+bxy=a+bx y y 因变量的估计值;因变量的估计值; x x 自变量;自变量; a a 回归直线在回归直线在y y轴上的截距;轴上的截距; b b 回归直线的斜率,称回归系数回归直线的斜率,称回归系数, ,表明表明x x每增加每增加 一个单位,因变量一个单位,因变量y y的平均变化值的平均变化值 b0b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关 a a、b b的确定:的确定:在在简单直线回归方程中,简单直线回归方程中,a a、b b为待定系数,常用为待定系数,常用最小平方法来确定,即最小平方法来确定,即(y-y(y-yc

11、c) )2= =最小值。最小值。2ynabxxyaxbx 即即22()nxyxybnxxyxabnn 简单直线回归方程建立的步骤为:简单直线回归方程建立的步骤为: 确确定自变量定自变量x x和因变量和因变量y y; 计计算算x x2、xyxy、xx、yy、xx2、xyxy; 代代入公式,先求入公式,先求b b,再求,再求a a。从单变量分组表配合回归直线:从单变量分组表配合回归直线: 222cyabxyfafbxfxyfaxfbx ffxyfxfyfbfx fxfyfxfaybxbff 方方法法基基本本上上与与上上述述相相同同,只只是是在在计计算算过过程程中中要要采采用用加加权权方方法法:简单

12、直线回归分析的主要特点:简单直线回归分析的主要特点: 1.1.直直线回归分析时,要根据研究目的,在两线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。个变量之间确定哪个是自变量,哪个是因变量。 2.2.在在两个现象互为根据的情况下,可以有两两个现象互为根据的情况下,可以有两个回归方程:个回归方程: y yc c=a+bx =a+bx 称称y y倚倚x x回归直线回归直线 x xc c=c+dy =c+dy 称称x x倚倚y y回归直线回归直线序号序号年份年份yxxyx2ycy-yc(y-yc)2y211999195203900 400 217.45 -22.45 50

13、4.21 38025 b=2.2767 22000210204200 400 217.45 -7.45 55.57 44100 a=171.9196 32001244266344 676 231.12 12.88 166.02 59536 42002264359240 1225 251.61 12.39 153.62 69696 Syx =30.6948 520032945215288 2704 290.31 3.69 13.61 86436 y =166.7260 620043145617584 3136 299.42 14.58 212.65 98596 r =0.9829 7200536

14、08129160 6561 356.34 3.66 13.42 129600 8200643213156592 17161 470.17 -38.17 1457.22 186624 9200748114971669 22201 511.16 -30.16 909.33 231361 10200856716392421 26569 543.03 23.97 574.58 321489 112009655232151960 53824 700.13 -45.13 2036.28 429025 122010704202142208 40804 631.82 72.18 5209.56 495616

15、合计合计4720 1167 600566 175661 4720.00 0.00 11306.08 2190104 平均平均393.33 97.25 方差方差27797.56 5180.85 标准差标准差166.73 71.98 回归方程:回归方程:y =171.9196+2.2767x例例9-1相关图相关图相关系数相关系数 相相关系数关系数是在直线相关条件下,表明两是在直线相关条件下,表明两个现象之间个现象之间相关关系的方向和密切程度相关关系的方向和密切程度的综的综合性指标。一般用符号合性指标。一般用符号r表示。表示。r r的测定方法:的测定方法:2222221 ()()11 () ()()

16、() ()()1.xyxyxyxyrxxyynxxyynnxxyyrxxyy 积积差差法法:r rr rr rr r0.30.3时时,没没有有关关系系;0.30.3 0.50.5时时,称称低低度度相相关关;0.50.5 0.80.8时时,称称显显著著相相关关( (或或中中度度相相关关) );0.80.8时时,称称高高度度相相关关;一一般般标标准准如如下下:对r的解释如下:(即r的特点)(1) (1) r r取正值或负值决定于分子协方差;取正值或负值决定于分子协方差;(2) (2) r r的绝对值,在的绝对值,在0 0与与1 1之间;之间;(3) (3) r r的绝对值大小,可说明现象之间相关关

17、系的紧的绝对值大小,可说明现象之间相关关系的紧密程度。密程度。2.2.简捷法简捷法 2222)()()( yynxxnyxxynr3.3.从单变量分组表计算相关系数从单变量分组表计算相关系数 22()()()() , xxyy frxxfyyfxfyfxyff 积积差差法法:其其中中: 2222fxyfxfyfrfx fxffy fyf 简简捷捷法法:组号组号yxfxfyffx2fy2fxy1799.50 8562 1712.00 1599.00 1465472.00 1278400.50 1368744.00 2800.50 8582 1716.00 1601.00 1472328.00 1

18、281600.50 1373658.00 3806.00 8623 2586.00 2418.00 2229132.00 1948908.00 2084316.00 4812.00 8654 3460.00 3248.00 2992900.00 2637376.00 2809520.00 5820.00 8702 1740.00 1640.00 1513800.00 1344800.00 1426800.00 6848.80 8805 4400.00 4244.00 3872000.00 3602307.20 3734720.00 7854.75 8854 3540.00 3419.00 31

19、32900.00 2922390.25 3025815.00 8860.72 8987 6286.00 6025.04 5644828.00 5185872.43 5410485.92 9863.40 9025 4510.00 4317.00 4068020.00 3727297.80 3893934.00 10868.83 9156 5490.00 5212.98 5023350.00 4529193.41 4769876.70 合计合计8334.50 8791.00 40 35440.00 33724.02 31414730.00 28458146.09 29897869.62 r=0.9

20、454 735516595600.00 1016318.73 771.75 1008.13 单变量分组相关表4 4. .从双变量分组表计算相关系数从双变量分组表计算相关系数 22yyyfxxxfyyxxxyfr月支出月支出月收入月收入855865865875875885885895895905905915頻数頻数合计合计平均平均组中值组中值860870880890900910895905900119008858958901189087588588011217608658758701187085586586052760208458558501241868008358458403227588082

21、583583011216608158258202216408058158102354050795805800554000頻数頻数76541364134470840.73 合计合计602052204400356011700546036360平均平均886.83 x-X-26.83 -16.83 -6.83 3.17 13.17 23.17 y-Yfy(y-Y)(y-Y)fxy(x-X)(y-Y)合计合计59.27 3512.73 1373.29 49.27 2427.36 648.90 0.00 39.27 3084.00 517.19 909.88 29.27 856.63 678.17 19

22、.27 2598.87 1268.89 892.92 9.27 687.21 -63.30 58.77 488.28 214.75 -0.73 3.75 14.99 -4.64 -19.27 -10.73 230.34 180.61 73.29 0.00 -20.73 859.61 697.80 -30.73 4722.19 1649.02 1551.58 -40.73 8295.36 5464.01 0.00 27278.05 7113.03 2429.98 24.99 54.13 2903.99 4069.01 16595.12 165.16111.75r=0.8991 第二节第二节 直线

23、相关与简单直线回归分直线相关与简单直线回归分析析三、直线相关分析四、估计标准误差五、相关与回归在计算上的联系估计标准误差的概念和作用一、一、 估计标准误差估计标准误差就是用来说明回归方程推算结果的准确就是用来说明回归方程推算结果的准确程度的统计分析指标。以绝对值表示,其数程度的统计分析指标。以绝对值表示,其数值越小,说明推算结果的准确程度越高,回值越小,说明推算结果的准确程度越高,回归直线的代表性也越大。归直线的代表性也越大。用用S Syxyx表示,也可用表示,也可用S Sy y表示。表示。二、估计标准误差的计算方法二、估计标准误差的计算方法 2yS . 22 yaybxyn 捷捷法法公公式式

24、:简简1. 定定义公式义公式:22 nyyScy)(S Sy y和和r r的异同点:的异同点:相同点相同点:都具有说明相关关系密切程度的作用;:都具有说明相关关系密切程度的作用;不同点不同点: (1): (1)r r越大越好,而越大越好,而S Sy y越小越好;越小越好; (2)r(2)r用相对数表现,密切程度的概念比较明确用相对数表现,密切程度的概念比较明确 S Sy y用绝对数表现,关系密切的程度表示得用绝对数表现,关系密切的程度表示得 不那么明显;不那么明显; (3)r(3)r能说明正、负相关,能说明正、负相关,S Sy y不能说明。不能说明。第三节第三节 曲线相关与曲线回归分析曲线相关

25、与曲线回归分析 l在回归分析中,两个变量之间的回归称为在回归分析中,两个变量之间的回归称为简单回简单回归归,两个以上变量之间的回归称为,两个以上变量之间的回归称为复回归复回归l无论是简单回归还是复回归,数学模型均有无论是简单回归还是复回归,数学模型均有线性线性( (直线直线) )回归回归和和非线性非线性( (曲线曲线) )回归回归之分。之分。第三节第三节 曲线相关与曲线回归分析曲线相关与曲线回归分析 一一 曲线相关与曲线回归的概念与分类曲线相关与曲线回归的概念与分类 P P215215l曲线相关曲线相关又称非线性相关,是指两列伴随相变化的又称非线性相关,是指两列伴随相变化的变量,未能形成直线关系。变量,未能形成直线关系。l如果现象相关点的分布不表现为直线的关系,而近如果现象相关点的分布不表现为直线的关系,而近似于某种曲线方程的关系似于某种曲线方程的关系l例如表现为抛物线、双曲线、指数曲线等非直线形例如表现为抛物线、双曲线、指数曲线等非直线形式,则这种关系就是非线性相关。式,则这种关系就是非线性相关。第三节第三节 曲线相关与曲线回归分析曲线相关与曲线回归分析 二 可线性化的曲线回归方程变换 P216l双曲线回归方程l对数曲线回归方程l二次曲线回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论