统计-统原PP第八章相关分析ppt课件_第1页
统计-统原PP第八章相关分析ppt课件_第2页
统计-统原PP第八章相关分析ppt课件_第3页
统计-统原PP第八章相关分析ppt课件_第4页
统计-统原PP第八章相关分析ppt课件_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章第八章 相关关系分析相关关系分析 研讨相互联络的两种以上景象间的统计规律。 第一节 相关和回归的概念和作用 1、根本概念 (1)依存关系 景象与景象之间或景象的标志与标志之间相互联络与制约的关系。前因后果关系互为因果关系非直接因果关系 作为缘由的变量称为自变量X,对应变量称为因变量Y。(图示) (2)函数关系 严厉确实定性的关系。给定自变量x某一数值,因变量y有确定数值与之对应。 (3)相关关系 非确定性的关系。给定自变量x某一数值,因变量y有许多数值与之对应,并分布在其平均数周围。关系 (4)相关分析 研讨两个或两个以上随机变量之间相关程度的大小称为相关分析。 (5)回归分析 研讨普通

2、变量不同变化程度随机变量对应的变动规律,以及进展准确测定称为回归分析。 变量之间依存关系变量之间依存关系函数关系函数关系相关关系相关关系因果关系因果关系互为因果关系互为因果关系非直接因果非直接因果:共变关系共变关系确定性依存关系确定性依存关系随机性依存关系随机性依存关系解释一:图示解释一:图示|解释解释:相关分析和回归分析的关系:相关分析和回归分析的关系:|区别区别|1变量之间能否存在对等关系;在回归分析中,变量之间能否存在对等关系;在回归分析中,y被称为因变量,被称为因变量,处在被解释的特殊位置,而在相关分析中,处在被解释的特殊位置,而在相关分析中,x与与y处于平等的位置,处于平等的位置,即

3、研讨即研讨x与与y的亲密程度和研讨的亲密程度和研讨y与与x的亲密程度是一致的;的亲密程度是一致的; |2变量之间位置的变化和计算结果;相关分析中,变量之间位置的变化和计算结果;相关分析中,x与与y都是随都是随机变量,而在回归分析中,机变量,而在回归分析中,y是随机变量,是随机变量,x可以是随机变量,也可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定可以是非随机的,通常在回归模型中,总是假定x是非随机的;是非随机的;|3对资料的要求。从资料所具备的条件来说,作相关分析时要对资料的要求。从资料所具备的条件来说,作相关分析时要求两变量都是随机变量如:人的身长与体重;作回归分析时求两变量都

4、是随机变量如:人的身长与体重;作回归分析时要求因变量是随机变量,自变量可以是随机的,也可以是普通变要求因变量是随机变量,自变量可以是随机的,也可以是普通变量量(即可以事先指定变量的取值,如:用药的剂量即可以事先指定变量的取值,如:用药的剂量)。 4相关分析旨在测度变量之间的关系亲密程度相关分析旨在测度变量之间的关系亲密程度,用用的测度工具是相关系数的测度工具是相关系数. 回归分析偏重于调查变量之间的数量变化规律回归分析偏重于调查变量之间的数量变化规律,并经过一定的数学表达式描画它们间的关系并经过一定的数学表达式描画它们间的关系,进进而确定一个或几个变量的变化对被解释变量的影而确定一个或几个变量

5、的变化对被解释变量的影响程度响程度. 5相关系数是独一确定的。相关系数是独一确定的。 而在回归分析中,对于互为因果的两个变量而在回归分析中,对于互为因果的两个变量 (如如人的身高与体重,商品的价钱与需求量人的身高与体重,商品的价钱与需求量),那么,那么有能够存在多个回归方程。有能够存在多个回归方程。|联络联络:|两者都是研讨变量之间不确定性统计关系的重要方法两者都是研讨变量之间不确定性统计关系的重要方法.|1函数关系是相关关系的特例,即函数关系是完全的相函数关系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系。关关系,相关关系是不完全的相关关系。|2函数关系与相关关系虽

6、然有明显的区别,但两者之间函数关系与相关关系虽然有明显的区别,但两者之间并不存在不可跨越的界限。由于存在测算误差等缘由,并不存在不可跨越的界限。由于存在测算误差等缘由,函数关系在实践中往往经过相关关系表现出来。而在函数关系在实践中往往经过相关关系表现出来。而在研讨相关关系时,为了找到景象间数量关系的内在联研讨相关关系时,为了找到景象间数量关系的内在联络和表现方式,又经常需求借助于函数关系的方式加络和表现方式,又经常需求借助于函数关系的方式加以描画。以描画。|3因此,相关关系是相关分析的研讨对象,函数关系是因此,相关关系是相关分析的研讨对象,函数关系是相关分析的工具。相关分析是回归分析的前提相关

7、分析的工具。相关分析是回归分析的前提 ;|回归分析是相关分析的继续和拓展。回归分析是相关分析的继续和拓展。相关分析相关分析回归分析回归分析联联系系 *研究变量间的不确定性关系,研究变量间的不确定性关系,存在相关才能回归存在相关才能回归 *相关系数与回归模型中的参数相互换算相关系数与回归模型中的参数相互换算区区别别*变量地位对等变量地位对等*都是随机变量都是随机变量*侧重相关的密切程度和变侧重相关的密切程度和变化方向化方向*分为因变量与自变量分为因变量与自变量*因变量为随机变量因变量为随机变量*侧重建立模型预测或估计侧重建立模型预测或估计因变量因变量二、相关关系的种类1、按涉及变量的多少分、按涉

8、及变量的多少分 简单相关简单相关 两变量的相关关系两变量的相关关系偏相关偏相关 在多元回归分析中,在消除其他变量影响的条件下,所计在多元回归分析中,在消除其他变量影响的条件下,所计算的某两变量之间的相关关系。复相关算的某两变量之间的相关关系。复相关 三个以上变量的关系三个以上变量的关系2、简单相关按方式分、简单相关按方式分 直线相关直线相关 均匀增或减均匀增或减 曲线相关曲线相关 时增时减或时快时慢时增时减或时快时慢3、直线相关按方向分、直线相关按方向分 正相关正相关 y随随x的添加而添加的添加而添加 负相关负相关 y随随x的添加而减少的添加而减少4、按相关程度分类:、按相关程度分类:1完全相

9、关:一种景象的数量变化完全由完全相关:一种景象的数量变化完全由另一种景象的数量变化所确定。在这种情况下,相关关系便称为另一种景象的数量变化所确定。在这种情况下,相关关系便称为函数关系,因此也可以说函数关系是相关关系的一个特例。函数关系,因此也可以说函数关系是相关关系的一个特例。2不完全相关:两个景象之间的关系介于完全相关和不相关之间不完全相关:两个景象之间的关系介于完全相关和不相关之间3不相关:两个景象彼此互不影响,其数量变化各自独立不相关:两个景象彼此互不影响,其数量变化各自独立 三、相关分析的根本方法三、相关分析的根本方法1、2定性定性1、相关表、相关表 粗略反映相关变量的方式和程度粗略反

10、映相关变量的方式和程度2、相关图、相关图 直观反映相关变量的方式和程度直观反映相关变量的方式和程度3、相关系数、相关系数 量化测定相关变量的亲密程度。量化测定相关变量的亲密程度。 简单相关系数简单相关系数 复相关系数复相关系数 偏相关系数偏相关系数 相关指数相关指数4、回归方程式、回归方程式 数学方式表达变量之间的变动关系。数学方式表达变量之间的变动关系。 一元回归一元回归 多元回归多元回归 线性回归线性回归 非线性回归非线性回归解释解释线性相关是指当一个变量变动时,另一个变量线性相关是指当一个变量变动时,另一个变量随之发生大致均等的变动,分布图接近一条直随之发生大致均等的变动,分布图接近一条

11、直线。线。非线性相关是指当一个变量变动时,另一个变非线性相关是指当一个变量变动时,另一个变量的变动不是均等的,分布图接近一条曲线。量的变动不是均等的,分布图接近一条曲线。完全相关是指相关的变量之间,其中一个变量完全相关是指相关的变量之间,其中一个变量的数值变化完全由另一个或一组变量的数值变的数值变化完全由另一个或一组变量的数值变化所确定的化所确定的 。不相关是指变量之间彼此独立,互不影响。不相关是指变量之间彼此独立,互不影响。不完全相关是指介于完全相关和不相关之间的不完全相关是指介于完全相关和不相关之间的一种相关关系。一种相关关系。单位序号单位序号亩施肥量亩施肥量(公斤公斤)X亩产量亩产量(公

12、斤公斤)Y155296260325365319470372574387679406780389882434984497108552811865111290535相关图相关图 小麦施肥量和亩产量相关图小麦施肥量和亩产量相关图2222yynxxnyxxynr 加权相关系数 用于分组资料fyyfxxfyyxxr22)()()(2222yyxxyxxyyffynxffxnyfxfxyfnrNoImage回归方程的根本方式回归方程的根本方式 y c=a+bx a、b为待定参数为待定参数 系数方程组为:系数方程组为:min2cyy2xbxaxyxbnay 222222xxyxxyxxyxxnyxxynbx

13、byaubxay 复相关系数一个要素或变量同时与几个要素或变量之间复相关系数一个要素或变量同时与几个要素或变量之间的相关关系。复相关系数是度量复相关程度的目的,它的相关关系。复相关系数是度量复相关程度的目的,它可利用单相关系数和偏相关系数求得。复相关系数越大,可利用单相关系数和偏相关系数求得。复相关系数越大,阐明要素或变量之间的线性相关程度越亲密。阐明要素或变量之间的线性相关程度越亲密。 复相关系数复相关系数(多重相关系数多重相关系数):多重相关的本质就是:多重相关的本质就是Y的实践察看值与由的实践察看值与由p个自变量预测的值的相关。个自变量预测的值的相关。 偏相关系数在多元回归分析中,在消除

14、其他变量影响的偏相关系数在多元回归分析中,在消除其他变量影响的条件下,所计算的某两变量之间的相关系数。条件下,所计算的某两变量之间的相关系数。 相关指数相关指数R2表示一元多项式回归方程拟合度的高低,表示一元多项式回归方程拟合度的高低,或者说表示一元多项式回归方程估测的可靠程度的高低。或者说表示一元多项式回归方程估测的可靠程度的高低。 R2=1-y-y估测值估测值2(y-y平均值平均值2) 相关关系的类型相关关系的类型图示图示相关关系相关关系单相关单相关变量数量变量数量复相关复相关相关的方向相关的方向 正相关正相关负相关负相关相关的程度相关的程度 完全相关完全相关 不完全相关不完全相关 不相关

15、不相关表现方式表现方式 线形相关线形相关非线形相关非线形相关x y (a) x y (b) x y (c) x y (d) 解释:图示解释:图示一元相关一元相关多元相关多元相关负负 相相 关关正正 相相 关关线性相关线性相关曲线相关曲线相关y正 相 关y负 相 关y曲线相关xy不 相 关xxx解释:相关的种类图示解释:相关的种类图示笫二节笫二节 简单相关分析简单相关分析一、相关表一、相关表1、简单相关表、简单相关表 将自变量按顺序陈列,对应列出因变量之值,成平行数列表。将自变量按顺序陈列,对应列出因变量之值,成平行数列表。表表81 小麦亩施肥量与亩产量相关表小麦亩施肥量与亩产量相关表单位序号单

16、位序号亩施肥量亩施肥量(公斤公斤)X亩产量亩产量(公斤公斤)Y1552962603253653194703725743876794067803898824349844971085528118651112905352、单变量分组表、单变量分组表 将自变量分组顺序陈列成表,对应列出因变量的次数和均数。表82 人均收入与人均消费分组相关表按人均收入分组按人均收入分组(元(元)村村 数数人均消费平均额人均消费平均额(元元)25035032923504508408450550185125506501561865075066967508502821合计合计523、双变量分组表、双变量分组表 自变量和因变量

17、都分组,编成棋盘式表格,列自变量和因变量都分组,编成棋盘式表格,列出对应次数。出对应次数。单位产品单位产品成成 本本 工人产品日产量(公斤工人产品日产量(公斤/日日) 合计合计 (元公斤)(元公斤) 5101015152525303035671156123645 3531134 1431923 123合计合计26127330单位序号单位序号亩施肥量亩施肥量(公斤公斤)X亩产量亩产量(公斤公斤)Y1653962704253754194804725854876905067955898100664 二、相关图 1、散点图 据成对(x,y)的资料,在直角坐标系中绘点,成散点图。 2、简单相关表直接绘制

18、相关图 小麦施肥量和亩产量相关图人均收入与人均消费分组相关表人均收入与人均消费分组相关表按人均收入分组按人均收入分组(元(元)村村 数数人均消费平均额人均消费平均额(元元)25035032923504508408450550185125506501561865075066967508502821合计合计523、单变量分组相关表相关图、单变量分组相关表相关图 单项数列直接绘制,组距数列用组中值绘制。单项数列直接绘制,组距数列用组中值绘制。 人均收入和人均消费相关图人均收入和人均消费相关图单位产品单位产品成成 本本 工人产品日产量(公斤工人产品日产量(公斤/日日) 合计合计 (元公斤)(元公斤)

19、5101015152525303035671156123645 3531134 1431923 123合计合计261273304、双变量分组表相关图、双变量分组表相关图 在每组对应格内以点代表次数。在每组对应格内以点代表次数。 双变量分组相关图双变量分组相关图三、相关系数三、相关系数 用于测定两变量之间线性相关程度的统计目的。 皮尔生相关系数 (积差法公式) 为变量x与y的协方差 (1) r的取值在1与十1之间,即1r1。r0表示正相关,即两相关变量为同增同减的正向关系,r0表示负相关,即两相关变量间为一增一减的反向关系。 (2) 越接近于l,阐明相关程度越高, 1,表示完全相关,即为函数关系

20、; 越接近于0,阐明相关程度越低, 0,表示不相关,即没有相关关系。 (3)当r的绝对值接近于0或等于0时,只能阐明两变量间不存在直线相关关系而不能阐明两变量不存在其他类型的关系。 (4)加权相关系数: NoImageyxxy22xyrrrr一一fyyfxxfyyxxr222222yynxxnyxxynr 加权相关系数 用于分组资料 关亲密程度的等级 0.30.5低度相关 0.50.8显著相关 0.8以上高度相关fyyfxxfyyxxr22)()()(2222yyxxyxxyyffynxffxnyfxfxyfnrNoImage 1 相关系数的运用113/76.76813/61.5213/07.

21、198 =0.985将上表资料代入公式可得将上表资料代入公式可得【例】根据表资料,计算相关系数【例】根据表资料,计算相关系数( (利用简捷公式利用简捷公式) )。计算数据如下表所示计算数据如下表所示: :表表 月产量与消费费用相关系数计算数据表月产量与消费费用相关系数计算数据表月份月份产量产量( (千吨千吨) ) x x生产费用生产费用( (万元万元) )y yx x2 2y y2 2xyxy1 12 23 34 45 56 67 78 81.21.22.02.03.13.13.83.85.05.06.16.17.27.28.08.0626286868080110110115115132132

22、1351351601601.441.444.004.009.619.6114.4414.4425.0025.0037.2137.2151.8451.8464.0064.003844384473967396640064001210012100132251322517424174241822518225256002560074.474.4172172248.0248.0418.0418.0575575805.2805.2972.0972.01280.01280.0合计合计36.436.4880880207.54207.541042141042144544.64544.6根据样本相关系数的计算公式,计算相关系根据样本相关系数的计算公式,计算相关系数为数为: 2222yynxxnyxxyn97. 088010421484 .3654.20788804 .366 .4544822月产量与消费费用之间的相关系数为月产量与消费费用之间的相关系数为+0.97+0.97。 某地居民收入和消费资料如右表所示。某地居民收入和消费资料如右表所示。 计算相关系数计算相关系数 解:饮食消费解:饮食消费 r=0.955收入水平收入水平(元元)人口数人口数饮食消费饮食消费(元元)400以下以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论