版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章相关分析§1相关系数、相关矩阵及相关分析一、相关系数相关分析是研究随机变量间的关系,它是多元分析的一个重要内容,本章讲三方面内容:相关系数、相关矩阵;通径分析;典型相关分析。本节介绍相关系数及其相关矩阵的计算方法,它是通径分析及典型相关分析等重要应用的计算基础。1.相关系数的概念协方差 标准协方差即相关系数 2.协方差、相关系数的性质(1)(2)(3)3.相关系数的计算例1设自变量x1,x2与y的观测数据如表,求相关系数。样本号x1x2yx21x22y2x1x2x1yx2y11171149177224841664816323369936811827544479164981283
2、6635571225491443560841525455515141990146240解4.相关系数的意义相关系数r表示x与y间线性相关的密切程度。|r|愈接近0,x与y间线性相关程度愈小;|r|愈大愈接近1,x与y间线性相关愈密切。应注意,当r很小甚至等于0,并不一定表示x与y间不存在其它关系。5.相关系数的显著性检验检验方法:查相关系数检验表教材附表,该表给出相关系数r的5与1显著值的最小值,表上第1列为自由度n-2,第2列概率值p即为显著性水平,第3列变量的个数m。如n=17,m=2,=0.05,就是说在=0.05水平上,当时,才显著,在=0.01水平上,当时才显著。二、相关矩阵1.相关
3、矩阵的概念设有n个随机变量x1,x2,xn,rij为xi与xj的相关系数(i,j=1,2,,n)则称 为相关矩阵。其中 例2试求例1中x1,x2,yx3三个变量间的相关矩阵r解:由例1计算结果,得r11=1,r22=1,r33=1,r12=0.93,r1y=r13=0.93,r2y=r23=0.79,且r21=r12=0.93,r31=r13=0.93,r23=r32=0.79所求相关矩阵r为例3已知市场上肉类x1,鸡蛋x2,水果x3三种商品价格的月份资料的协方差矩阵为试求三种商品价格的月份资料的相关矩阵r。解:由协差阵知,主对角线上元素为三种商品价格月份资料的方差,即2、5、5分别为x1,x
4、2,x3的方差,非主对角线外的元素为协方差。因此,得相关矩阵为三、相关分析例4已知小麦叶面积(x)与产量(y)的数据如表,试计算其相关系数样本号xyxyx2y2119.967013333.0396.01448900223.172816816.8533.61529984328.977022253.0835.21592900428.877022176.0829.44592900528.580022800.0812.25640000632.783027141.01069.29688900741.888536993.01747.24783225203.75453161512.86223.0542768
5、09解:临界值r=0.874就是说,小麦产量y与叶面积x极相关。§2通径分析一、通径系数的概念变量间关系:(1)确定性关系,即函数关系;(2)非确定性关系,即相关关系相关关系:(1)平行关系;(2)因果关系如棉花:皮棉产量(5)单位面积株数(1)每株结铃数(2)单铃重(3)衣分(4)p5·4r14 其中:衣分=皮棉重/籽棉重×100%定义原因变量a的标准差与结果变量x的标准差之比,称为原因变量到结果变量的通径系数(path coefficient)。记作,即二、通径系数的基本性质1.设,则rx·axabrab0px·apx·brx
6、183;b图示:证:同理一般地,设,(i,j=1,2,n,)则对作为如下通径分析:由a到x有两条通径:(1)直接通径,表明原因变量对结果变量的直接影响;(2)间接通径表明原因变量对结果变量的间接影响。于是a与x的相关系数rxa等于a对x的直接影响与间接影响的和。由此可见,通径系数表示原因变量对结果变量的直接影响;相关系数表示直接影响与间接影响的之和。2.设x=a+b,则xabrab0px·apx·b图示:证:即于是即一般地,设则当考虑误差时,有记称px·e为误差e对结果变量x的通径系数(剩余通径)。若px·e绝对值较大,则仍有影响较大的原因,这时,通径分
7、析应予注意。三、通径分析的方法方法分三步:(1)计算相关系数,画出通径图(2)建立方程组,求出通径系数(3)根据通径系数分析原因变量对结果变量的影响例:试用通径分析的方法分析棉花品种某区域试验中,单位面积株数(1)、单株结铃数(2)、单铃重(3),衣分(4)对皮棉产量(5)的影响。(1)计算相关系数,列出通经图(2)(3)(4)(5)(1)-0.11240.60830.07440.5167(2)0.09800.02120.4178(3)0.07650.8105(4)0.5518(2)通径图皮棉产量(5)单位面积株数(1)每株结铃数(2)单铃重(3)衣分(4)p5·4r14p5
8、3;1p5·2p5·32.建立方程组,求出通径系数由性质1推论得:因为 r12=-0.1124,r13=0.6083,r14=0.0744,r15=0.5167,r23=0.0980,r24=0.0212,r25=0.4178,r34=0.0765,r35=0.8105,r45=0.5518代入得=0.0650, =0.3542, =0.670, =0.4787由性质2推论得,把有关值代入,解出0.08873.根据通径系数分析原因变量对结果变量的作用每亩实收株数对皮棉产量作用r51=0.5167直接作用p5·1=0.065通过单株结铃数的间接作用r12p5
9、3;2-0.0338通过单铃重的间接作用r13p5·30.4296通过衣分的间接作用r14p5·40.0556单铃重对皮棉产量作用r52=0.8105直接作用p5·3=0.67通过每亩实收株数的间接作用r31p5·10.0452通过单株结铃数的间接作用r32p5·20.0374通过衣分的间接作用r34p5·40.0572单株结铃数对皮棉产量作用r52=0.4178直接作用p5·2=0.3542通过每亩实收株数的间接作用r21p5·1-0.0086通过单铃重的间接作用r32p5·30.0633通过衣分的间接
10、作用r42p5·40.0082衣分对皮棉产量作用r54=0.5518直接作用p5·4=0.4787通过每亩实收株数的间接作用r41p5·1-0.0058通过单株结铃数的间接作用r42p5·20.027通过单铃重的间接作用r43p5·30.039通经分析表明以下几点:(1)p5·e=0.0887(误差e对结果变量5的通径系数)较小,表明皮棉产量主要受单铃重、衣分、单株结铃数及单位面积株数的影响;(2)单铃重和衣分与产量的相关关系数分别为r53=0.8105,r54=0.5518较大,表明单铃重、衣分对产量的影响较大;单铃重、衣分对产量的
11、通径系数分别为p5·3=0.67, p5·4=0.4787,表明单铃重、衣分对产量的直接影响较大。通径分析与相关分析的结果一致,而后者表明单铃重、衣分对产量直接作用大,间接作用小;(3)株数对产量的相关系数为r51=0.5167较大,似乎表明株数对产量的影响较大,但通径系数为p5·1=0.065较小,说明株数对产量的直接影响小,而株数对产量影响主要通过单铃重的间接作用,r13p5·3=0.4296§3典型相关分析一、典型相关系数1.概念在实际问题中,我们不仅经常遇到求两个随机变量之间的相关系数问题,而且有时也需要研究两组随机变量间的相关关系,典
12、型相关分析就是研究这一类问题的数学方法。典型相关分析研究两组变量间的相关关系不是对两组变量一对一的直接进行研究,而是把两组变量之间的相关变为研究两个新的变量之间的相关,这两个新的变量分别是由第一组变量和第二组变量的线性组合构成的。并使它们所构成的两个新的变量间具有最大的相关,这样两个新变量称为典型变量,这种相关称为典型相关。即:设有两组变量与,观测数据如表 变量样本号x1xpy1yq1x11x1py11y1q2x21x2py21y2qnxn1xnpyn1ynq令,其中,设e(x)=0,e(y)=0,且v(u)=1, v(v)=1,若存在,则称为x,y的典型变量,其相关系数称为典型相关系数,这是
13、第一对典型变量。类似地,由两组变量构成第二对线性组合,且使其与第一对线性组合不相关,又使第二对线性组合间具有最大相关,如此继续,直至由两组变量分别构成的线性组合对与前面构成的线性组合对不相关,且它们之间也不相关为止。2.求法(1)求出样本的协方差阵,其中(2)求典型变量及其相关系数设两组变量与且e(u)=0,e(v)=0,v(u)=1,v(v)=1,其中则及因此,欲使取最大,就是求下述条件极值问题的解:在的条件下,使取得最大值的采用拉氏乘数法求解。取函数求导后令其为零,得可证:(1) (2)证(1) ×1)式得即×2)式得即于是证(2) 把代入2)得: 3)s12s-122
14、×3)得 4)×1)得 5)4)+5)得 6)所以(6)有非零解的充要条件是:可解得p个特征根,由于是u,v相关系数,要求最大,故取最大特征根,代入(6)解出相应的特征向量同理, (7)欲求非零解必须使 可解得q个特征根,把最大的特征根代入(7)得相应的特征向量,于是,即为第一对典型变量,为典型相关系数。同样,为第二对典型变量;即为相应的典型相关系数。3.显著性检验(巴特莱特bartlett,1941年)设,且作,则检验第k+1个典型相关系数的显著性,可采用统计量:且若,则显著。二、典型相关分析的方法1.将原始数据标准化(i=1,p,j=1,q,k=1,n)其中,2.计算协
15、方差阵(相关阵)3.求典型相关系数由或 求出,再由与求出。于是所求典型变量为 及相关系数(i=1,2,k)4.典型相关系数的显著性检验三、例题股份公司在发行股票或债券时往往连带发行认股证书,且有时赠予本公司职工购股证书。某月末随机抽取了100家股份公司,调查五个有关指标:上月普通股的最低价格x1,职工购股证书价格x2,认股证书价格x3,公司季度盈利率(%)x4和公司季度红利分配额x5,五个指标的样本均值和样本协方差阵如表,试用典型相关分析价格指标组与股息指标组间相关关系。指标样本均值样本协方差阵sx120.98244.67103.67144.895.371.19x225.45103.67442.8349.483.690.62x313.02144.8949.48186.631.591.03x40.025.373.691.594.620.24x50.131.190.621.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 田忌赛马课件教学
- 2024一重集团融创科技发展限公司社会公开招聘8人易考易错模拟试题(共500题)试卷后附参考答案
- 传染病防控基本原理课件
- 2024年度光纤通信网络施工及维护合同3篇
- 考核19(西餐)试题
- 2024年度授权合同:某知名品牌授权生产许可
- 2024年度环保技术与研发合同
- 大学万圣节活动策划书14
- 开展同学聚会的策划方案
- 2024年度光伏项目中介担保合同
- 高中劳动教育-主题班会课件
- 乙醚安全周知卡、职业危害告知卡、理化特性表
- 部编版语文四年级上册第五单元类文阅读理解题(含答案)
- 《Linux网络操作系统》课件-项目九 使用gcc和make 调试程序
- 小学主题班会教学设计 《学会说声对不起》通用版
- 无创呼吸机患者的-护理管理
- 执业助理医师报考执业医师执业期考核证明【范本模板】
- 实用管理运筹学陈刚课后参考答案
- 苏科版初中初一数学上册《有理数》评课稿
- 连铸设备操作维护规程检修规程
- 生物化学-代谢与营养-南京医科大学中国大学mooc课后章节答案期末考试题库2023年
评论
0/150
提交评论