典型相关分析实证分析_第1页
典型相关分析实证分析_第2页
典型相关分析实证分析_第3页
典型相关分析实证分析_第4页
典型相关分析实证分析_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、典型相关分析实例分析典型相关分析实例分析例例1 1、身体形态与健康状况的典型相关分析、身体形态与健康状况的典型相关分析例例2 2、长子和次子头型的典型相关分析长子和次子头型的典型相关分析 统计软件:统计软件:SPSSSPSS典型相关分析的基本思想典型相关分析的基本思想n简单相关系数(即普通回归方法)描述两组变量的相关关系的n缺点:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题复杂,难以从整体描述。n典型相关是简单相关、多重相关的推广典型相关是简单相关、多重相关的推广。典型相关是研究两组变量之间相关性研究两组变量之间相关性的一种统计分

2、析方法。n也是一种降维技术是一种降维技术。典型相关分析n考虑两组变量的线性组合, 并研究它们之间的相关系数.在所有的线性组合中在所有的线性组合中, , 找一对相关系数最大找一对相关系数最大的线性组合的线性组合, , 用这个组合的单相关系数来表示两组用这个组合的单相关系数来表示两组变量的相关性变量的相关性, , 叫做两组变量的典型相关系数叫做两组变量的典型相关系数,而这两个线性组合叫做一对典型变量。n在两组多变量的情形下, 需要用若干对典型变量才能完全反映出它们之间的相关性。n下一步, 再在两组变量的与u1,v1不相关的线性组合中, 找一对相关系数最大的线性组合, 它就是第二对典型变量, 而且p

3、(u2,v2)就是第二个典型相关系数。这样下去, 可以得到若干对典型变量, 从而提取出两组变量间的全部信息。使用范围使用范围n为了研究两组变量的关系,如果在理论上能解释谁是自变量,谁是因变量,自然就做路径分析。n如果不能辨别两组变量谁是是自变量,谁是因变量,那再用回归就不恰当的,有一种多对多的相关可以使用,那就是典型相关Canonical correlationn在作两组变量的典型相关分析之前,首先应检验两组变量是否相关。如果不相关,则讨论两组变量的典型相关就毫无意义。n典型相关分析的实质就是在两组随机变量中选取若干个有代表性的综合指标(变量的线性组合), 用这些指标的相关关系来表示原来的两组

4、变量的相关关系。这在两组变量的相关性分析中, 可以起到合理的简化变量的作用;n当典型相关系数足够大时当典型相关系数足够大时, , 可以像回归分析那样可以像回归分析那样, , 由一组变量的数值预测另一组变量的线性组合的数由一组变量的数值预测另一组变量的线性组合的数值值。实例实例1 1n例例1 1:1515名受试者的身体形态以及健康情况指标名受试者的身体形态以及健康情况指标n第一组是第一组是身体形态变量身体形态变量,有年龄、体重、胸围和日抽烟量;,有年龄、体重、胸围和日抽烟量;第二组是第二组是健康状况变量健康状况变量,有脉搏、收缩压和舒张压。,有脉搏、收缩压和舒张压。n要求测量身体形态以及健康状况

5、这两组变量之间的关系。要求测量身体形态以及健康状况这两组变量之间的关系。 表表1.1 1.1 两组身体素质的典型变量两组身体素质的典型变量 (一)操作步骤(一)操作步骤n在在SPSSSPSS中没有提供典型相关分析的专门菜单,必须在语句中没有提供典型相关分析的专门菜单,必须在语句窗口中调用窗口中调用SPSSSPSS的的 Canonical correlation.sps Canonical correlation.sps 宏。宏。n具体方法具体方法:1. .打开打开FileNewSyntaxFileNewSyntax 在窗口中输入下面语句:在窗口中输入下面语句:图图1.1 1.1 语句窗口语句窗

6、口 INCLUDE c:Program FilesIBMSPSSstatistics19samplesenglishCanonical correlation.sps.CANCORR SET1=x1 x2 x3 x4 /SET2=y1 y2 y3 / . 2. 2. 点击语句窗口点击语句窗口RunRun菜单中的菜单中的AllAll子菜单项,运行子菜单项,运行典型相关宏命令,得出结果。典型相关宏命令,得出结果。 (二)主要运行结果解释(二)主要运行结果解释1. 两组变量两组变量内部内部以及两组变量之以及两组变量之间间的相关系数矩阵的相关系数矩阵Correlations for Set-1 x1

7、x2 x3 x4x1 1.0000 .7697 .5811 .1022x2 .7697 1.0000 .8171 -.1230 x3 .5811 .8171 1.0000 -.1758x4 .1022 -.1230 -.1758 1.0000身体形态:年龄 x1、体重x2、胸围x3、日抽烟量x4;健康状况:脉搏y1、收缩压y2、舒张压y3Correlations for Set-2y1y2y3y11.0000.8865.8614y2.88651.0000.7465y3.8614.74651.0000Correlations Between Set-1 and Set-2y1y2y3x1.758

8、2.8043.5401x2.8572.7830.7171x3.8864.7638.8684x4.0687.1169.0147身体形态:年龄 x1、体重x2、胸围x3、日抽烟量x4;健康状况:脉搏y1、收缩压y2、舒张压y32. Canonical Correlations2. Canonical Correlations(典型相关系数)(典型相关系数)从表中可以看出从表中可以看出第一典型相关系数第一典型相关系数达到达到0.9570.957,第二典型相关系数为第二典型相关系数为0.5820.582,第三典型相关系数为第三典型相关系数为0.1800.180。 3. 3. 典型相关的显著性检验典型相

9、关的显著性检验分别为分别为WilksWilks统计量、卡方统计量、自由度和伴随概率。统计量、卡方统计量、自由度和伴随概率。在在0.050.05的显著性水平下,三对典型变量中只有第一对典的显著性水平下,三对典型变量中只有第一对典型相关是显著的。型相关是显著的。 n Raw Canonical Coefficients for Set-1 1 2 3x1 -.031 -.139 .130 x2 -.019 -.014 -.280 x3 -.058 .089 .101x4 -.071 .019 .010Raw Canonical Coefficients for Set-2 1 2 3y1 -.12

10、1 -.032 -.461y2 -.021 -.155 .215y3 -.021 .227 .1895.5.两组典型变量的标准化系数两组典型变量的标准化系数本例中的数据单位本例中的数据单位并不统一并不统一StandardizedCanonicalCoefficientsforSet-1123x1-.256-1.1301.060 x2-.151-.113-2.215x3-.6941.0671.212x4-.189.051.027来自来自身体形态指标身体形态指标的第一典型变量的第一典型变量 为:为:112340.2560.1510.6940.189VXXXX 身体形态:年龄 x1、体重x2、胸围x

11、3、日抽烟量x4StandardizedCanonicalCoefficientsforSet-2123y1-.721-.191-2.739y2-.171-1.2651.751y3-.1421.5141.259来自来自健康状况指标健康状况指标的第一典型变量的第一典型变量 为为:由于由于Y Y1 1(脉搏)的系数(脉搏)的系数-0.721-0.721绝对值最大,说明绝对值最大,说明健康状况的典型变量主要由健康状况的典型变量主要由脉搏脉搏所决定。所决定。11230.7210.1710.142UYYY 身体形态:年龄 x1、体重x2、胸围x3、日抽烟量x4;健康状况:脉搏y1、收缩压y2、舒张压y3

12、 下面即将输出的是冗余度(Redundancy)分析结果它列出各典型相关系数所能解释原变量变异的比例,可以用来辅助判断需要保留多少个典型相关系数。给出的四组数据分别是给出的四组数据分别是: :身体形态变量被自身的典型变量自身的典型变量解释的方差比例 被健康状况的典型变量健康状况的典型变量解释的方差比例健康状况变量被自身的典型变量自身的典型变量解释的方差比例 被身体形态的典型变量身体形态的典型变量解释的方差比例 6. 6. 典型变量的冗余分析典型变量的冗余分析 典型冗余分析典型冗余分析身体形态变量被身体形态变量被自身的典型变量、健康状况的典型变量自身的典型变量、健康状况的典型变量解释的方差比例解

13、释的方差比例 身体形态变量被自身的第一典型变量解释了身体形态变量被自身的第一典型变量解释了57.6%57.6%健康状况变量被健康状况变量被自身的典型变量、健康状况的典型变量自身的典型变量、健康状况的典型变量解释的方差比例解释的方差比例健康状况变量被自身的第一典型变量解释了健康状况变量被自身的第一典型变量解释了87.4%87.4%二、典型相关分析实例二、典型相关分析实例2 2n利用SPSS软件对C.R.Rao(1952)关于典型相关的经典例子进行分析。n表2.1列举了25个家庭的成年长子和次子的头长和头宽。n利用典型相关分析法分析长子和次子头型的相关性。表表2.1 2.1 长子和次子的头长与头宽

14、长子和次子的头长与头宽 (一)操作步骤(一)操作步骤1. 1. 按按FileNewSyntaxFileNewSyntax的顺序新建一个语句窗的顺序新建一个语句窗口。在语句窗口中输入下面的语句:口。在语句窗口中输入下面的语句: INCLUDE C:Program Files (x86)SPSSIncSPSS16 Canonical correlation.sps.CANCORR SET1=x1 x2 /SET2=y1 y2 / .2. 2. 点击语句窗口点击语句窗口RunRun菜单中的菜单中的AllAll子菜单项,运行子菜单项,运行典型相关宏命令,得出结果。典型相关宏命令,得出结果。 (二)主要

15、运行结果解释(二)主要运行结果解释1. 1. 典型相关系数典型相关系数Correlations for Set-1 x1 x2x1 1.0000 .7346x2 .7346 1.0000Correlations for Set-2 y1 y2y1 1.0000 .8366y2 .8366 1.0000Correlations Between Set-1 and Set-2 y1 y2x1 .7108 .7022x2 .6932 .7070长子:长子头长长子:长子头长x1x1、长子头宽、长子头宽x2x2、次子:次子头长次子:次子头长y1y1、次子头宽、次子头宽y2y2 2.2.典型相关系数和典型

16、相关的显著性检验典型相关系数和典型相关的显著性检验表表2.4 冗余分析冗余分析案例案例3 3n全国全国3030省市自治区农村收入与支出的指标,省市自治区农村收入与支出的指标, x1 x1x4x4反映农村收入,反映农村收入,y1-y8y1-y8反映农村生活费支出,反映农村生活费支出,对收入与支出进行典型相关分析。对收入与支出进行典型相关分析。只有前两对典型相关系数是显著的;分别为只有前两对典型相关系数是显著的;分别为CR1=0.986CR1=0.986和和CR2=0.775.CR2=0.775.标准化典型系数标准化典型系数CV1-1=-CV1-1=-0.6140.614x1-0.224x2-0.

17、082x3-0.349x4x1-0.224x2-0.082x3-0.349x4CV1-2=-0.082x1-CV1-2=-0.082x1-0.7530.753x2-x2-0.6210.621x3+0.143x4x3+0.143x4标准化典型系数标准化典型系数CV2-1=-0.116y1-0.263y2+0.005y3-0.28y4-CV2-1=-0.116y1-0.263y2+0.005y3-0.28y4-0.4480.448y5+0.086y6+0.029y7-0.067y8;y5+0.086y6+0.029y7-0.067y8;CV2-2=-0.525y1-0.732y2-0.373y3+2.922y4-CV2-2=-0.525y1-0.732y2-0.373y3+2.922y4-1.042y5-0.96y6+0.463y7+0.222y81.042y5-0.96y6+0.463y7+0.222y8分析分析n第一对典型变量:第一对典型变量: CV1-1 CV1-1和和CV2-1CV2-1nX1 y5X1 y5n第一对典型变量说明靠第一对典型变量说明靠

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论