版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Canonical Correlation Analysis典型相关分析1一、引言 1. 两个随机变量Y与X 简单相关系数2. 一个随机变量Y与一组随机变量X1,X2, Xp 多重相关(复相关系数)3. 一组随机变量Y1,Y2,Yq与另一组随机变量X1,X2,Xp 典型(则)相关系数(一)何时采用典型相关分析 典型相关是简单相关、多重相关的推广;或者说简单相关系数、复相关系数是典型相关系数的特例。 典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。 由Hotelling (1935, 1936)最早提出,Cooley and Lohnes (1971)、 Kshirsaga
2、r (1972)和 Mardia, Kent, and Bibby (1979) 推动了它的应用。 实例(X与Y地位相同) 1985年中国28 省市城市男生(1922岁)的调查数据。记形态指标身高(cm)、坐高、体重(kg)、胸围、肩宽、盆骨宽分别为X1,X2,X6;机能指标脉搏(次/分)、收缩压(mmHg) 、舒张压(变音)、舒张压(消音)、肺活量(ml)分别为Y1,Y2,Y5。现欲研究这两组变量之间的相关性。简单相关系数矩阵简单相关系数公式符号Corr(X)R11Corr(Y)R22Corr(Y,X)R21Corr(X,Y)R12简单相关系数描述两组变量的相关关系的缺点只是孤立考虑单个X与
3、单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数(实例为30个),使问题显得复杂,难以从整体描述。(复相关系数也如此)(二)典型相关分析的思想采用主成分思想寻找第i对典型(相关)变量(Ui,Vi):典型相关系数典型变量系数或典型权重 X*1,X*2,X*p和Y*1,Y*2,Y*q分别为X1,X2,Xp和Y1,Y2,Yq的正态离差标准化值。记第一对典型相关变量间的典型相关系数为: CanR1Corr(U1,V1)(使U1与V1 间最大相关) 第二对典型相关变量间的典型相关系数为: CanR2Corr(U2,V2)(与U1、V1 无关; 使U2与V2 间最大相关)
4、第五对典型相关变量间的典型相关系数为: CanR5Corr(U5,V5) (与U1、V1 、 U4、V4无关; U5与V5 间最大相关)有: 1CanR1CanR2CanR50典型相关变量的性质(三)典型相关分析示意图X1Y1Y2Y3Y4Y5X2X3X4X5X6XYU1U2U3U4U5V1V2V3V4V5CanR1CanR2CanR3CanR4CanR5二、典型相关系数及其检验 (一)求解典型相关系数的步骤求X,Y变量组的相关阵R=求矩阵A、B 可以证明A、B有相同的非零特征根3. 求A或B的i(相关平方)与CanRi,i1,m4. 求A、B关于i的特征根向量即变量系数(二)典型相关系数计算实
5、例求X,Y变量组的相关阵R=Corr(X)R11Corr(Y)R22Corr(Y,X)R21Corr(X,Y)R122. 求矩阵A、BA矩阵(pp)0.5298 0.4586 0.3053 0.3986 -0.2919 -0.1778 -0.0912 -0.0701 -0.1669 -0.1939 -0.0007 -0.0168 0.2274 0.2739 0.5489 0.0840 0.5238 0.4468 0.0966 0.0376 0.0510 0.3877 -0.2523 -0.1759 -0.0915 -0.0979 -0.0669 -0.0377 0.0061 -0.0806 0
6、.0949 0.1421 0.1757 -0.0210 0.2171 0.3142 B矩阵(qq)0.2611 -0.0560 -0.0337 -0.0551 -0.0312 -0.0053 0.5572 0.1009 0.0034 -0.0543 -0.0632 -0.0843 0.0859 0.0013 0.1743 -0.1175 -0.0007 0.1183 0.2550 0.1490 -0.1052 0.1390 0.3531 0.2912 0.5573 3. 求矩阵A、B的(相关系数的平方)A、B有相同的非零特征值B矩阵求(典型相关系数的平方)0.2611- -0.0560 -0.
7、0337 -0.0551 -0.0312 -0.0053 0.5572 - 0.1009 0.0034 -0.0543 -0.0632 -0.0843 0.0859 - 0.0013 0.1743 -0.1175 -0.0007 0.1183 0.2550 - 0.1490 -0.1052 0.1390 0.3531 0.2912 0.5573 - 5个与典型相关系数1 0.76432 0.5436 3 0.2611 40.1256 50.02204. 求A、B关于i的变量系数(求解第1典型变量系数)求解第2典型变量系数求解第5典型变量系数5组(标准化)典型变量系数(X)5组(标准化)典型变量
8、系数(X)由标准化典型变量系数获得原变量X对应的粗典型变量系数粗典型变量系数可由标准典型变量系数与相应的标准差之比获得。5组(标准化)典型变量系数(Y)(三)典型相关系数的特点 两变量组的变量单位改变,典型相关系数不变,但典型变量系数改变。(无论原变量标准化否,获得的典型相关系数不变)第一对典则相关系数较两组变量间任一个简单相关系数或复相关系数之绝对值都大,即CanR1max(|Corr(Xi,Yj)|) 或CanR1max(|Corr(X,Yj)|) max(|Corr(Xi,Y)|)(四)校正典型相关系数(Adjusted Canonical Correlation) 为了使结果更加明了,
9、增加大值或小值,减少之间大小的值,将典型变量系数旋转,可得到校正的典型相关系数。缺点:1.可能影响max(U1,V1); 2. 影响(U1,V1)与其他典型变量间的独立性。(五)典型相关系数的标准误 (六)E1H的特征值(见典型判别、MANOVA,E误差项,H组间变异) Eigenvalues of Inv(E)*H = CanRsq/(1-CanRsq) Eigenvalue Difference Proportion Cumulative 1 3.2422 2.0510 0.6546 0.6546 2 1.1912 0.8379 0.2405 0.8951 3 0.3533 0.2097
10、0.0713 0.9665 4 0.1436 0.1212 0.0290 0.9955 5 0.0225 0.0045 1.0000(七)典型相关系数的假设检验 全部总体典型相关系数均为0部分总体典型相关系数为01. 全部总体典型相关系数为0F近似检验(SAS结果) Test of H0: The canonical correlations in the current row and all that follow are zeroLikelihood Approximate Ratio F Value Num DF Den DF Pr F1 0.06798466 2.24 30 70 0
11、.00302 0.28840509 1.38 20 60.649 0.16863 0.63195301 0.80 12 50.561 0.65044 0.85521598 0.54 6 40 0.77295 0.97803479 0.24 2 21 0.7920F近似检验(计算公式)多变量统计量与F近似检验 Multivariate Statistics and F ApproximationsStatistic Value F Value Num DF Den DF Pr FWilks Lambda 0.06798 2.24 30 70 0.0030Pillais Trace 1.71651
12、 1.83 30 105 0.0133Hotelling-Lawley Trace 4.95277 2.62 30 35.396 0.0032 Roys Greatest Root 3.24221 11.35 6 21 F 1 1.6532 1.6465 0.9959 0.9959 0.37438667 6.66 4 42 0.0003 2 0.0067 0.0041 1.0000 0.99332139 0.15 1 22 0.7042简单实例(P293页9.2题)计算7. 典型相关系数的多变量统计量及其假设检验 Multivariate Statistics and F Approximat
13、ions Statistic Value F Value Num DF Den DF Pr F Wilks Lambda 0.37438667 6.66 4 42 0.0003 Pillais Trace 0.62977475 5.06 4 44 0.0019 Hotelling-Lawley Trace 1.65991998 8.60 4 24.198 0.0002 Roys Greatest Root 1.65319646 18.19 2 22 .0001 NOTE: F Statistic for Roys Greatest Root is an upper bound. NOTE: F
14、 Statistic for Wilks Lambda is exact.简单实例(P293页9.2题)计算8.求A、B关于i的特征向量,即典型变量系数 Canonical Correlation Analysis Standardized Canonical Coefficients for the VAR Variables u1 u2 x1 0.5667 -1.3604 x2 0.5069 1.3838 Standardized Canonical Coefficients for the WITH Variables v1 v2 y1 0.5184 -1.7857 y2 0.5233
15、1.7842简单实例(P293页9.2题)计算矩阵A的第1特征值为0.623096简单实例(P293页9.2题)计算典型变量的表达式简单实例(P293页9.2题)计算9.典型结构分析(可观察典型变量的意义) u1 u2 x1 0.9390 -0.3439 x2 0.9231 0.3845 v1 v2 y1 0.9596 -0.2814 y2 0.9604 0.2788 v1 v2 x1 0.7412 -0.0281 x2 0.7287 0.0314 u1 u2 y1 0.7575 -0.0230 y2 0.7581 0.0228简单实例(P293页9.2题)计算10.冗余分析(对方典型变量可解
16、释的信息) Canonical Redundancy Analysis Standardized Variance of the VAR Variables Explained by Their Own The Opposite Canonical Variables Canonical Variables Canonical Variable Cumulative Canonical Cumulative Number Proportion Proportion R-Square Proportion ProportionX 1 0.8669 0.8669 0.6231 0.5402 0.5
17、402 2 0.1331 1.0000 0.0067 0.0009 0.5411 Y 1 0.9215 0.9215 0.6231 0.5742 0.5742 2 0.0785 1.0000 0.0067 0.0005 0.5747简单实例(P293页9.2题)计算11.基于典型变量回归的确定系数 Squared Multiple Correlations Between the VAR Variables and the First M Canonical Variables of the WITH Variables M 1 2 x1 0.5494 0.5502 x2 0.5310 0.5
18、320 M 1 2 y1 0.5737 0.5743 y2 0.5747 0.5752九、SAS计算程序(1)PROC CANCORR ALL VPREFIX=u WPREFIX=v OUT=b1 OUTSTAT=b2; VAR x1 x2; WITH y1 y2;RUN;九、SAS计算程序(2)DATA canocorr (TYPE=CORR); INPUT _NAME_ $ x1 x2 y1 y2; _ TYPE_=CORR;CARDS;x110.734560.719150.70398x20.7345610.690380.70855y10.719150.6903810.84307y20.703980.708550.843071; PROC CANCORR DATA=canocorr ALL EDF=24 ; * EDF=n-1; VAR x1 x2; WITH y1 y2; RUN;九、SPSS进行典型相关分析(3) 无直接菜单点击可借用Analyze General Linear Model Multivariate可采用File
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 闽教版信息技术四年级下册全册教案
- 中国机房精密空调行业市场现状分析及竞争格局与投资发展研究报告2024-2030年版
- 中国丝印行业市场现状分析及竞争格局与投资发展研究报告2024-2030年版
- 2024至2030年全球及中国荧光免疫分析仪行业市场调研及投资建议报告
- 2024至2030年中国第三方医学诊断行业深度调研及投资战略分析报告
- 2024至2030年中国圆盘给料机行业发展预测及投资策略报告
- 2024至2030年中国四丁基锡行业发展预测及投资策略报告
- 2024至2030年全球与中国市场乙烷深度研究报告
- 2024至2030年中国智能交通行业“十四五”深度分析及发展趋势研究预测报告
- 2024至2030年中国亚磷酸市场前景分析与投资战略研究报告
- 服务器硬件运维巡检报告模板8页
- (完整word版)客户投诉处理流程图(客户投诉记录表)
- 人教部编版语文三年级上册第一单元试题(无答案)
- 动量定理动量守恒定律
- 盾构施工监测方案
- TCCES 6003-2021 预制混凝土构件用金属预埋吊件
- 第一讲-视频拍摄入门(上)PPT优秀课件
- 小学一年级开学第一课PPT
- 幼儿园维修记录表.doc
- 浅谈班会课的实效性
- 不良品管理方法
评论
0/150
提交评论