




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 典型相关分析第六章 典型相关分析n第一节 典型相关分析的根本原理n第二节 典型变量与典型相关系数的求法n第三节 典型相关系数的检验n第四节 典型相关分析的计算步骤n第五节 典型相关分析的SPSS实现第一节 典型相关分析的根本原理n一、什么是典型相关分析n在对经济问题的研讨和管理研讨中,不仅经常需求调查两个变量之间的相关程度,而且还经常需求调查多个变量与多个变量之间即两组变量之间的相关性。典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。 n 通常情况下,为了研讨两组变量n 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐
2、又不能抓住问题的本质。假设可以采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,那么更简捷。),(21pxxx),(21qyyy二、典型相关分析的根本思想三、典型相关分析的数学描画四、典型相关分析的运用n典型相关分析的用途很广。在实践分析问题中,当我们面临两组多变量数据,并希望研讨两组变量之间的关系时,就要用到典型相关分析。n例如,为了研讨扩张性财政政策实施以后对宏观经济开展的影响,就需求调查有关财政政策的一系列目的如财政支出总额的增长率、财政赤字增长率、国债发行额的增长率、税率降低率等与经济开展的一系列目的,如国内消费总值增长率、就业增长率、物价上涨率
3、等两组变量之间的相关程度。n又如,为了研讨宏观经济走势与股票市场走势之间的关系,就需求调查各种宏观经济目的如经济增长率、失业率、物价指数、进出口增长率等与各种反映股票市场情况的目的如股票价钱指数、股票市场融资金额等两组变量之间的相关关系。n再如,工厂要调查所运用的原料的质量对所消费的产品的质量的影响,就需求对所消费产品的各种质量目的与所运用的原料的各种质量目的之间的相关关系进展测度。第二节 典型变量与典型相关系数的求法n一、总体典型变量和典型相关系数二、原始变理与变型变量之间的相关系数三、样本典型相关变量和样本典型相关系数第三节 典型相关系数的检验典型相关分析能否恰当,应该取决于两组原变量之间
4、能否相关,假设两组变量之间毫无相关性而言,那么不应该作典型相关分析。用样本来估计总体的典型相关系数能否有误,需求进展检验。一整体检验)0:; 0:(10 xyxyHH|0yyxxSSS0:10rH不为零中至少11), 2 , 1(:riHi检验的统计量:yyyxxyxxSSSSSI0SSISSSSISS0Ixy1xxyyyxxyxx1xxyxxy1xxyxyyxxSSSS00S所以,两边同时求行列式,有yyyxxyxxxy1xxyyyxxyxx1xxyxSSSSI0SSISSSSISS0I现实上yx1yyxyxxyyyyyxxyxxSSSSSSSSS|S|yx1yyxy1xxxxyySSSSI
5、SSMISSSSI|S|S|S|yx1yyxy1xxyyxx0 由于 所以假设M的特征根为 ,那么(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:)()1 (MIIMIIIMI111|xxxyyyyxxxyySIS S S SIMSS 222121(1)(1)(1)(1)ppii11H 小,支持。在原假设为真的情况下,检验的统计量 近似服从自在度为pq的2分布。在给定的显著性程度下,假设22 (pq),那么回绝原假设,以为至少第一对典型变量之间的相关性显著。111(3) ln2Qnpq 依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进展典型
6、相关分析,采用的也是一种降维技术。我们希望运用尽能够少的典型变量对数,为此需求对一些较小的典型相关系数能否为零进展假设检验。H0经检验被回绝,那么应进一步检验假设。 假设原假设H0被接受,那么以为只需第二对典型变量是有用的;假设原假设H0被回绝,那么以为第二对典型变量也是有用的,并进一步检验假设。 二部分总体典型相关系数为零的检验023rH:=123:,rH至少有一非零034rH:=134:,rH 至少有一非零如此进展下去.直至对某个k014krH:=114:,krH至少有一非零检验的统计量211(1)rkii k 2111(3)ln2kiki kQnkpq 近似服从自在度为(p-k)(q-k
7、)的2分布。在给定的显著性程度下,假设22 (p-k)(q-k),那么回绝原假设,以为至少第k+1对典型变量之间的相关性显著。第四节 典型相关分析的计算步骤 在实践运用中,总体的协方差矩阵经常是未知的,类似于其他的统计分析方法,需求从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进展估计,然后利用估计得到的协方差或相关系数矩阵进展分析。由于估计中抽样误差的存在,所以估计以后还需求进展有关的假设检验。 1、假设有X组和Y组变量,样本容量为n。假设( X1, Y1), ( X2, Y2), ( Xn, Yn),观测值矩阵为:nqnnpnqpqpqpqpyyxxyyxxyyxxyyxxyy
8、xxZ11441441331231221221111111yyyxxyxxSSSSnn1111ZZ样本的协方差:qnqnpnpnqqppqqppqqppqqppyyyyxxxxyyyyxxxxyyyyxxxxyyyyxxxxyyyyxxxx111141414141313121312121212111111111Z 2、计算特征根和特征向量 求M1和 M2的特征根 ,对应的特征向量 。那么特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。)(111yxyyxyxxSSSSM令:)(112xyxxyxyySSSSM令:22221r), 2 , 1(riii和第五节 邮电业与国民经济的典型
9、相关分析 n二、数据分析n 我们将基于1995年到2007年我国国民经济数据(数据来自于中国统计年鉴),利用Stata软件来做邮电业和国民经济之间的典型相关分析。数据详细见表1. n我们将采用如下目的来衡量n我国各年份的邮电业:采用下面的目的来衡量我国各年份的经济单位都是万亿n. canon (x1-x4) (y1-y4) e = exact, a = approximate, u = upper bound on F Roys largest root 3 30 08 8. .1 19 9 4 4 8 8 6 61 16 6. .3 38 80 03 3 0 0. .0 00 00 00 0
10、 u uLawley-Hotelling trace 3 31 18 8. .0 08 81 1 1 16 6 1 14 4 6 69 9. .5 58 80 02 2 0 0. .0 00 00 00 0 a a Pillais trace 2 2. .2 22 24 47 78 8 1 16 6 3 32 2 2 2. .5 50 06 65 5 0 0. .0 01 13 31 1 a a Wilks lambda . .0 00 00 02 21 16 61 10 01 1 1 16 6 1 15 5. .9 91 12 29 9 1 14 4. .7 75 59 96 6 0 0.
11、.0 00 00 00 0 a a Statistic df1 df2 F ProbFTests of significance of all canonical correlations 0 0. .9 99 98 84 4 0 0. .9 95 51 12 2 0 0. .4 44 43 36 6 0 0. .3 35 55 57 7Canonical correlations: y4 0 0. .0 00 00 00 0 - -0 0. .0 00 00 03 3 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 00 0 y3 0 0. .0 00 00 0
12、1 1 0 0. .0 00 01 13 3 - -0 0. .0 01 10 03 3 - -0 0. .0 00 07 75 5 y2 - -0 0. .0 00 00 00 0 0 0. .0 00 00 02 2 0 0. .0 00 01 15 5 0 0. .0 00 00 06 6 y1 0 0. .0 00 00 01 1 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 05 5 0 0. .0 00 01 16 6 1 2 3 4 Raw coefficients for the second variable set x4 0 0. .0 00
13、 00 00 0 - -0 0. .0 00 00 04 4 - -0 0. .0 00 00 04 4 0 0. .0 00 00 04 4 x3 0 0. .0 00 00 00 0 0 0. .0 00 00 03 3 0 0. .0 00 00 03 3 - -0 0. .0 00 00 03 3 x2 0 0. .0 00 00 00 0 - -0 0. .0 00 00 00 0 - -0 0. .0 00 00 01 1 0 0. .0 00 00 00 0 x1 - -0 0. .0 00 06 69 9 - -0 0. .0 04 45 57 7 - -0 0. .0 00
14、03 38 8 - -0 0. .0 06 62 29 9 1 2 3 4 Raw coefficients for the first variable setCanonical correlation analysis Number of obs = 1 13 3n. canon (x1-x4) (y1-y4), test(1 2 3 4) Roys largest root 3 30 08 8. .1 19 9 4 4 8 8 6 61 16 6. .3 38 80 03 3 0 0. .0 00 00 00 0 u uLawley-Hotelling trace 3 31 18 8.
15、.0 08 81 1 1 16 6 1 14 4 6 69 9. .5 58 80 02 2 0 0. .0 00 00 00 0 a a Pillais trace 2 2. .2 22 24 47 78 8 1 16 6 3 32 2 2 2. .5 50 06 65 5 0 0. .0 01 13 31 1 a a Wilks lambda . .0 00 00 02 21 16 61 10 01 1 1 16 6 1 15 5. .9 91 12 29 9 1 14 4. .7 75 59 96 6 0 0. .0 00 00 00 0 a a Statistic df1 df2 F
16、ProbFTests of significance of all canonical correlations 0 0. .9 99 98 84 4 0 0. .9 95 51 12 2 0 0. .4 44 43 36 6 0 0. .3 35 55 57 7Canonical correlations: y4 0 0. .0 00 00 00 0 - -0 0. .0 00 00 03 3 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 00 0 y3 0 0. .0 00 00 01 1 0 0. .0 00 01 13 3 - -0 0. .0 01 1
17、0 03 3 - -0 0. .0 00 07 75 5 y2 - -0 0. .0 00 00 00 0 0 0. .0 00 00 02 2 0 0. .0 00 01 15 5 0 0. .0 00 00 06 6 y1 0 0. .0 00 00 01 1 - -0 0. .0 00 00 01 1 - -0 0. .0 00 00 05 5 0 0. .0 00 01 16 6 1 2 3 4 Raw coefficients for the second variable set x4 0 0. .0 00 00 00 0 - -0 0. .0 00 00 04 4 - -0 0.
18、 .0 00 00 04 4 0 0. .0 00 00 04 4 x3 0 0. .0 00 00 00 0 0 0. .0 00 00 03 3 0 0. .0 00 00 03 3 - -0 0. .0 00 00 03 3 x2 0 0. .0 00 00 00 0 - -0 0. .0 00 00 00 0 - -0 0. .0 00 00 01 1 0 0. .0 00 00 00 0 x1 - -0 0. .0 00 06 69 9 - -0 0. .0 04 45 57 7 - -0 0. .0 00 03 38 8 - -0 0. .0 06 62 29 9 1 2 3 4
19、Raw coefficients for the first variable setCanonical correlation analysis Number of obs = 1 13 3 e = exact, a = approximate, u = upper bound on F Wilks lambda . .8 87 73 34 49 97 7 1 1 8 8 1 1. .1 15 58 86 6 0 0. .3 31 13 31 1 e e Statistic df1 df2 F ProbFTest of significance of canonical correlatio
20、n 4 Wilks lambda . .7 70 01 16 64 42 2 4 4 1 14 4 0 0. .6 67 78 84 4 0 0. .6 61 18 82 2 e e Statistic df1 df2 F ProbFTest of significance of canonical correlations 3-4 Wilks lambda . .0 06 66 68 81 16 63 3 9 9 1 14 4. .7 75 53 3 3 3. .3 34 43 37 7 0 0. .0 01 19 96 6 a a Statistic df1 df2 F ProbFTest
21、 of significance of canonical correlations 2-4 Wilks lambda . .0 00 00 02 21 16 61 10 01 1 1 16 6 1 15 5. .9 91 12 29 9 1 14 4. .7 75 59 96 6 0 0. .0 00 00 00 0 a a Statistic df1 df2 F ProbFTest of significance of canonical correlations 1-4 n用似然比法检验典型相关系数与零的差别能否显著,检验r1时,其零假设为r1以及小于r1的一切典型相关系数都为零;检验时
22、r2,其零假设为r2以及小于r2的一切典型相关系数都为零,依此类推。所求的似然比统计量近似服从,其值阐明第1和第2典型相关系数分别具有非常显著和显著的意义。n. canon (x1-x4) (y1-y4), stdcoef e = exact, a = approximate, u = upper bound on F Roys largest root 3 30 08 8. .1 19 9 4 4 8 8 6 61 16 6. .3 38 80 03 3 0 0. .0 00 00 00 0 u uLawley-Hotelling trace 3 31 18 8. .0 08 81 1 1
23、16 6 1 14 4 6 69 9. .5 58 80 02 2 0 0. .0 00 00 00 0 a a Pillais trace 2 2. .2 22 24 47 78 8 1 16 6 3 32 2 2 2. .5 50 06 65 5 0 0. .0 01 13 31 1 a a Wilks lambda . .0 00 00 02 21 16 61 10 01 1 1 16 6 1 15 5. .9 91 12 29 9 1 14 4. .7 75 59 96 6 0 0. .0 00 00 00 0 a a Statistic df1 df2 F ProbFTests of
24、 significance of all canonical correlations 0 0. .9 99 98 84 4 0 0. .9 95 51 12 2 0 0. .4 44 43 36 6 0 0. .3 35 55 57 7Canonical correlations: y4 0 0. .7 72 25 54 4 - -7 7. .8 83 31 10 0 - -2 2. .4 48 82 25 5 - -0 0. .4 49 98 84 4 y3 0 0. .2 20 04 41 1 3 3. .9 97 78 84 4 - -3 32 2. .4 42 20 07 7 - -
25、2 23 3. .6 65 53 38 8 y2 - -0 0. .2 22 24 47 7 4 4. .2 27 79 92 2 3 37 7. .4 47 76 69 9 1 16 6. .4 42 29 91 1 y1 0 0. .2 29 99 92 2 - -0 0. .4 40 06 65 5 - -2 2. .5 59 93 33 3 7 7. .7 75 53 34 4 1 2 3 4 Standardized coefficients for the second variable set x4 0 0. .4 41 13 33 3 - -5 5. .2 24 42 21 1
26、 - -4 4. .7 76 68 80 0 4 4. .7 79 94 44 4 x3 0 0. .4 46 60 04 4 5 5. .7 74 45 58 8 6 6. .4 47 77 70 0 - -4 4. .8 88 85 58 8 x2 0 0. .1 18 85 54 4 - -0 0. .8 85 52 29 9 - -2 2. .3 35 50 01 1 0 0. .2 28 82 24 4 x1 - -0 0. .0 09 93 37 7 - -0 0. .6 62 23 35 5 - -0 0. .0 05 51 18 8 - -0 0. .8 85 59 95 5
27、1 2 3 4 Standardized coefficients for the first variable setCanonical correlation analysis Number of obs = 1 13 3n从规范化变量出发的典型系数 ,对分析结果进展整理。n样本资料是从1995到2007年,即样本数是13,第一组变量数p=4,第二组变量数q=4。从Stata分析结果看,4个典型相关系数分别为:r1=0.9984,r2=0.9512,r3=0.4436,r4=0.3556. 经似然比检验的结果,前两对典型变量在0.05显著程度下显著相关。n前两对规范化的典型变量的线性组合是
28、:n对结果进展经济意义解释。n. estat loading y4 0 0. .9 99 96 67 7 - -0 0. .0 03 39 90 0 0 0. .0 01 11 10 0 - -0 0. .0 01 11 15 5 y3 0 0. .9 99 93 37 7 0 0. .0 08 86 68 8 0 0. .0 00 04 40 0 - -0 0. .0 01 10 09 9 y2 0 0. .9 99 94 41 1 0 0. .0 07 79 91 1 0 0. .0 01 14 47 7 - -0 0. .0 00 08 82 2 y1 0 0. .9 98 89 92
29、2 0 0. .0 09 94 48 8 - -0 0. .0 01 18 84 4 0 0. .0 02 29 92 2 1 2 3 4 Correlation between variable list 2 and canonical variates from list 1 x4 0 0. .9 95 59 94 4 - -0 0. .2 20 09 95 5 0 0. .0 07 71 15 5 0 0. .0 01 16 61 1 x3 0 0. .9 98 89 95 5 - -0 0. .0 06 64 42 2 0 0. .0 04 42 21 1 - -0 0. .0 02
30、23 31 1 x2 0 0. .7 78 80 09 9 0 0. .2 26 63 39 9 - -0 0. .2 21 19 97 7 - -0 0. .0 09 91 13 3 x1 - -0 0. .0 01 16 62 2 - -0 0. .7 71 16 69 9 0 0. .0 08 87 74 4 - -0 0. .2 22 22 29 9 1 2 3 4 Correlation between variable list 1 and canonical variates from list 2 y4 0 0. .9 99 98 83 3 - -0 0. .0 04 41 1
31、0 0 0 0. .0 02 24 49 9 - -0 0. .0 03 32 24 4 y3 0 0. .9 99 95 53 3 0 0. .0 09 91 13 3 0 0. .0 00 09 90 0 - -0 0. .0 03 30 06 6 y2 0 0. .9 99 95 57 7 0 0. .0 08 83 32 2 0 0. .0 03 33 32 2 - -0 0. .0 02 23 30 0 y1 0 0. .9 99 90 08 8 0 0. .0 09 99 97 7 - -0 0. .0 04 41 14 4 0 0. .0 08 82 21 1 1 2 3 4 C
32、anonical loadings for variable list 2 x4 0 0. .9 96 61 10 0 - -0 0. .2 22 20 02 2 0 0. .1 16 61 12 2 0 0. .0 04 45 53 3 x3 0 0. .9 99 91 11 1 - -0 0. .0 06 67 75 5 0 0. .0 09 94 49 9 - -0 0. .0 06 64 48 8 x2 0 0. .7 78 82 22 2 0 0. .2 27 77 75 5 - -0 0. .4 49 95 53 3 - -0 0. .2 25 56 67 7 x1 - -0 0.
33、 .0 01 16 62 2 - -0 0. .7 75 53 37 7 0 0. .1 19 96 69 9 - -0 0. .6 62 26 68 8 1 2 3 4 Canonical loadings for variable list 1n. findit canred. canred 1Canonical redundancy analysis for canonical correlation1Canonical correlation coefficient 0.9984Squared canonical correlation coefficient 0.9968own oppositeProportion of standardized variance variate variate of u variables with . 0.6294 0.6274of v variabl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高校舆论宣传管理制度
- 超市员工请假管理制度
- 信息技术教师工作总结(10篇)
- 表面活性剂市场需求增长与未来发展趋势分析
- 2025至2030年中国绿茶梅市场现状分析及前景预测报告
- 2025至2030年中国纯化纤纱市场调查研究报告
- “双减”后对家庭教育培训机构的管理优化研究-以宁波市鄞州区为例
- 2025至2030年中国红外防盗可视对讲电话门铃系统市场分析及竞争策略研究报告
- 2025至2030年中国竹制首饰盒行业投资前景及策略咨询报告
- 2025至2030年中国空气呼吸器检测仪市场现状分析及前景预测报告
- 劳务联合施工协议书
- 2025年广东能源集团云浮蓄能发电有限公司招聘笔试参考题库含答案解析
- 2024年考生面对挑战时的心理调整试题及答案
- 护理不良事件分级及上报流程
- 2025-2030全球及中国4,4-二氟二苯甲酮行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 地理知识科普
- 【初中地理】撒哈拉以南非洲课件-2024-2025学年人教版地理七年级下册
- 2024年信息安全试题及答案
- 药物治疗管理MTM
- 广东省佛山市南海区2024-2025学年七年级外研版英语期中练习题(含答案)
- 2025年中国铁路投资集团有限公司招聘(28人)笔试参考题库附带答案详解
评论
0/150
提交评论