版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第七章 典型相关与对应分析n7.1 典型相关分析典型相关分析n7.2 对应分析对应分析STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n7.1 7.1 典型相关分析典型相关分析n7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤n7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关分析n7.1.3 用用“分析家分析家”实现典型相关分析实现典型相关分析n7.1.4 用用CANCORR过程实现典型相关分析过程实现典型相关分析STATSTATSTATSTATSASS
2、AS软件与统计应用教程软件与统计应用教程7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤1. 1. 典型相关分析的基本思想典型相关分析的基本思想 典型相关分析采用主成分的思想浓缩信息,根据变量典型相关分析采用主成分的思想浓缩信息,根据变量间的相关关系,寻找少数几对综合变量间的相关关系,寻找少数几对综合变量(实际观测变量实际观测变量的线性组合的线性组合),用它们替代原始观测变量,从而将二组,用它们替代原始观测变量,从而将二组变量的关系集中到少数几对综合变量的关系上,通过对变量的关系集中到少数几对综合变量的关系上,通过对这些综合变量之间相关性的分析,回答两组原始变量间这些综合变量之间相
3、关性的分析,回答两组原始变量间相关性的问题。除了要求所提取的综合变量所含的信息相关性的问题。除了要求所提取的综合变量所含的信息量尽可能大以外,提取时还要求第一对综合变量间的相量尽可能大以外,提取时还要求第一对综合变量间的相关性最大,第二对次之,依次类推。关性最大,第二对次之,依次类推。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 这些综合变量被称为典型变量,或典则变量,第这些综合变量被称为典型变量,或典则变量,第1对对典型变量间的相关系数则被称为第典型变量间的相关系数则被称为第1典型相关系数。典典型相关系数。典型相关系数能简单、完整地描述两组变量间关系的指标
4、。型相关系数能简单、完整地描述两组变量间关系的指标。当两个变量组均只有一个变量时,典型相关系数即为简当两个变量组均只有一个变量时,典型相关系数即为简单相关系数;当其中的一组只有一个变量时,典型相关单相关系数;当其中的一组只有一个变量时,典型相关系数即为复相关系数。系数即为复相关系数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 典型相关系数与典型相关变量典型相关系数与典型相关变量 设设X = (X1,X2,Xp),Y = (Y1,Y2,Yq)是两是两个随机向量。利用主成分思想寻找第个随机向量。利用主成分思想寻找第i对典型相关变量对典型相关变量(Ui
5、,Vi):Ui = ai1X1 + ai2X2 + + aipXp = aiXVi = bi1Y1 + bi2Y2 + + biqYq = biYi = 1,2,m = min(p,q);称称ai和和bi为为(第第i对对)典典型变量系数或典型权重。型变量系数或典型权重。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 记第一对典型相关变量间的典型相关系数为:记第一对典型相关变量间的典型相关系数为:CanR1 = Corr(U1,V1)(使(使U1与与V1间最大相关);间最大相关); 第二对典型相关变量间的典型相关系数为:第二对典型相关变量间的典型相关系数为:Ca
6、nR2 = Corr(U2,V2)(与(与U1、V1无关;使无关;使U2与与V2间最间最大相关)大相关) 第第m对典型相关变量间的典型相关系数为:对典型相关变量间的典型相关系数为:CanRm = Corr(Um,Vm)(与(与U1,V1,Um1,Vm1无无关;关;Um与与Vm间最大相关)间最大相关)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 典型相关变量的性质典型相关变量的性质 各对典型相关变量所包括的相关信息互不交叉,且满各对典型相关变量所包括的相关信息互不交叉,且满足:足: 1) U1,U2,Um互不相关,互不相关,V1,V2,Vm互不互不相
7、关,即其相关系数为相关,即其相关系数为jijiVVCorrjijiUUCorrjiji, 0, 1),(, 0, 1),(STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2) 同一对典型相关变量同一对典型相关变量Ui和和Vi之间的相关系数为之间的相关系数为CanRi,不同对的典型相关变量之间互不相关,即:,不同对的典型相关变量之间互不相关,即: 3) Ui和和Vi的均值为的均值为0,方差为,方差为1(i = 1,m)。)。 4) 1 CanR1 CanR2 CanRm 0jijiCanRVUCorriji0),(STATSTATSTATSTATSASSAS软件
8、与统计应用教程软件与统计应用教程4. 4. 典型相关系数的求解步骤典型相关系数的求解步骤 1) 求求X,Y变量组的相关阵变量组的相关阵 R = ; 2) 求矩阵求矩阵A = (R11)1R12(R22)1R21和和B = (R22)1R21(R11)1R12,可以证明可以证明A、B有相同的非零特征值;有相同的非零特征值; 3) 求求A或或B的特征值的特征值i与与CanRi,A或或B的特征值即为典的特征值即为典型相关系数的平方:型相关系数的平方:i = (CanRi)2,i = 1,m。22211211RRRRSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4)
9、 求求A、B关于关于i的特征向量。设的特征向量。设ai为为A关于关于i的特征向的特征向量,量,bi为为B关于关于i的特征向量,则的特征向量,则ai和和bi为为(第第i对对)典型典型变量系数。即第变量系数。即第i对典型相关变量对典型相关变量(Ui,Vi):Ui = aiX* = ai1X1* + ai2X2* + + aipXp*Vi = biY* = bi1Y1* + bi2Y2* + + biqYq*i = 1,2,m = min(p,q);其中其中X*,Y*为原变量组为原变量组的标准化。的标准化。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5. 5. 特
10、征根特征根 特征根特征根(eigenvalue)是方差分析和多元检验的基础,特是方差分析和多元检验的基础,特征根与典型相关系数之间的数量关系为:征根与典型相关系数之间的数量关系为: 上式可以理解为第上式可以理解为第i对典型变量表示观测变量总方差对典型变量表示观测变量总方差作用的指标,它的值越大说明表示作用越大。作用的指标,它的值越大说明表示作用越大。221iiCanRCanRi特征根第STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程6. 6. 典型相关系数的标准误典型相关系数的标准误7. 7. 典型相关系数的假设检验典型相关系数的假设检验 典型相关系数的假设检验
11、包括对全部总体典型相关系典型相关系数的假设检验包括对全部总体典型相关系数的检验和对部分总体典型相关系数的检验。对数据的数的检验和对部分总体典型相关系数的检验。对数据的要求:要求: 1) 两个变量组均应服从多维正态分布:两个变量组均应服从多维正态分布:(X,Y)Np+q(,2) 2) n p + q112nCanRCanRSEiiSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(1) 全部总体典型相关系数为全部总体典型相关系数为0 H0:CanRi = 0,i = 1,m H1:至少有一个:至少有一个CanRi 0 检验的似然比统计量为检验的似然比统计量为对于充分
12、大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从自由度为近似服从自由度为pq的的 2分布。分布。miir121)1 (11ln)3(21qpnQSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 部分总体典型相关系数为部分总体典型相关系数为0 仅对较小的典型相关作检验:仅对较小的典型相关作检验: H0:CanRi = 0,i = s,m,2 s m H1:至少有一个:至少有一个CanRi 0其检验的统计量为其检验的统计量为对于充分大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从自由度为近似服从自由度为(p k)(q k)的
13、的 2分布。分布。mkiikr121)1 (1121ln) 3(21kkiikrqpknQSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关分析1. 1. 实例实例【例【例7-1】1985年中国年中国28省市城市男生省市城市男生(1922岁岁)的调查的调查数据,见表数据,见表7-1。其中。其中6项形态指标:身高项形态指标:身高(cm)、坐高、坐高、体重体重(kg)、胸围、肩宽、盆骨宽,分别记为、胸围、肩宽、盆骨宽,分别记为x1,x2,x6;5项机能指标:脉搏项机能指标:脉搏(次次/分分)、收缩压、收
14、缩压(mmHg)、舒张、舒张压压(变音变音)、舒张压、舒张压(消音消音)、肺活量、肺活量(ml),分别记为,分别记为y1,y2,y5。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表7-1 城市男生(1922岁)形态与机能调查数据设表中数据已经存放在数据集设表中数据已经存放在数据集Mylib.xtyjn中,试分析形中,试分析形态指标和机能指标这两组变量间的相关性。态指标和机能指标这两组变量间的相关性。编号身高x1坐高x2体重x3胸围x4肩宽x5盆骨宽x6脉搏y1收缩压y2舒张压y3舒张压y4肺活量y51173.2893.6260.186.7238.9727.5
15、175.3117.474.661.845082172.0992.8360.3887.3938.6227.8276.7120.177.166.244693171.4692.7859.7485.5938.8327.4675.8121.875.265.443984170.0892.2558.0485.9238.3327.2976.1115.173.861.340685170.6192.3659.6787.4638.3827.1472.9119.477.567.1433916167.9490.9155.9786.6638.1727.1676.2110.968.556.8414117168.8291.3
16、56.0785.8737.6126.6777.2113.87157.5390518168.0291.2655.2885.6339.6628.0774.5117.27463.8394319167.8790.9655.7984.9238.226.5374.3112.369.350.2419520168.1591.554.5684.8138.4427.3877.5117.475.363.6403921168.9991.5255.1186.2338.327.1477.7113.372.152.84238STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 分析设置
17、分析设置 在在INSIGHT模块中打开数据集模块中打开数据集Mylib.xtyjn。 1) 选择菜单选择菜单“Analyze”“Multivariate(Y X)(多元分(多元分析)析)”,打开,打开“Multivariate(Y X)”对话框;对话框; 2) 将将6项形态指标:项形态指标:x1至至 x6选为选为X变量,将变量,将5项机能指项机能指标:标: y1至至 y5选为选为Y变量,如图变量,如图7-1左所示。左所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3) 单击单击“Output”按钮,在打开的对话框中选中按钮,在打开的对话框中选中“Can
18、onical Correlation Analysis(典型相关分析)(典型相关分析)”复选框,单击下面的复选框,单击下面的“Canonical Correlation Options( 典 型 相 关 选 项 )( 典 型 相 关 选 项 ) ” 按 钮 , 打 开按 钮 , 打 开 “ C a n o n i c a l Correlation Options”对话框对话框, 并按下图右所示设置。并按下图右所示设置。 4) 三次单击三次单击“OK”按钮,得到分析结果。按钮,得到分析结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 结果分析结果
19、分析 (1) 典型相关系数典型相关系数 第第1典型相关系数为典型相关系数为0.939573,校正值为,校正值为0.908276,标,标准误差为准误差为0.026207,典型相关系数的平方为,典型相关系数的平方为0.882797;第第2典型相关系数为典型相关系数为0.877842,校正值为,校正值为0.842459,标准,标准误差为误差为0.051294,典型相关系数的平方为,典型相关系数的平方为0.770606,如,如图所示。图所示。 前两个典型相关系数比形态指标和机能指标两组间的前两个典型相关系数比形态指标和机能指标两组间的任何一个相关系数都大。任何一个相关系数都大。 STATSTATSTA
20、TSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 典型变量所解释的变异典型变量所解释的变异 第二部分是的第二部分是的5个特征根(个特征根(Eigenvalues),包括:特),包括:特征根、相邻两个特征根之差、特征根所占方差信息量的征根、相邻两个特征根之差、特征根所占方差信息量的比例和累积方差信息量的比例。从中可以看出,前两对比例和累积方差信息量的比例。从中可以看出,前两对典型变量所能解释的变异占总变异(方差)的典型变量所能解释的变异占总变异(方差)的91.18%,如图如图7-4所示。其它三个典型相关变量的作用很小,一所示。其它三个典型相关变量的作用很小,一共只解释了总变异的共
21、只解释了总变异的9%,可以不予考虑。,可以不予考虑。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 典型相关系数的检验典型相关系数的检验 用似然比法检验典型相关系数与零的差别是否显著,用似然比法检验典型相关系数与零的差别是否显著,其原假设为小于此对典型变量典型相关系数的所有典型其原假设为小于此对典型变量典型相关系数的所有典型相关系数都为相关系数都为0,其,其p值依次为值依次为0.0010,0.0509和和0.5089等等,如图等等,如图7-5所示,说明前两对典型相关系数基本具所示,说明前两对典型相关系数基本具有显著意义(在有显著意义(在 0.0509的显
22、著水平下)。因此,两的显著水平下)。因此,两组变量相关性的研究可转化为研究前两对典型相关变量组变量相关性的研究可转化为研究前两对典型相关变量的相关性。的相关性。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(4) 典型相关结构典型相关结构 典型相关结构(下图)分别是各组原始变量与典型变典型相关结构(下图)分别是各组原始变量与典型变量两两之间的相关系数矩阵。从相关系数判断,形态指量两两之间的相关系数矩阵。从相关系数判断,形态指标中除标中除x5(0.0514)、)、x6(0.2433)外各变量与第一典型)外各变量与第一典型变量间的相关性都比较高,机能指标中除变量间
23、的相关性都比较高,机能指标中除y2(0.0975)外各变量与第一典型变量间的相关性也都比较高。外各变量与第一典型变量间的相关性也都比较高。 x5与第二典型变量间的相关性比较高,与第二典型变量间的相关性比较高,y2与第二典型与第二典型变量间的相关性比较高。变量间的相关性比较高。 y1与前两个典型变量的相关系数为负值。与前两个典型变量的相关系数为负值。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 说明,第一对典型变量对肩宽说明,第一对典型变量对肩宽x5和收缩压和收缩压y2的解释作的解释作用不大。用不大。 另外,从形态指标组的变量和机能指标组的典型变量另外,从形态
24、指标组的变量和机能指标组的典型变量之间,以及机能指标组的变量和形态指标组的典型变量之间,以及机能指标组的变量和形态指标组的典型变量之间的相关系数可见,各组变量与前两对典型变量之间之间的相关系数可见,各组变量与前两对典型变量之间均有较强的相关。均有较强的相关。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(5) 标准化变量的典型相关变量的系数标准化变量的典型相关变量的系数 输出结果中还给出标准化变量的典型变量系数,如图输出结果中还给出标准化变量的典型变量系数,如图所示。所示。 来自机能指标的第一典型变量来自机能指标的第一典型变量CY1为为(原始变量的右原始变量的
25、右上角带上角带“*”表示为标准化变量表示为标准化变量):CY1 = 0.071672y1* 0.789642y2* + 0.567178y3*+ 0.508332y4*+ 0.533496y5*容易看出,容易看出,CY1主要代表了舒张压变音、舒张压消音、主要代表了舒张压变音、舒张压消音、肺活量等指标。肺活量等指标。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 来自形态指标的第一典型变量来自形态指标的第一典型变量CX1为:为:CX1 = 0.4287x1* 0.09696x2* 0.16210 x3* + 0.93745x4* + 0.23498x5* 0.
26、18696x6*易知,易知,CX1主要代表了胸围、身高和肩宽等指标。主要代表了胸围、身高和肩宽等指标。 关于第二典型变量有:关于第二典型变量有:CY2 = 0.026533y1* + 1.213436y2* 0.535038y3* 0.186048y4*+ 0.455870y5*CX2 = 0.70270 x1* 0.39985x2* + 0.84359x3* 0.99063x4* 0.06829x5* + 0.48310 x6*可见,可见,CY2代表了收缩压和肺活量等指标;代表了收缩压和肺活量等指标;CX2代表了代表了身高、体重、盆骨宽等指标。身高、体重、盆骨宽等指标。STATSTATSTA
27、TSTATSASSAS软件与统计应用教程软件与统计应用教程(6) 典型冗余分析典型冗余分析 典型冗余分析典型冗余分析(canonical redundancy analysis)表明,表明,两对典型变量仍不能全面预测配对的那组变量。来自形两对典型变量仍不能全面预测配对的那组变量。来自形态指标的标准方差被对方两个典型变量(态指标的标准方差被对方两个典型变量(CY1、CY2)解释的累积方差比例为解释的累积方差比例为55.86%,来自机能指标的标准,来自机能指标的标准方差被对方两个典型变量(方差被对方两个典型变量(CX1、CX2)解释的累积方)解释的累积方差比例为差比例为44.61%,如图所示。,如
28、图所示。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.1.3 用用“分析家分析家”实现典型相关分析实现典型相关分析1. 1. 实例实例【例【例7-2】某康复俱乐部对】某康复俱乐部对20名中年人测量了名中年人测量了3项生理指项生理指标:体重标:体重(weight)、腰围、腰围(waist)、脉搏、脉搏(pulse)和和3项运动项运动指标:引体向上指标:引体向上(chins)、起坐次数、起坐次数(situps)、跳跃次数、跳跃次数(jumps)。其数据列于表。其数据列于表7-2中。中。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应
29、用教程表7-2 某康复俱乐部测量的生理指标和运动指标设表中数据已经存放在数据集设表中数据已经存放在数据集Mylib.slzb中,试分析生中,试分析生理指标和运动指标这两组变量间的相关性。理指标和运动指标这两组变量间的相关性。编号体重weight腰围waist脉搏pulse引体向上chins起坐次数situps跳跃次数jumpsl191365051626021893752211060319338581210110141623562121053751893546131555861823656410142131543464142151051424746501505015193364667031162
30、023762122101201717637544602518157325211230801915633541522573201383368211043STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 分析设置分析设置 1) 在在“分析家分析家”中打开数据集中打开数据集Mylib.slzb; 2) 选择菜单选择菜单“Statistics(统计)(统计)”“Multivariate(多元分析)(多元分析)”“Canonical Correlation(典型相关分(典型相关分析)析)”,打开,打开“Canonical Correlation”对话框;对话框;
31、 3) 在对话框中将生理指标选为在对话框中将生理指标选为Set1,运动指标选为,运动指标选为Set2,如图所示。,如图所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4 ) 单 击单 击 “ S t a t i s t i c s ( 统 计 )( 统 计 ) ” 按 钮 , 打 开按 钮 , 打 开“Canonical Correlation:Statistics”对话框;对话框; 选中选中“Canonical redundancy statistics”复选框,并选择复选框,并选择3个典型变量,如图所示。两次单击个典型变量,如图所示。两次单击“OK”
32、按钮,得到按钮,得到计算结果。计算结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 结果分析结果分析(1) 典型相关系数及显著性检验典型相关系数及显著性检验 第一部分的第一部分的4列依次是:典型相关系数、校正的典型列依次是:典型相关系数、校正的典型相关系数、近似的标准误以及典型相关系数的平方。从相关系数、近似的标准误以及典型相关系数的平方。从图图7-10中可以看出,本例提取了中可以看出,本例提取了3个典型相关系数,第个典型相关系数,第一个典型相关系数一个典型相关系数CanR1 = 0.795608,其校正值为,其校正值为0.754056,标准误为
33、,标准误为0.084197,CanR12 = 0.632992,第,第一典型相关系数表示的是第一对典型相关变量之间的相一典型相关系数表示的是第一对典型相关变量之间的相关性。第二个典型相关系数为关性。第二个典型相关系数为0.200556,第三个为,第三个为0.072570。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第二部分是特征根以及相应的统计量,如图所示。第二部分是特征根以及相应的统计量,如图所示。 可以看出,第一对典型变量所能解释的变异已占总变可以看出,第一对典型变量所能解释的变异已占总变异的异的97.34%,其它两个典型相关变量的作用很小,一,其它两
34、个典型相关变量的作用很小,一共只解释了总变异的共只解释了总变异的3%,可以不予考虑。,可以不予考虑。 右边右边4列给出对典型相关系数的检验,结果表明,第列给出对典型相关系数的检验,结果表明,第一行的一行的F值值2.05,p值为值为0.0635,在,在0.07的检验水平下,的检验水平下,应拒绝原假设,认为第一相关系数以及比它小的两个相应拒绝原假设,认为第一相关系数以及比它小的两个相关系数不为关系数不为0;后两行检验的;后两行检验的p值都远大于显著水平值都远大于显著水平0.05,故可以认为只有第一个典型相关系数不为故可以认为只有第一个典型相关系数不为0。STATSTATSTATSTATSASSAS
35、软件与统计应用教程软件与统计应用教程 第三部分输出的是用四种多元统计方法进行的所有典第三部分输出的是用四种多元统计方法进行的所有典型相关系数均为型相关系数均为0的的F检验结果,如图所示。四种方法中检验结果,如图所示。四种方法中一般参照一般参照Wilks Lambda检验的结果。本例中的检验的结果。本例中的Wilks Lambda检验结果与前述完全一致,表明至少有一个典检验结果与前述完全一致,表明至少有一个典型相关系数在型相关系数在 = 0.0635的显著水平下非的显著水平下非0。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 典型变量系数与典型结构典型变
36、量系数与典型结构 第四部分给出的是用原始变量表达的典型变量系数第四部分给出的是用原始变量表达的典型变量系数(典型权重典型权重),如图所示。,如图所示。 因因6个变量没有使用相同单位进行测量,因此考虑分个变量没有使用相同单位进行测量,因此考虑分析标准化后的系数。析标准化后的系数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第五部分给出的是用标准化变量(对原始变量标准化)第五部分给出的是用标准化变量(对原始变量标准化)表达的典型变量系数,如图所示。表达的典型变量系数,如图所示。V1 = 0.7754 weight*+1.5793 waist* 0.0591 p
37、ulse* 它近似地是它近似地是waist*和和weight*的加权差,在的加权差,在waist*上权上权重更大些。重更大些。V1在在pulse*上系数近似为上系数近似为0。W1 = 0.3495 chins* 1.0540 situps* + 0.7164 jumps* 它在它在situps*上的系数最大。这一对典型变量主要是反上的系数最大。这一对典型变量主要是反映映waist*和和situps*的负相关关系。的负相关关系。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第六部分为典型结构,分别是各组原始变量与典型变第六部分为典型结构,分别是各组原始变量与典
38、型变量两两之间的相关系数矩阵,如图所示。可以看出:量两两之间的相关系数矩阵,如图所示。可以看出: 在原始变量与本组的典型变量的相关关系在原始变量与本组的典型变量的相关关系(典型载荷典型载荷)中,生理指标的典型变量中,生理指标的典型变量V1与腰围与腰围waist的相关系数最的相关系数最大大(0.9254),说明这个典型变量主要反映人的肥胖程度;,说明这个典型变量主要反映人的肥胖程度;运动指标的典型变量运动指标的典型变量W1与起坐次数与起坐次数situps和引体向上次和引体向上次数数chins有较大的负相关关系有较大的负相关关系(-0.7276,-0.8177),说明这,说明这个典型变量主要反映人
39、不适合运动的程度。个典型变量主要反映人不适合运动的程度。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 在原始变量与配对组的典型变量的相关关系在原始变量与配对组的典型变量的相关关系(典型交典型交叉载荷叉载荷)的分析结果中,腰围的分析结果中,腰围waist与运动指标的第与运动指标的第1典型典型变量变量W1的相关性较强,这也说明了腰围大的相关性较强,这也说明了腰围大(体形较胖体形较胖)则则运动能力差;起坐次数和引体向上与生理指标的第运动能力差;起坐次数和引体向上与生理指标的第1典典型变量型变量V1呈一定的负相关系数,说明人的体形肥胖程呈一定的负相关系数,说明人的体
40、形肥胖程度对这两种运动能力有负面影响。度对这两种运动能力有负面影响。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3) 典型冗余分析典型冗余分析 第七部分给出典型冗余分析的结果第七部分给出典型冗余分析的结果 上图是变量的原始方差通过它的典型变量和配对的典上图是变量的原始方差通过它的典型变量和配对的典型变量所解释的方差比例。型变量所解释的方差比例。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 下图是变量的标准化方差通过它的典型变量和配对的下图是变量的标准化方差通过它的典型变量和配对的典型变量所解释的方差比例。典型变量所解释的
41、方差比例。 图中看出,生理指标通过它的第一个典型变量解释的图中看出,生理指标通过它的第一个典型变量解释的共享方差的比例是共享方差的比例是45.08,而被对方第一个典型变量,而被对方第一个典型变量W1解释的方差比例为解释的方差比例为28.54%,其比值,其比值28.54/45.08= 0.6330恰为恰为CanR2。运动指标通过它的第一个典型变量。运动指标通过它的第一个典型变量解释的共享方差的比例是解释的共享方差的比例是40.81,而被对方个典型变,而被对方个典型变量量V1解释的方差比例为解释的方差比例为25.84%,其比值也是,其比值也是0.6330。STATSTATSTATSTATSASSA
42、S软件与统计应用教程软件与统计应用教程 第八部分给出各原始变量和配对组的典型变量间的复第八部分给出各原始变量和配对组的典型变量间的复相关系数(相关系数(Multiple Correlations)的平方(图)的平方(图7-18),),即原始变量与典型变量的判定系数,如即原始变量与典型变量的判定系数,如weight与第与第1典典型变量型变量W1的相关系数为的相关系数为0.4938(见图(见图7-15),则其复相),则其复相关系数平方为关系数平方为0.49382 = 0.2438。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 由复相关系数的平方可看出,生理指标的
43、第一典型变由复相关系数的平方可看出,生理指标的第一典型变量量W1对对chins(0.3351)和和situps(0.4233)有一定解释能力,有一定解释能力,但对但对jumps(0.0167)几乎没有解释能力。而来自运动指标几乎没有解释能力。而来自运动指标的第一典型变量的第一典型变量V1对对waist(0.5421)有相当好的解释能力,有相当好的解释能力,对对weight(0.2438)较差,而对较差,而对pulse(0.0701)几乎没有解释几乎没有解释能力。其中,运动指标的第一典型变量对生理指标中的能力。其中,运动指标的第一典型变量对生理指标中的腰围指标解释能力最强,可以说明运动对体形影响
44、较大,腰围指标解释能力最强,可以说明运动对体形影响较大,加强体育锻炼可以减肥。加强体育锻炼可以减肥。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.1.4 用用CANCORR过程实现典型相关分析过程实现典型相关分析1. CANCORR1. CANCORR过程过程 CANCORR过程的常用语法格式如下:过程的常用语法格式如下:PROC CANCORR ; WITH ; VAR ;RUN; 其中其中PROC CANCORR语句、语句、WITH语句是每个过程语句是每个过程中必不可少的,其余语句可视情况使用。中必不可少的,其余语句可视情况使用。STATSTATSTA
45、TSTATSASSAS软件与统计应用教程软件与统计应用教程 下面分别介绍各语句的用法和功能。下面分别介绍各语句的用法和功能。 (1) PROC CANCORR语句:标示典型相关分析开始,语句:标示典型相关分析开始,可以规定输入输出数据集,指定分析方法和控制输出结可以规定输入输出数据集,指定分析方法和控制输出结果的显示等。语句中可设置的常用选项及其功能见表果的显示等。语句中可设置的常用选项及其功能见表7-3。 (2) VAR语句:列出要进行典型相关分析的第一组变语句:列出要进行典型相关分析的第一组变量,变量必须是数值型的。如果量,变量必须是数值型的。如果VAR语句被忽略,所有语句被忽略,所有未被
46、其他语句提到的数值型变量都将被视为第一组变量。未被其他语句提到的数值型变量都将被视为第一组变量。 (3) WITH语句:列出要进行典型相关分析的第二组语句:列出要进行典型相关分析的第二组变量,变量必须是数值型的。该语句是每一个变量,变量必须是数值型的。该语句是每一个PROC CANCORR中必不可少的。中必不可少的。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表7-3 常用选项及其功能EDF=指定误差的自由度。EDF数为有效的观察值减1DATA=指定输入数据集的名字,可以是原始数据集,或用TYPE= CORR,COV,FACTOR,SSCP,UCORR,或者
47、UCOV的数据集,如果省略则使用最新创建的数据集OUT=指定输出数据集的名字,输出包括原始数据及典型变量得分的数据集。当输入数据集的类型为CORR,COV,FACTOR,SSCP,UCORR,或者UCOV,就不能使用这个选项OUTSTAT=生成包含各种统计量的SAS数据集,包括典型相关系数和典型系数,以及你要求的多元回归统计量VNAME=为来自VAR语句中分析变量指定标签,作为标签的字符要用单引号引起来VPREFIX=为来自VAR语句的典型变量指定前缀名,默认时典型变量命名为V1,V2,V3等WNAME=为来自WITH语句中的分析变量指定标签,作为标签的字符要用单引号引起来WPREFIX=为来
48、自WITH语句中的典型变量指定前缀名,默认为W1,W2,W3等控制输出的选项ALL打印所有选择的输出CORR打印原始变量之间的相关系数NCAN=规定要输出典型变量的个数NOPRINT禁止所有的输出REDUNDANCY打印冗余度分析的结果SHORT除了典型相关和多元统计列表以外,禁止打印典型相关分析过程默认的输出SIMPLE打印均值、标准差等简单统计量STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2. 2. 使用使用CANCORRCANCORR过程过程【例【例7-3】家庭特征与家庭消费之间的关系。为了了解】家庭特征与家庭消费之间的关系。为了了解家庭的特征与其消费
49、模式之间的关系。调查了家庭的特征与其消费模式之间的关系。调查了70个家庭个家庭的下面两组变量:的下面两组变量: x1:每年去餐馆就餐的频率,:每年去餐馆就餐的频率,x2:每年外出看电影的:每年外出看电影的频率;频率; y1:户主的年龄,:户主的年龄,y2:家庭的年收入,:家庭的年收入,y3:户主受教:户主受教育程度。育程度。 试分析两组变量之间试分析两组变量之间的关系。假定变量的相的关系。假定变量的相关系数阵如表所示。关系数阵如表所示。x1x2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.
50、670.590.371.000.35Y30.340.340.210.351.00STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 如下代码,利用变量的相关系数矩阵作典型相关分析:如下代码,利用变量的相关系数矩阵作典型相关分析:DATA jt(TYPE=CORR); INPUT NAME $ 1-2 (X1 X2 Y1-Y3) (6.); CARDS;X1 1.00 0.80 0.26 0.67 0.34X2 0.80 1.00 0.33 0.59 0.34Y1 0.26 0.33 1.00 0.37 0.21Y2 0.67 0.59 0.37 1.00 0.35
51、Y3 0.34 0.34 0.21 0.35 1.00;PROC CANCORR EDF=70 REDUNDANCY; VAR X1 X2; WITH Y1-Y3;RUN;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 说明:说明: 1) 在数据集名在数据集名jt后用后用TYPE = CORR表明数据的类型表明数据的类型为相关矩阵,而不是原始数据。为相关矩阵,而不是原始数据。 2) INPUT语句中用语句中用“NAME $”读取左侧的变量名,读取左侧的变量名,“1-2”表示变量名的字符落在第表示变量名的字符落在第1、2列上,列上,“(X1 X2 Y1-Y4)”
52、表示各列数据所对应的变量名,表示各列数据所对应的变量名,“(6.)”表示读表示读取数据的宽度均为取数据的宽度均为6列,其中相关系数占列,其中相关系数占4位,其后的空位,其后的空格占格占2位;位;STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3) 选择项选择项EDF = n 1,为典型相关分析提供一个计算,为典型相关分析提供一个计算误差自由度的参考值,因为该过程中没有合适的选择项误差自由度的参考值,因为该过程中没有合适的选择项可以将原始数据的样本含量可以将原始数据的样本含量n准确地送入。如果忽略这准确地送入。如果忽略这一选择项,将以缺省值一选择项,将以缺省值n
53、 = 10000作为样本含量参与有关作为样本含量参与有关计算和统计检验,显然不妥;计算和统计检验,显然不妥; 4) 选项选项REDUNDANCY表示输出典型冗余分析的结表示输出典型冗余分析的结果。果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3. 3. 结果分析结果分析(1) 典型相关系数及显著性检验典型相关系数及显著性检验 第一部分的第一部分的4列依次是:典型相关系数、校正的典型列依次是:典型相关系数、校正的典型相关系数、近似的标准误以及典型决定系数(典型相关相关系数、近似的标准误以及典型决定系数(典型相关系数的平方)。从中可以看出,本例提取了系数的平方
54、)。从中可以看出,本例提取了2个典型相个典型相关系数,第一个典型相关系数关系数,第一个典型相关系数CanR1 = 0.687948,其校,其校正值为正值为0.673671,标准误为,标准误为0.062956,CanR12 = 0.473272;第二个典型相关系数为;第二个典型相关系数为0.186865。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第二部分是特征根以及相应的统计量,从中可以看出,第二部分是特征根以及相应的统计量,从中可以看出,第一对典型变量所能解释的变异已占总变异的第一对典型变量所能解释的变异已占总变异的96.13%,另一对典型相关变量的作用
55、很小,只解释了总变异的另一对典型相关变量的作用很小,只解释了总变异的3.87%,可以不予考虑。,可以不予考虑。右边右边4列给出对典型相关系数的检验,具体采用似然比列给出对典型相关系数的检验,具体采用似然比法,所求的似然比统计量近似服从法,所求的似然比统计量近似服从F分布。第一行检验分布。第一行检验的是第一相关系数以及比它小的两个相关系数是否为的是第一相关系数以及比它小的两个相关系数是否为0,第一行的第一行的F值值8.86,p值值0.0001。后一行检验的。后一行检验的p值远大值远大于置信水平于置信水平0.05,故可以认为只有第一个典型相关系数,故可以认为只有第一个典型相关系数有统计学意义。有统
56、计学意义。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第三部分(图第三部分(图7-21)输出的是按照多元分析的原理进)输出的是按照多元分析的原理进行的所有典型相关系数是否为行的所有典型相关系数是否为0的检验,四种方法中一的检验,四种方法中一般参照般参照Wilks Lambda检验的结果。本例中检验的结果。本例中4种方法的检种方法的检验结果与前述完全一致。验结果与前述完全一致。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2) 典型变量系数与典型结构典型变量系数与典型结构 第四部分(图左)给出的是用原始变量表达的典型变第四
57、部分(图左)给出的是用原始变量表达的典型变量系数。考虑标准化后的系数,即第五部分(图右)给量系数。考虑标准化后的系数,即第五部分(图右)给出的典型变量和标准化变量(对原始变量标准化)间的出的典型变量和标准化变量(对原始变量标准化)间的换算公式。由于使用原始变量的相关系数阵作为输入数换算公式。由于使用原始变量的相关系数阵作为输入数据,所以这两部分相同。据,所以这两部分相同。 STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 来自消费模式指标的第一典型变量来自消费模式指标的第一典型变量V1为为(原始变量的原始变量的右上角带右上角带“*”表示为标准化变量表示为标准化变
58、量):V1 = 0.7689 x1*+0.2721 x2* 它是它是x1*(每年去餐馆就餐的频率每年去餐馆就餐的频率)和和x2*(每年外出看电每年外出看电影的频率影的频率)的加权和,在的加权和,在x1*上的权重更大些。上的权重更大些。 来自家庭特征指标的第一典型变量来自家庭特征指标的第一典型变量W1为:为:W1 = 0.0491 y1* + 0.8975 y2* + 0.1900 y3* 它在它在y2*(家庭的年收入家庭的年收入)上的系数最大。这一对典型变上的系数最大。这一对典型变量主要是反映量主要是反映x1*(每年去餐馆就餐的频率每年去餐馆就餐的频率)和和y2*(家庭的家庭的年收入年收入)的
59、相关关系。的相关关系。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第六部分(图第六部分(图7-24)为典型相关结构,分别是各组原)为典型相关结构,分别是各组原始变量与典型变量两两之间的相关系数矩阵。始变量与典型变量两两之间的相关系数矩阵。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 可以看出:可以看出:x1和和x2与第与第1典型变量典型变量V1的相关系数皆为的相关系数皆为正值,分别为正值,分别为0.9866和和0.8872,可见,可见V1可以作为消费特可以作为消费特性的指标。性的指标。 家庭特征指标的所有变量与第家庭特征
60、指标的所有变量与第1典型变量典型变量W1的相关系的相关系数分别为:数分别为:0.4211,0.9822和和0.5145,可见典型变量,可见典型变量W1主要代表了了家庭收入。主要代表了了家庭收入。 V1和和W1的典型相关系数为的典型相关系数为0.6879,这就说明家庭的,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的。消费与一个家庭的收入之间其关系是很密切的。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 第二对典型变量中第二对典型变量中V2与与x2的相关系数为的相关系数为0.4614,可以,可以看出看出V2可以作为文化消费特性的指标,第二对典型变可以作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 开展节能宣传活动总结
- 淘宝客服试用期转正工作总结
- 活着的读书心得
- 23.1.1 锐角的三角函数 同步练习
- 23.2 相似图形 同步练习
- 江苏省扬州市扬大附中2024-2025学年高一上学期联考英语试卷(含解析)
- 河北省秦皇岛市卢龙县2024-2025学年八年级上学期期中地理试题
- 天津地区高考语文五年高考真题汇编-名篇名句默写
- 语文教学论教案 第二章 语文教材
- 个人车位买卖协议书范本
- 2024广东省云浮市郁南县财政局工程造价类专业人员招聘4人高频难、易错点500题模拟试题附带答案详解
- 军队文职考试《公共科目》试题及答案指导(2024年)
- 山东省青岛市2023-2024学年七年级上学期期末考试数学试题(含答案)
- 2024下半年江苏苏州城市学院招聘管理岗位工作人员27人历年高频难、易错点500题模拟试题附带答案详解
- 小学心理健康课教案分享-《身体“红绿灯”》
- 2022年信息科技课程新课标义务教育信息科技课程标准2022版解读课件
- 小学生防火安全教育课件
- 口语交际:商量(教学设计)2023-2024学年统编版语文二年级上册
- 乡土嵌合:农村社会工作的实践面向与行动路径
- 2023年中国铁路国际有限公司招聘考试试题及答案
- 2024年大学生信息素养大赛(省赛)考试题库(含答案)
评论
0/150
提交评论