典型相关分析课件_第1页
典型相关分析课件_第2页
典型相关分析课件_第3页
典型相关分析课件_第4页
典型相关分析课件_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章典型相关分析1第九章典型相关分析1典型相关分析就是研究两组变量之间相关关系的一种多元统计分析的方法。它能够揭示两组变量之间的内在联系。我们知道,在一元统计分析中,用相关系数来衡量两个随机变量之间的线性关系;用复相关系数研究一个随机变量和多个随机变量的线性相关关系。对于两组随机变量之间的相关关系如何分析呢?一、典型相关分析的概念及基本思想

2典型相关分析就是研究两组变量之间相关关系的一种多元统计分析的通常情况下,为了研究两组变量的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。3通常情况下,为了研究两组变量3在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标P个原材料的指标之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。典型相关分析的目的就是识别并量化两组变量之间的联系,将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量的线性组合之间的相关关系分析。4在解决实际问题中,这种方法有广泛的应用。如,在工厂里例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。5例家庭特征与家庭消费之间的关系为了

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵6

X1X2y1y2y3X11.000.800.260.670y2y3y1x2x17y2y3y1x2x17

典型相关分析的思想:

首先分别在每组变量中找出第一对变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。如此下去,直至两组变量的相关性被提取完为止。

8典型相关分析的思想:首先分别在每组变量中找出第被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了两组变量之间联系的线性组合。u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下去,直至进行到r步,rmin(p,q),可以得到r组变量。从而达到降维的目的。9被选出的线性组合配对称为典型变量,它们的相关系数二、典型相关的数学描述

(一)想法考虑两组变量的向量

其协方差阵为其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;12和21是X和Y的其协方差矩阵。10二、典型相关的数学描述(一)想法其协方差阵为如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求1和1,使二者的相关系数达到最大。11如果我们记两组变量的第一对线性组合为:(二)典型相关系数和典型变量的求法

在约束条件下,求1和1,使uv达到最大。根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求的极大值,其中和是Lagrange乘数。12(二)典型相关系数和典型变量的求法在约束将上面的3式分别左乘和13将上面的3式分别左乘和将左乘(3)的第二式,得并将第一式代入,得的特征根是,相应的特征向量为14将左乘(3)的第二式,得并将第一式代将左乘(3)的第一式,并将第二式代入,得的特征根是,相应的特征向量为15将左乘(3)的第一式,并将第二式代入,引理:AB和BA有相同的非零特征根.A’和A有相同的非零特征根.则和有相同的非零特征根。16引理:AB和BA有相同的非零特征根.A’和A有相同的非零特征

结论:既是M1又是M2的特征根,和是相应于M1和M2的特征向量。至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。

第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。17结论:既是M1又是M2的特征根,和

在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:

在约束条件:18在剩余的相关中再求出第二对典型变量和他求使达到最大的和。19求使例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。20例家庭特征与家庭消费之间的关系为了

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵21

X1X2y1y2y3X11.000.800.260.670典型相关分析

典型相关系数调整典型相关系数近似方差

典型相关系数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491922典型相关分析

典型相调整典型近似方差典型相关系数的平方10.X组典型变量的系数

U1U2X10.7689-1.4787X20.27211.6443Y组典型变量的系数

V1V2Y10.04911.0003Y20.8975-0.5837Y30.19000.295623X组典型变量的系数

U1U2X10.7689-1.4787X三、典型变量的性质

1、同一组的典型变量之间互不相关

即X组的典型变量之间是相互互不相关:即Y组的典型变量之间是互不相关:24三、典型变量的性质

1、同一组的典型变量之间互不相关即X组的2、不同组的典型变量之间相关性

不同组内典型变量之间的相关系数为:252、不同组的典型变量之间相关性不同组内典型变量之间的相关系同对则协方差为i,不同对则为零。26同对则协方差为i,不同对则为零。263、原始变量与典型变量之间的相关系数

原始变量相关系数矩阵x典型变量系数矩阵273、原始变量与典型变量之间的相关系数

原始变量相关系数矩阵y典型变量系数矩阵28y典型变量系数矩阵2829293030典型变量的结构

U1U2X10.9866-0.1632X20.88720.4614

V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.301331典型变量的结构

U1U2X10.9866-0.1632X20典型变量的结构

V1V2X10.6787-0.0305X20.61040.0862

U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.056332典型变量的结构

V1V2X10.6787-0.0305X20两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。33两个反映消费的指标与第一对典型变量中u14、各组原始变量被典型变量所解释的方差X组原始变量被ui解释的方差比例X组原始变量被vi解释的方差比例y组原始变量被ui解释的方差比例y组原始变量被vi解释的方差比例344、各组原始变量被典型变量所解释的方差X组原始变量被ui解释被典型变量解释的X组原始变量的方差

被本组的典型变量解释被对方Y组典型变量解释比例累计比例典型相关系数平方比例累计比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.420835被典型变量解释的X组原始变量的方差

被本组的典型变量解释被被典型变量解释的Y组原始变量的方差

被本组的典型变量解释被对方X组典型变量解释比例累计比例典型相关系数平方比例累计比例10.46890.46890.47330.22190.221920.27310.74200.03490.00950.231536被典型变量解释的Y组原始变量的方差

被本组的典五、样本典型相关系数在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。37五、样本典型相关系数在实际应用中,总体的协方差矩1、假设有X组和Y组变量,样本容量为n。假设(X1,Y1),(X2,Y2),…,(Xn,Yn),观测值矩阵为:381、假设有X组和Y组变量,样本容量为n。假设(X39392、计算特征根和特征向量求M1和

M2的特征根,对应的特征向量。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。402、计算特征根和特征向量40六、典型相关系数的检验典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。

检验的统计量:(一)整体检验41六、典型相关系数的检验典型相关分析是否恰当,应该取决于两所以,两边同时求行列式,有42所以,两边同时求行列式,有424343由于所以若M的特征根为,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:44由于44在原假设为真的情况下,检验的统计量

近似服从自由度为pq的2分布。在给定的显著性水平下,如果22(pq),则拒绝原假设,认为至少第一对典型变量之间的相关性显著。再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。45在原假设为真的情况下,检验的统计量45(二)部分总体典型相关系数为零的检验H0:P2=…=Pr=0Hl:P2,P3,Pr至少有一个不为零。若原假设H0被接受,则认为只有第一对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设:H0:P3=…=Pr=0H1:P3,…,Pr至少有一个不为零。如此进行下去.直至对某个k,H0:P(k十1)=…=PM=0H1:P(k+1),…,Pm至少有一个不为零。46(二)部分总体典型相关系数为零的检验46检验的统计量近似服从自由度为(p-k)(q-k)的2分布。在给定的显著性水平下,如果22[(p-k)(q-k)],则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。47检验的统计量近似服从自由度为(p-k)(q-k)的2分布。H0:当前和后面的典型相关系数均为零H1:至少当前的典型相关系数为零

LikelihoodRatioApproxFNumDFDenDFPr>F10.508334981341.2346199900.000120.96508130180.838299960.0001可见,前面两对典型变量的相关性是很强的。48H0:当前和后面的典型相关系数均为零

Likelihoo职业满意度典型相关分析某调查公司从一个大型零售公司随机调查了784人,测量了5个职业特性指标和7个职业满意变量。讨论两组指标之间是否相联系。X组:Y组:X1—用户反馈Y1—主管满意度X2—任务重要性Y2—事业前景满意度X3—任务多样性Y3—财政满意度X4—任务特殊性Y4—工作强度满意度X5—自主权Y5—公司地位满意度Y6—工作满意度Y7—总体满意度49职业满意度典型相关分析某调查公司从一个大型零售公

X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.0050

X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.0解:计算变量间的相关系数矩阵,具体计算见表9.12。表9.12典型相关系数分析典型相关系数典型相关系数平方10.55370.306620.23640.055930.11920.014240.07220.005250.05730.003351解:计算变量间的相关系数矩阵,具体计算见表9.12。典型相关典型相关系数的显著性检验结果见表9.13表9.13典型相关系数的显著性检验似然比值值自由度临界值临界值10.63988346.6823557.34249.80220.9228162.2982442.98036.41530.9774417.6761530.57823.68540.991526.587850.996722.538352典型相关系数的显著性检验结果见表9.13似然比值值自由度从表9.13中可以看出,在0.01的显著性水平下,对应前2对典型变量相关系数计算的统计量的值所以前2个典型相关系数是显著的,即前2对典型变量都是有意义的。而第3个典型相关系数计算出的统计量的值,所以第3个典型相关系数不显著。计算X组与Y组的典型变量系数,计算结果见表9.14与表9.15。53从表9.13中可以看出,在0.01的显著性水平下,对应前2对

U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392表9.14X组典型变量的系数54

U1U2U3U4U5X10.42170.3429-0.85

V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141表9.15Y组典型变量的系数55

V1V2V3V4V5Y10.4252-0.08800.49由表9.14与表9.15可以得出第一对典型变量为它们的相关系数为0.5537;同理可以写出第二对典型变量为它们的相关系数为0.2364。56由表9.14与表9.15可以得出第一对典型变量为它们的相关系

对第一对典型变量中,主要受用户反馈和自主权的影响,主要受工作满意度、事业前景满意度和主管满意度的影响;主要受自主权、任务重要性和任务多样性的影响,主要受工作强度满意度、工作满意度和事业前景满意度的影响。计算原始变量与典型变量之间的相关系数结果如表9.16~表9.19所示。57对第一对典型变量中,主要受用户反馈和自主

U1U2U3U4U5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246

V1V2V3V4V5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678表9.16原始变量与本组典型变量之间的相关系数58

U1U2U3U4U5X10.82930.1093-0.48

V1V2V3V4V5X10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071

U1U2U3U4U5Y10.41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始变量与对应组典型变量之间的相关系数59

V1V2V3V4V5X10.45920.0258-0.05可以看出,所有五个表示职业特性的变量与u1有大致相同的相关系数,u1视为形容职业特性的指标。第一对典型变量的第二个成员v1与Y1,Y2,Y5,Y6有较大的相关系数,说明v1主要代表了主管满意度,事业前景满意度,公司地位满意度和工种满意度。而u1和v1之间的相关系数0.5537。60可以看出,所有五个表示职业特性的变量与u1有大致相同下面分析原始变量被典型变量解释的方差表9.20被典型变量解释的X组原始变量的方差被本组的典型变量解释被对方Y组典型变量解释比例累计比例典型相关系数平方比例累计比例10.58180.58180.093400.17840.178420.10800.68980.003120.00600.184430.09600.78580.000200.00140.185840.12230.90810.000030.00060.186450.09191.00000.000010.00030.186761下面分析原始变量被典型变量解释的方差被本组的典型变量解释被对表9.21被典型变量解释的Y组原始变量的方差被本组的典型变量解释被对方X组典型变量解释比例累计比例典型相关系数平方比例累计比例10.37210.37210.093400.11410.114120.12220.49430.003120.00680.120930.07400.56830.000200.00110.122040.12890.69720.000030.00070.122650.10580.80300.000010.00030.123062表9.21被典型变量解释的Y组原始变量的方差被本组的U1和V1解释的本组原始变量的比率:X组的原始变量被U1到U5解释了100%Y组的原始变量被V1到V5解释了80.3%X组的原始变量被U1到U2解释了0.6898Y组的原始变量被V1到V2解释了0.494363U1和V1解释的本组原始变量的比率:63第九章典型相关分析64第九章典型相关分析1典型相关分析就是研究两组变量之间相关关系的一种多元统计分析的方法。它能够揭示两组变量之间的内在联系。我们知道,在一元统计分析中,用相关系数来衡量两个随机变量之间的线性关系;用复相关系数研究一个随机变量和多个随机变量的线性相关关系。对于两组随机变量之间的相关关系如何分析呢?一、典型相关分析的概念及基本思想

65典型相关分析就是研究两组变量之间相关关系的一种多元统计分析的通常情况下,为了研究两组变量的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。66通常情况下,为了研究两组变量3在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标P个原材料的指标之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。典型相关分析的目的就是识别并量化两组变量之间的联系,将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量的线性组合之间的相关关系分析。67在解决实际问题中,这种方法有广泛的应用。如,在工厂里例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。68例家庭特征与家庭消费之间的关系为了

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵69

X1X2y1y2y3X11.000.800.260.670y2y3y1x2x170y2y3y1x2x17

典型相关分析的思想:

首先分别在每组变量中找出第一对变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。如此下去,直至两组变量的相关性被提取完为止。

71典型相关分析的思想:首先分别在每组变量中找出第被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了两组变量之间联系的线性组合。u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下去,直至进行到r步,rmin(p,q),可以得到r组变量。从而达到降维的目的。72被选出的线性组合配对称为典型变量,它们的相关系数二、典型相关的数学描述

(一)想法考虑两组变量的向量

其协方差阵为其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;12和21是X和Y的其协方差矩阵。73二、典型相关的数学描述(一)想法其协方差阵为如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求1和1,使二者的相关系数达到最大。74如果我们记两组变量的第一对线性组合为:(二)典型相关系数和典型变量的求法

在约束条件下,求1和1,使uv达到最大。根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求的极大值,其中和是Lagrange乘数。75(二)典型相关系数和典型变量的求法在约束将上面的3式分别左乘和76将上面的3式分别左乘和将左乘(3)的第二式,得并将第一式代入,得的特征根是,相应的特征向量为77将左乘(3)的第二式,得并将第一式代将左乘(3)的第一式,并将第二式代入,得的特征根是,相应的特征向量为78将左乘(3)的第一式,并将第二式代入,引理:AB和BA有相同的非零特征根.A’和A有相同的非零特征根.则和有相同的非零特征根。79引理:AB和BA有相同的非零特征根.A’和A有相同的非零特征

结论:既是M1又是M2的特征根,和是相应于M1和M2的特征向量。至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。

第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。80结论:既是M1又是M2的特征根,和

在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:

在约束条件:81在剩余的相关中再求出第二对典型变量和他求使达到最大的和。82求使例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。83例家庭特征与家庭消费之间的关系为了

X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵84

X1X2y1y2y3X11.000.800.260.670典型相关分析

典型相关系数调整典型相关系数近似方差

典型相关系数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491985典型相关分析

典型相调整典型近似方差典型相关系数的平方10.X组典型变量的系数

U1U2X10.7689-1.4787X20.27211.6443Y组典型变量的系数

V1V2Y10.04911.0003Y20.8975-0.5837Y30.19000.295686X组典型变量的系数

U1U2X10.7689-1.4787X三、典型变量的性质

1、同一组的典型变量之间互不相关

即X组的典型变量之间是相互互不相关:即Y组的典型变量之间是互不相关:87三、典型变量的性质

1、同一组的典型变量之间互不相关即X组的2、不同组的典型变量之间相关性

不同组内典型变量之间的相关系数为:882、不同组的典型变量之间相关性不同组内典型变量之间的相关系同对则协方差为i,不同对则为零。89同对则协方差为i,不同对则为零。263、原始变量与典型变量之间的相关系数

原始变量相关系数矩阵x典型变量系数矩阵903、原始变量与典型变量之间的相关系数

原始变量相关系数矩阵y典型变量系数矩阵91y典型变量系数矩阵2892299330典型变量的结构

U1U2X10.9866-0.1632X20.88720.4614

V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.301394典型变量的结构

U1U2X10.9866-0.1632X20典型变量的结构

V1V2X10.6787-0.0305X20.61040.0862

U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.056395典型变量的结构

V1V2X10.6787-0.0305X20两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。96两个反映消费的指标与第一对典型变量中u14、各组原始变量被典型变量所解释的方差X组原始变量被ui解释的方差比例X组原始变量被vi解释的方差比例y组原始变量被ui解释的方差比例y组原始变量被vi解释的方差比例974、各组原始变量被典型变量所解释的方差X组原始变量被ui解释被典型变量解释的X组原始变量的方差

被本组的典型变量解释被对方Y组典型变量解释比例累计比例典型相关系数平方比例累计比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.420898被典型变量解释的X组原始变量的方差

被本组的典型变量解释被被典型变量解释的Y组原始变量的方差

被本组的典型变量解释被对方X组典型变量解释比例累计比例典型相关系数平方比例累计比例10.46890.46890.47330.22190.221920.27310.74200.03490.00950.231599被典型变量解释的Y组原始变量的方差

被本组的典五、样本典型相关系数在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。100五、样本典型相关系数在实际应用中,总体的协方差矩1、假设有X组和Y组变量,样本容量为n。假设(X1,Y1),(X2,Y2),…,(Xn,Yn),观测值矩阵为:1011、假设有X组和Y组变量,样本容量为n。假设(X102392、计算特征根和特征向量求M1和

M2的特征根,对应的特征向量。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。1032、计算特征根和特征向量40六、典型相关系数的检验典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。

检验的统计量:(一)整体检验104六、典型相关系数的检验典型相关分析是否恰当,应该取决于两所以,两边同时求行列式,有105所以,两边同时求行列式,有4210643由于所以若M的特征根为,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:107由于44在原假设为真的情况下,检验的统计量

近似服从自由度为pq的2分布。在给定的显著性水平下,如果22(pq),则拒绝原假设,认为至少第一对典型变量之间的相关性显著。再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。108在原假设为真的情况下,检验的统计量45(二)部分总体典型相关系数为零的检验H0:P2=…=Pr=0Hl:P2,P3,Pr至少有一个不为零。若原假设H0被接受,则认为只有第一对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设:H0:P3=…=Pr=0H1:P3,…,Pr至少有一个不为零。如此进行下去.直至对某个k,H0:P(k十1)=…=PM=0H1:P(k+1),…,Pm至少有一个不为零。109(二)部分总体典型相关系数为零的检验46检验的统计量近似服从自由度为(p-k)(q-k)的2分布。在给定的显著性水平下,如果22[(p-k)(q-k)],则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。110检验的统计量近似服从自由度为(p-k)(q-k)的2分布。H0:当前和后面的典型相关系数均为零H1:至少当前的典型相关系数为零

LikelihoodRatioApproxFNumDFDenDFPr>F10.508334981341.2346199900.000120.96508130180.838299960.0001可见,前面两对典型变量的相关性是很强的。111H0:当前和后面的典型相关系数均为零

Likelihoo职业满意度典型相关分析某调查公司从一个大型零售公司随机调查了784人,测量了5个职业特性指标和7个职业满意变量。讨论两组指标之间是否相联系。X组:Y组:X1—用户反馈Y1—主管满意度X2—任务重要性Y2—事业前景满意度X3—任务多样性Y3—财政满意度X4—任务特殊性Y4—工作强度满意度X5—自主权Y5—公司地位满意度Y6—工作满意度Y7—总体满意度112职业满意度典型相关分析某调查公司从一个大型零售公

X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.00113

X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.0解:计算变量间的相关系数矩阵,具体计算见表9.12。表9.12典型相关系数分析典型相关系数典型相关系数平方10.55370.306620.23640.055930.11920.014240.07220.005250.05730.0033114解:计算变量间的相关系数矩阵,具体计算见表9.12。典型相关典型相关系数的显著性检验结果见表9.13表9.13典型相关系数的显著性检验似然比值值自由度临界值临界值10.63988346.6823557.34249.80220.9228162.2982442.98036.41530.9774417.6761530.57823.68540.991526.587850.996722.5383115典型相关系数的显著性检验结果见表9.13似然比值值自由度从表9.13中可以看出,在0.01的显著性水平下,对应前2对典型变量相关系数计算的统计量的值所以前2个典型相关系数是显著的,即前2对典型变量都是有意义的。而第3个典型相关系数计算出的统计量的值,所以第3个典型相关系数不显著。计算X组与Y组的典型变量系数,计算结果见表9.14与表9.15。116从表9.13中可以看出,在0.01的显著性水平下,对应前2对

U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392表9.14X组典型变量的系数117

U1U2U3U4U5X10.42170.3429-0.85

V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141表9.15Y组典型变量的系数118

V1V2V3V4V5Y10.4252-0.08800.49由表9.14与表9.15可以得出第一对典型变量为它们的相关系数为0.5537;同理可以写出第二对典型变量为它们的相关系数为0.2364。119由表9.14与表9.15可以得出第一对典型变量为它们的相关系

对第一对典型变量中,主要受用户反馈和自主权的影响,主要受工作满意度、事业前景满意度和主管满意度的影响;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论