主成分、因子分析步骤_第1页
主成分、因子分析步骤_第2页
主成分、因子分析步骤_第3页
主成分、因子分析步骤_第4页
主成分、因子分析步骤_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析、因子分析步骤不同占 八、主成分分析因子分析概念具有相关关系的p个变将原数据中多个可能相关的变量综合量,经过线性组合后成为成少数几个不相关的可反映原始变量k个不相关的新变量的绝大多数信息的综合变量主要减少变量个数,以较少的找寻变量间的内部相关性及潜在的共目标主成分来解释原有变量间同因素,适合做数据结构检测的大部分变异,适合于数据简化强调强调的是解释数据变异的强调的是变量之间的相关性,以协方重点能力,以方差为导向,使差为导向,关心每个变量与其他变量方差达到最大共同享有部分的大小最终形成一个或数个总指标变反映变量间潜在或观察不到的因素结果量应用变异它将所有的变量的变异都只考虑每一题与其他

2、题目共同享有的解释考虑在内,因而没有误差变异,因而有误差项,叫独特因素程度项是否主成分分析作综合指标因子分析需要经过旋转才能对因子作Tm用,命名与解释旋转不需要旋转是否只是对数据作变换,故不因子分析对资料要求需符合许多假有假需要假设设,如果假设条件不符,则因子分析设的结果将受到质疑因子分析1【分析】T【降维】T【因子分析】描述性统计量(Descriptives )对话框设置KM彳并口 Bartlett的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)。因子抽取(Extraction )对话框设置方法:默认主成分法。主成分分析一定要选主成分法分析:主成分分析:相关性矩阵。输出:为旋转的

3、因子图抽取:默认选1.最大收敛性迭代次数:默认25.因子旋转(Rotation )对话框设置因子旋转的方法,常选择“最大方差法”。“输出”框中的“旋转解”。(4)因子得分(Scores )对话框设置“保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。(5)选项(Options )对话框设置2结果分析(1) KMC 及 Bartlett s 检验取样足够度的Kaiser-Meyer-Olkin度量。.515Bartlett的球形度检验近似卡方3.784df6Sig.706当KMO值愈大时,表示变量间的共同因子愈多,愈适合作因子分析。根据Kaiser 的观点,当 KMO 0

4、.9 (很棒)、KMO 0.8 (很好)、KMO 0.7 (中等)、KMO 0.6 (普通)、KMO0.5 (粗劣)、KM& 0.5 (不能接受)。(2)公因子方差公因子方差起始撷取卫生1.000.855饭量1.000.846等待时间1.000.819味道1.000.919亲切1.000.608撷取方法:主体元件分析Commu nalities (称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是0.4就可以认为是比较低,这时变量在分析中去掉比较好

5、。(3)解释的总方差说明的变异数总计元件各因子的特征值因子贡献率因子累积贡献率总计变异的累加总计变异的累加总计变异的累加12.45149.02449.0242.45149.02449.0242.04240.84340.84321.59531.89980.9231.59531.89980.9232.00440.07980.9233.66213.24694.168.1913.82397.9925.1002.008100.000撷取方法 主体元件分析。第二列 各因子的统计值第三列:各因子特征值与全体特征值总和之比的百分比。也称因子贡献率。第四列:累积百分比也称因子累积贡献率第二列统计的值是各因子的特

6、征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子;第三列是各因子的特征值与所有因子的特征值总和的比,也称因子贡 献率;第四列是因子累计贡献率。如因子1的特征值为2.451,因子2的特征值为1.595,因子3,4,5的特征值在1以下。因子1的贡 献率为49.0%,因子2的贡献率为31.899%,这两个因子贡 献率累积达80.9%,即这两个因子可解 释原有变量80.9%的信息,因而因子取二维比较显著。至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、fac2_1,即为因子得分。成分矩阵与旋转成分矩阵成分矩阵是未旋转前的因子矩阵,从该表中并无法清楚地

7、看出每个变量到底应归属于哪个因子。旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应归属于哪个因子。此表显示旋转后原始的所有变量与新生的2个公因子之间的相关程度。一般的,因子负荷量的绝对值0.4以上,认为是显著的变量,超过0.5时可以说是非常重要的变量。如味道与饭量关于因子1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于 因子2的负荷量高,所以聚成因子2,又可以称为服务因子。(5)因子得分系数矩阵元件评分系数矩阵元件12卫生-.010.447饭量.425-.036等待时间-.038.424味道.480.059亲切-.316-.371撷取方法:主体元件分析。转轴方法:具有K

8、aiser正规化的最大变异法。元件评分。因子得分系数矩阵给出了因子与各变量的线性组合系数因子1的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5 因子 2 的分数 =0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5(6) 因子转换矩阵元件转换矩阵元件121.723-.6912.691.723撷取方法:主体元件分析。转轴方法:具有Kaiser正规化的最大变异法。因子转换矩阵是主成分形式的系数。 因子得分协方差矩阵元件评分共变异数矩阵元件1211.000.000 12.0001.000撷取方法:主体元件分析。转

9、轴方法:具有Kaiser正规化的最大变异法。元件评分。看各因子间的相关系数,若很小,则因子间基本是两两独立的,说明这样的分 类是较合理的主成分分析1【分析】一一【降维】一一【因子分析】(1)设计分析的统计量【相关性矩阵】中的“系数”:会显示相关系数矩阵;【KMO八Bartlett的球形度检验】:检验原始变量是否适合作主成分分析。【方法】里选取“主成分”。【旋转】:选取第一个选项“无”。【得分】:“保存为变量”【方法】:回归”;再选中“显示因子得分系数矩阵”。2结果分析(1)相关系数矩阵相关性矩阵食品衣着燃料住房交通和通讯娱乐教育文化相关食品1.000.692.319.760.738.556衣着

10、.6921.000-.081.663.902.389燃料.319-.0811.000-.089-.061.267住房.760.663-.0891.000.831.387交通和通讯.738.902-.061.8311.000.326娱乐教育文化.556.389.267.387.3261.000两两之间的相关系数大小的方阵。通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的 关系。由表中可知许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。(2) KMC 及 Bartlett s 检验KMO 与 Bartlet 检定Kaiser-Meyer-OIki n 测量取样.602适当性

11、。形检定df15显著性.000根据Kaiser的观点,当KM60.9 (很棒)、KM6 0.8 (很好)、KM6 0.7 (中等)、KM6 0.6 (普通)、KM60.5 (粗劣)、KM& 0.5 (不能接受)。(3)公因子方差Communalities起始撷取食品1.000.878衣着1.000.825燃料1.000.841住房1.000.810交通和通讯1.000.919娱乐教育文化1.000.584撷取方法:主髓元件分析Commu nalities (称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子

12、的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是V0.4就可以认为是比较低,这时变量在分析中去掉比较好。(4)解释的总方差:说明的变异数总计起始特征值撷取平方和载入元件总计变异的累加总计变异的累加13.56859.47459.4743.56859.47459.47421.28821.46680.9391.28821.46680.939390.941.60010.0014.3585.97596.9165.1422.37299.2886.043.712100.000撷取方法:主体元件分析因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积达80.9%,即这两

13、个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。(5)成分矩阵(因子载荷矩阵)元件矩阵元件12食品.902.255衣着.880-.224燃料.093.912住房.878-.195交通和通讯.925-.252娱乐教育文化.588.488撷取方法:主体元件分析a.撷取2个元件。该矩阵并不是主成分1和主成分2的系数。主成分系数的求法:各自主成分载荷向量除以主成分方差的算数平方根。则第1主成分的各个系数是向量(0.925, 0.902, 0.880,0.878, 0.588, 0.093)除以3 568后才得到 的,即(0.490,0.478, 0.466, 0.465, 0.311, 0.049)才 是主成分 1 的特征向量。第1主成分的函数表达式:Y1=0.490*Z 交 +0.478*Z 食 +0.466*Z 衣 +0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论