主成分、因子分析步骤_第1页
主成分、因子分析步骤_第2页
主成分、因子分析步骤_第3页
主成分、因子分析步骤_第4页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分、因子分析步骤主成分分析、因子分析步骤不同点 主成分分析 因子分析 概念 具有相关关系的 p 个变量,经过将原数据中多个可能相关的变量综合成少数几线性组合后成为 k 个不相关的新个不相关的可反映原始变量的绝大多数信息的变量 综合变量主要 减少变量个数,以较少的主成分找寻变量间的内部相关性及潜在的共同因素,目标 来解释原有变量间的大部分变适合做数据结构检测异,适合于数据简化强调 强调的是解释数据变异的能力,强调的是变量之间的相关性,以协方差为导向,重点 以方差为导向,使方差达到最大 关心每个变量与其他变量共同享有部分的大小 最终结形成一个或数个总指标变量 反映变量间潜在或观察不到的因素果应

2、用变异解它将所有的变量的变异都考虑只考虑每一题与其他题目共同享有的变异,因释程度在内,因而没有误差项而有误差项,叫独特因素是否需主成分分析作综合指标用, 因子分析需要经过旋转才能对因子作命名与解要旋转 不需要旋转 释是否有只是对数据作变换,故不需要假因子分析对资料要求需符合许多假设,如果假假设 设 设条件不符,则因子分析的结果将受到质疑因子分析1 【分析】 ?【降维】 ?【因子分析】(1) 描述性统计量 (Descriptives)对话框设置KMO和 Bartlett 的球形度检验 ( 检验多变量正态性和原始变量是否适合作因子分析)。(2) 因子抽取 (Extraction)对话框设置方法 :

3、 默认主成分法。主成分分析一定要选主成分法分析 : 主成分分析: 相关性矩阵。输出 : 为旋转的因子图抽取 : 默认选 1.最大收敛性迭代次数 : 默认 25.(3) 因子旋转 (Rotation) 对话框设置因子旋转的方法,常选择“最大方差法”。“输出”框中的“旋转解”。(4) 因子得分 (Scores) 对话框设置“保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的变量名称。(5) 选项 (Options) 对话框设置2 结果分析(1)KMO及Bartletts检验KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量。.515 Bartlett的

4、球形度检验近似卡方 3.784df 6Sig. .706当 KMO值愈大时,表示变量间的共同因子愈多,愈适合作因子分析。根据Kaiser 的观点,当 KMO,0.9(很棒 ) 、KMO,0.8(很好 ) 、KMO,0.7(中等 ) 、KMO,0.6(普通 ) 、KMO,0.5(粗劣 ) 、KMO,0.5(不能接受 ) 。(2) 公因子方差公因子方差起始 撷取卫生 1.000 .855饭量 1.000 .846等待时间 1.000 .819味道 1.000 .919亲切 1.000 .608撷取方法 : 主体元件分析。Communalities( 称共同度 ) 表示公因子对各个变量能说明的程度,

5、每个变量的初始公因子方差都为 1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是<0.4 就可以认为是比较低,这时变量在分析中去掉比较好。(3) 解释的总方差说明的变异数总计各因子的特征值 因子贡献率 因子累积贡献率 元件 总计 变异的 % 累加 %总计 变异的 % 累加 % 总计 变异的 % 累加 % 1 2.451 49.024 49.024 2.45149.024 49.024 2.042 40.843 40.843 2 1.595 31.899 80.923 1.595 31.89980.923 2.00

6、4 40.079 80.9233 .662 13.246 94.1684 .191 3.823 97.9925 .100 2.008 100.000撷取方法 : 主体元件分析。第二列 : 各因子的统计值第三列 : 各因子特征值与全体特征值总和之比的百分比。也称因子贡献率。第四列 : 累积百分比也称因子累积贡献率第二列统计的值是各因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子 ; 第三列 %是各因子的特征值与所有因子的特征值总和的比,也称因子贡献率 ; 第四列是因子累计贡献率。如因子 1 的特征值为 2.451 ,因子 2 的特征值为 1.595 ,因子 3,4,5的特

7、征值在 1 以下。因子1 的贡献率为 49.0%,因子 2 的贡献率为 31.899%,这两个因子贡献率累积达80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。至此已经将 5 个问项降维到两个因子,在数据文件中可以看到增加了2 个变量, fac1_1 、fac2_1 ,即为因子得分。(4) 成分矩阵与旋转成分矩阵成分矩阵是未旋转前的因子矩阵,从该表中并无法清楚地看出每个变量到底应归属于哪个因子。旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应归属于哪个因子。此表显示旋转后原始的所有变量与新生的2 个公因子之间的相关程度。一般的,因子负荷量的绝对值 0.4 以上

8、,认为是显著的变量,超过 0.5时可以说是非常重要的变量。如味道与饭量关于因子1 的负荷量高,所以聚成因子1,称为饮食因子 ; 等待时间、卫生、亲切关于因子2 的负荷量高,所以聚成因子2,又可以称为服务因子。 (5)因子得分系数矩阵元件评分系数矩阵元件1 2卫生 -.010 .447饭量 .425 -.036等待时间 -.038 .424味道 .480 .059亲切 -.316 -.371撷取方法 : 主体元件分析。转轴方法 : 具有 Kaiser正规化的最大变异法。元件评分。因子得分系数矩阵给出了因子与各变量的线性组合系数。因子 1 的分数 =-0.010*X1+0.425*X2-0.038

9、*X3+0.408*X4-0.316*X5 因子 2 的分数 =0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5(6) 因子转换矩阵元件转换矩阵元件 121 .723 -.6912 .691 .723撷取方法 : 主体元件分析。转轴方法 : 具有 Kaiser正规化的最大变异法。因子转换矩阵是主成分形式的系数。(7) 因子得分协方差矩阵元件评分共变异数矩阵元件 121 1.000 .0002 .000 1.000撷取方法 : 主体元件分析。转轴方法 : 具有 Kaiser正规化的最大变异法。元件评分。看各因子间的相关系数,若很小,则因子间基本是两两独立的

10、,说明这样的分类是较合理的。主成分分析1 【分析】【降维】【因子分析】(1) 设计分析的统计量【相关性矩阵】中的“系数”: 会显示相关系数矩阵 ;【 KMO和 Bartlett的球形度检验】 : 检验原始变量是否适合作主成分分析。【方法】里选取“主成分”。【旋转】 : 选取第一个选项“无”。【得分】 : “保存为变量”【方法】 : “回归” ; 再选中“显示因子得分系数矩阵”。2 结果分析(1) 相关系数矩阵相关性矩阵食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 相关 食品1.000 .692 .319 .760 .738 .556衣着 .692 1.000 -.081 .663 .902

11、 .389燃料 .319 -.081 1.000 -.089 -.061 .267住房 .760 .663 -.089 1.000 .831 .387交通和通讯 .738 .902 -.061 .831 1.000 .326娱乐教育文化 .556 .389 .267 .387 .326 1.000两两之间的相关系数大小的方阵。通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。由表中可知许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。(2)KMO及 BartlettKMO与 Bartletts检验检定Kaiser-Meyer-Olkin测量取样适当性。.602Bart

12、lett的球形检定大约 卡方 62.216df 15显著性 .000根据 Kaiser 的观点,当 KMO,0.9(很棒 ) 、KMO,0.8(很好 ) 、KMO,0.7(中等 ) 、KMO,0.6(普通 ) 、KMO,0.5(粗劣 ) 、KMO,0.5(不能接受 ) 。(3) 公因子方差Communalities起始 擷取食品 1.000 .878衣着 1.000 .825燃料 1.000 .841住房 1.000 .810交通和通讯 1.000 .919娱乐教育文化 1.000 .584擷取方法 : 主體元件分析。Communalities( 称共同度 ) 表示公因子对各个变量能说明的程度

13、,每个变量的初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的基准是<0.4 就可以认为是比较低,这时变量在分析中去掉比较好。(4) 解释的总方差 :说明的变异数总计起始特征值撷取平方和载入元件 总计 变异的 % 累加 % 总计 变异的 % 累加 % 1 3.568 59.474 59.474 3.568 59.474 59.474 2 1.288 21.466 80.939 1.288 21.466 80.9393 .600 10.001 90.9414 .358 5.975 96.9165 .14

14、2 2.372 99.2886 .043 .712 100.000撷取方法 : 主体元件分析。因子 1 的贡献率为 49.0%,因子 2 的贡献率为 31.899%,这两个因子贡献率累积达 80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比较显著。 (5) 成分矩阵 ( 因子载荷矩阵 )a 元件矩阵元件1 2食品 .902 .255衣着 .880 -.224燃料 .093 .912住房 .878 -.195交通和通讯 .925 -.252娱乐教育文化 .588 .488撷取方法 : 主体元件分析。a. 撷取 2 个元件。该矩阵并不是主成分1 和主成分 2 的系数。主成分系数的求法 : 各自主成分载荷向量除以主成分方差的算数平方根。则第1主成分的各3.568 个系数是向量 (0.925 ,0.902 , 0.880 ,0.878 , 0.588 ,0.093) 除以后才得到的,即 (0.490 ,0.478 , 0.466 ,0.465 ,0.311 ,0.049) 才是主成分 1 的特征向量。 第 1 主成分的函数表达式 :Y1=0.490*Z 交 +0.478*Z 食 +0.466*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论