主成分、因子分析步骤_第1页
主成分、因子分析步骤_第2页
主成分、因子分析步骤_第3页
主成分、因子分析步骤_第4页
主成分、因子分析步骤_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析、因子分析步骤 不同 主成分分析 因子分析 占 八、 概念 具有相关关系的 p个变 将原数据中多个可能相关的变量综合 量,经过线性组合后成为 成少数几个不相关的可反映原始变量 k个不相关的新变量 的绝大多数信息的综合变量 主要 减少变量个数,以较少的 找寻变量间的内部相关性及潜在的共 目标 主成分来解释原有变量间 的大部分变异,适合于数 据简化 同因素,适合做 数据结构检测 强调 强调的是解释数据变异的 强调的是变量之间的相关性,以协方 重点 能力,以方差为导向,使 差为导向,关心每个变量与其他变量 方差达到最大 共同享有部分的大小 最终 形成一个或数个总指标变 反映变量间潜在或观察

2、不到的因素 结果 应用 量 变异 它将所有的变量的变异都 只考虑每一题与其他题目共同享有的 解释 考虑在内,因而没有误差 变异,因而有误差项,叫独特因素 程度 项 是否 主成分分析作综合指标 因子分析需要经过旋转才能对因子作 Tm 用, 命名与解释 旋转 不需要旋转 是否 只是对数据作变换,故不 因子分析对资料要求需符合许多假 有假 需要假设 设,如果假设条件不符,则因子分析 设 的结果将受到质疑 因子分析 1【分析】T【降维】T【因子分析】 (1)描述性统计量(Descriptives )对话框设置 KM併口 Bartlett 的球形度检验(检验多变量正态性和原始变量是否适合作因子 分析)。

3、 (2)因子抽取(Extraction )对话框设置 方法:默认主成分法。主成分分析一定要选主成分法 分析:主成分分析:相关性矩阵。 输出:为旋转的因子图 抽取:默认选1. 最大收敛性迭代次数:默认25. (3)因子旋转(Rotation )对话框设置 因子旋转的方法,常选择“最大方差法”。“输出”框中的“旋转解”。 (4)因子得分(Scores )对话框设置 “保存为变量”,则可将新建立的因子得分储存至数据文件中,并产生新的 变量名称。 (5)选项(Options )对话框设置 2结果分析 (1) KMC及 Bartlett s 检验 KMO和Bartlett 的检验 取样足够度的 Kais

4、er-Meyer-Olkin度量。 Bartlett的球形度检验近似卡方 df Sig. .515 3.784 6 .706 当KMO值愈大时,表示变量间的共同因子愈多,愈适合作因子分析。根据 Kaiser 的观点,当 KMO 0.9 (很棒)、KMO 0.8 (很好)、KMO 0.7 (中等)、 KMO 0.6 (普通)、KMO0.5 (粗劣)、KM& 0.5 (不能接受)。 (2)公因子方差 公因子方差 起始 撷取 卫生 1.000 .855 饭量 1.000 .846 等待时间 1.000 .819 味道 1.000 .919 亲切 1.000 .608 撷取方法:主体元件分析 Comm

5、u nalities (称共同度)表示公因子对各个变量能说明的程度,每个变量的 初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是 该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的 基准是0.4就可以认为是比较低,这时变量在分析中去掉比较好。 (3)解释的总方差 说明的变异数总计 元件 各因子的特征值 因子贡献率 因子累积贡献率 总计 变异的% 累加% 总计 变异的% 累加% 总计 变异的% 累加% 1 2.451 49.024 49.024 2.451 49.024 49.024 2.042 40.843 40.843 2 1.595 31.899 8

6、0.923 1.595 31.899 80.923 2.004 40.079 80.923 3 .662 13.246 94.168 4 .191 3.823 97.992 5 .100 2.008 100.000 撷取方法:主体元件分析。 第二列:各因子的统计值 第三列:各因子特征值与全体特征值总和之比的百分比。也称因子贡献率。 第四列:累积百分比也称因子累积贡献率 第二列统计的值是 各因子的特征值,即各因子能解释的方差,一般的,特征值 在1以上就是重要的因子;第三列是各因子的特征值与所有因子的特征值总和 的比,也称因子贡献率;第四列是因子累计贡献率。 如因子1的特征值为2.451,因子2的

7、特征值为1.595,因子3,4,5的特征值在 1以下。因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡 献率累积达80.9%,即这两个因子可解释原有变量 80.9%的信息,因而 因子取二 维比较显著。 至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量, fac1_1、fac2_1,即为因子得分。 (4) 成分矩阵与旋转成分矩阵 成分矩阵是 未旋转前的因子矩阵,从该表中并无法清楚地看出每个变量到底应 归属于哪个因子。旋转后的因子矩阵,从该表中可清楚地看出每个变量到底应 归属于哪个因子。此表显示 旋转后原始的所有变量与新生的2个公因子之间的 相关程度。

8、一般的,因子负荷量的 绝对值0.4以上,认为是显著的变量,超过0.5时可以 说是非常重要的变量。如味道与饭量关于因子1的负荷量高,所以聚成因子 1, 称为饮食因子;等待时间、卫生、亲切关于因子2的负荷量高,所以聚成因子2, 又可以称为服务因子。 (5) 因子得分系数矩阵 元件评分系数矩阵 元件 1 2 卫生 -.010 .447 饭量 .425 -.036 等待时间 -.038 .424 味道 .480 .059 亲切 -.316 -.371 撷取方法:主体元件分析。 转轴方法:具有 Kaiser正规化的最 大变异法。 元件评分。 因子得分系数矩阵给出了因子与各变量的线性组合系数 因子 1 的

9、分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5 因子 2 的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5 (6) 因子转换矩阵 元件转换矩阵 元件 1 2 1 .723 -.691 2 .691 .723 撷取方法:主体元件分析。 转轴方法:具有Kaiser正规化 的最大变异法。 因子转换矩阵是主成分形式的系数。 (7) 因子得分协方差矩阵 元件评分共变异数矩阵 元件 1 2 1 2 1.000 .000 1 1.000 .000 撷取方法:主体元件分析。 转轴方法:具有Kaiser正规化 的最

10、大变异法。 元件评分。 ,说明这样的分 看各因子间的相关系数,若很小,则因子间基本是两两独立的 类是较合理的 主成分分析 1【分析】一一【降维】一一【因子分析】 (1)设计分析的统计量 【相关性矩阵】中的“系数”:会显示相关系数矩阵; 【KMO Bartlett 的球形度检验】:检验原始变量是否适合作主成分分析。 【方法】里选取“主成分”。 【旋转】:选取第一个选项“无”。 【得分】:“保存为变量” 【方法】:“回归”;再选中“显示因子得分系数矩阵”。 2结果分析 (1)相关系数矩阵 相关性矩阵 食品 衣着 燃料 住房 交通和通讯 娱乐教育文化 相关食品 1.000 .692 .319 .76

11、0 .738 .556 衣着 .692 1.000 -.081 .663 .902 .389 燃料 .319 -.081 1.000 -.089 -.061 .267 住房 .760 .663 -.089 1.000 .831 .387 交通和通讯 .738 .902 -.061 .831 1.000 .326 娱乐教育文化 .556 .389 .267 .387 .326 1.000 两两之间的相关系数大小的方阵。通过相关系数可以看到各个变量之间的相关,进而 了解各个变量之间的关系。由表中可知许多变量之间直接的相关性比较强,证明他们 存在信息上的重叠。 (2) KMC及 Bartlett s

12、 检验 KMO与 Bartlet 检定 Kaiser-Meyer-OIki n 适当性。 测量取样 .602 Bartlett 的球大约 卡方 62.216 形检定 df 15 显著性 .000 根据Kaiser的观点,当KM60.9 (很棒)、KM6 0.8 (很好)、KM6 0.7 (中等)、 KM6 0.6 (普通)、KM60.5 (粗劣)、KM& 0.5 (不能接受)。 (3)公因子方差 Communalities 起始 擷取 食品 1.000 .878 衣着 1.000 .825 燃料 1.000 .841 住房 1.000 .810 交通和通讯 1.000 .919 娱乐教育文化

13、1.000 .584 擷取方法:主體元件分析 Commu nalities (称共同度)表示公因子对各个变量能说明的程度,每个变量的 初始公因子方差都为1,共同度越大,公因子对该变量说明的程度越大,也就是 该变量对公因子的依赖程度越大。共同度低说明在因子中的重要度低。一般的 基准是0.4就可以认为是比较低,这时变量在分析中去掉比较好。 (4)解释的总方差: 说明的变异数总计 元件 起始特征值 撷取平方和载入 总计 变异的% 累加% 总计 变异的% 累加% 1 3.568 59.474 59.474 3.568 59.474 59.474 2 1.288 21.466 80.939 1.288

14、21.466 80.939 3 .600 10.001 90.941 4 .358 5.975 96.916 5 .142 2.372 99.288 6 .043 .712 100.000 撷取方法:主体元件分析 因子1的贡献率为49.0%,因子2的贡献率为31.899%,这两个因子贡献率累积 达80.9%,即这两个因子可解释原有变量 80.9%的信息,因而因子取二维比较显 著。 (5)成分矩阵(因子载荷矩阵) 元件矩阵 元件 1 2 食品 .902 .255 衣着 .880 -.224 燃料 .093 .912 住房 .878 -.195 交通和通讯 .925 -.252 娱乐教育文化 .588 .488 撷取方法:主体元件分析 a.撷取2个元件。 该矩阵并不是主成分1和主成分2的系数。 主成分系数的求法:各自主成分载荷向量除以主成分方差的算数平方根。则第1 主成分的各个系数是向量( 0.925,0.902,0.880,0.878,0.588,0.093 )除 以 3568 后才得到的,即(0.490,0.478,0.466,0.465,0.311,0.049 )才 是主成分1的特征向量。 第1主成分的函数表达式: Y1=0.490*Z 交 +0.478*Z 食 +

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论