第十章SPSS的因子分析-学生_第1页
第十章SPSS的因子分析-学生_第2页
第十章SPSS的因子分析-学生_第3页
第十章SPSS的因子分析-学生_第4页
第十章SPSS的因子分析-学生_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章SPSS的因子分析因子分析的基本思想1、为尽可能完整描述一个事物,往往要收集它的许多指标(如企业评价、投资环境评价)多指标产生的问题:计算处理麻烦信息重叠从众多的指标中剔除一些指标又会造成信息丢失2、潜变量与显变量因子分析的基本思想因子分析的基本出发点将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差)这些综合指标之间没有相关性因子变量的特点这些综合指标称为因子变量,是原变量的重新构造个数远远少于原变量个数,但可反映原变量的绝大部分方差不相关性可命名解释性因子分析的核心问题如何构造因子变量如何使因子变量具有命名解释性因子分析的基本步骤确认待分析的原始变量是否适合作因子分析构造因子变量利用旋转方法使因子变量具有可解释性计算每个样本的因子变量得分因子分析的数学模型数学模型(xi为标准化的原始变量;Fi为因子变量;m<p)

x1=a11F1+a12F2+…+a1mFm+ε1 x2=a21F1+a22F2+…+a2mFm+ε2 …… xp=ap1F1+ap2F2+…+apmFm+εp也可以矩阵的形式表示为:

X=AF+εF:因子变量A:因子载荷阵aij:因子载荷ε:特殊因子因子分析的基本概念因子载荷在因子变量不相关的条件下,aij就是第i个原始变量与第j个因子变量的相关系数。aij绝对值越大,则Xi与Fi的关系越强。——反映因子和各变量间的密切程度因子分析的基本概念变量的共同度(Communality)(公因子方差比)——衡量因子分析效果Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和在原始变量标准化的条件下:h2i+ε2i=1可见:Xi的共同度反应了全部因子变量对Xi总方差的解释能力——表示提取公因子后,各变量中信息分别被提取出的比例,或者是原变量的信息量(方差)中由公因子决定的比例(类似于决定系数)因子分析的基本概念因子变量Fj的方差贡献——衡量因子的重要程度因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和可见:因子变量Fj的方差贡献体现了同一因子Fj对原始所有变量总方差的解释能力。Sj/p表示了第j个因子解释原所有变量总方差的比例原有变量是否适合作因子分析计算原有变量的相关系数矩阵一般小于0.3且未通过统计检验就不适合作因子分析巴特利特球度检验(Bartletttestofsphericity)H0:相关系数矩阵与单位阵无显著差异以变量的相关系数矩阵出发计算巴特利特统计量。统计量较大且概率小于显著性水平,应拒绝H0,表示适合作因子分析原有变量是否适合作因子分析反映象相关矩阵(Anti-imagecorrelationmatrix)检验以变量的偏相关系数矩阵为出发点,将偏相关系数矩阵的每个元素取反,得到反映象相关阵。如果反映象相关矩阵中对角线元素的绝对值比较大,其他大多数元素的绝对值较小,则说明这些变量相关性较强,适合作因子分析。KMO(Kaiser-Meyer-Olkin)检验KMO=所有变量间相关系数平方和/(所有变量间相关系数平方和+所有变量间偏相关系数平方和)所有变量间相关系数平方和远远大于偏相关系数平方和时,KMO值接近1,意味着变量间的相关性越强一般0.7以上就可以作因子分析构造因子变量--主成分分析主成分分析法:利用坐标变换y1=u11x1+u21x2+…+up1xpy2=u12x1+u22x2+…+up2xp ……yP=u1Px1+u2Px2+…+uppxp该方程组要求:每一列的系数平方和=1,即u1k2+u2k2+u3k2+…+upk2=1(k=1,2,3,…p)将原有的P个相关变量Xi作线性变换后转成另一组不相关的变量Yix2x1y1y2X1与x2相关,y1与y2不相关构造因子变量--主成分分析系数uij依照两个原则来确定yi与yj(i≠j,i,j=1,2,3,…p)互不相关;y1是x1,x2,x3,…,xp的一切线性组合(系数满足上述方程组)中方差最大的;y2是与y1不相关的x1,x2,x3,…,xp的一切线性组合中方差次大的;yP是与y1,y2,y3,…yp都不相关的x1,x2,x3,…,xp的一切线性组合中方差最小的;构造因子变量--主成分分析确定m个主成份根据特征值λi确定:取特征值大于1的主成分;根据累计贡献率,一般累计贡献率应在70%以上还可以通过直观观察碎石图的方式确定主成分的个数。综合判断,往往根据累计贡献率确定较少,根据特征值λi确定又较多,应两者结合注:因子分析更重要的是因子的可解释性,必要时可保留特征根小于1的因子;而即使特征根大于1,但无合理解释,也可舍去。计算因子载荷矩阵主成分分析中选取主成分的个数就是因子分析中因子变量的个数依据因子载荷矩阵计算变量的共同度和因子变量的方差贡献率构造因子变量--主成分分析主成分分析的基本步骤:将原始数据标准化计算变量间简单相关系数矩阵R求R的特征值λ1≥λ2≥λ3≥…λp≥0及对应的单位特征向量μ1,μ2,μ3,…μp得到:yi=u1ix1+u2ix2+…+upixp特征根(Eigenvalue)可以看成主成分影响力度的指标,代表引入该因子(主成分)后可以解释平均多少原始变量的信息因子变量的命名解释发现:aij的绝对值可能在某一行的许多列上都有较大的取值,表明:某个原有变量xi可能同时与几个因子都有比较大的相关关系,也就是说,某个原有变量xi的信息需要由若干个因子变量来共同解释;或aij的绝对值可能在某一列的许多行上都有较大的取值。表明:虽然一个因子变量可能能够解释许多变量的信息,但它却只能解释某个变量的一少部分信息,不是任何一个变量的典型代表。结论:因子变量的实际含义不清楚因子变量的命名解释通过某种手段使:每个变量在尽可能少的因子上有比较高的载荷,即:在理想状态下,让某些变量在某个因子上的载荷趋于1,而在其他因子上的载荷趋于0。这样:一个因子变量就能够成为某些变量的典型代表,它的实际含义也就清楚了。——通过对因子载荷矩阵进行旋转来实现因子变量的命名解释例如:在市场调查中收集食品的五项指标:味道、价格、风味、是否快餐食品、能量。因子分析结果:X1=0.02z1+0.99z2+ε1X2=0.94z1-0.01z2+ε2X3=0.13z1+0.98z2+ε3X4=0.84z1+0.42z2+ε4X5=0.97z1-0.02z2+ε5第一公因子代表“价廉”,第二公因子代表“味美”计算因子得分因子得分是因子变量构造的最终体现。基本思想:是将因子变量表示为原有变量的线性组合,即:通过因子得分函数计算因子得分Fj=βj1x1+βj2x2+βj3x3+…+βjpxp(j=1,2,3,…,m)因子分析的基本步骤菜单选项:analyze->DimensionReduction->Factor选择参与因子分析的变量到Variables框Extraction:选择构造因子变量的方法。默认主成分分析法。DisplayScreeplot画碎石图Extract框:指定确定因子个数的标准因子分析的基本步骤Rotation:选择因子载荷矩阵的旋转方法。默认是不进行旋转。一般可以选择Varimax选项,采用方差极大法旋转Scores:Saveasvariables:将因子得分存成一个名为FACn_m的SPSS变量中,其中:n是因子变量的名,以数字序号的形式表示;m表示是第几次作的。Displayfactorscorecoefficientmatrix项表示:以矩阵的形式输出因子得分函数。Method框中提供了估计因子得分的几种方法。因子分析结果公因子个数的确定:根据方差贡献率,观察碎石图因子变量的实际解释:通过因子载荷矩阵旋转因子得分及其含义对应分析问题提出分析分类变量之间关系时,卡方检验只能给出总体有无关联的结论,无法给出各分类之间的联系实际问题:全球通品牌的用户都是谁?其他还有什么特征的人群也倾向于成为移动用户?什么特征的人群还没有找到满意的品牌?移动公司推出的品牌是否全面,有无重叠品牌?有无空白市场需要品牌填补?对应分析方法是一种多维图示分析技术,直观而简单地呈现类别间的联系。通过进行主成分分析描述两个或多个分类变量各水平间相关性,分析结果主要采用反映变量间相互关系的对应分析图来表示对应分析实例1收入水平与品牌选择(1)b产品

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论