因子分析解析课件_第1页
因子分析解析课件_第2页
因子分析解析课件_第3页
因子分析解析课件_第4页
因子分析解析课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章因子分析Factor Analysis一、因子分析的作用最重要的作用:减少变量,缩减数据。通过研究多个变量间的内部关系,探寻变量中的基本结构,并用少数几个假想变量来表示基本的数据结构。这些假想变量即是因子factors,它们能够反映原来多个基础变量所表示的主要信息。因子出现后,即可代表原来的多个基础变量使用,以达到减少变量数的目的。(意义:独立用,做单变量;做双变量)因子分析独立使用时通过少量的因子可以更清楚地把握诸多变量的本质,另外它常是一种数据整理或准备。具体作用:1)有些变量实际观察不到,但又确实发挥影响,如价值观、能力、爱好等,只能使用抽象的因子来测量;2)变量太多,需要简化;3

2、)多元回归(毛病:自变量的相关性不能太强)中常出现多重共线性,需要去掉一些变量,但无法有充分理由选择去除某个变量,故可将这些变量合并成因子,使用因子代替原有变量进行回归分析,即无多重共线性。如将收入和受教育程度合并为社会经济地位(SES)一个变量;4)评价问卷的结构效度;例,结构效度情绪及情绪应对量表:1=完全没有 2=很少有 3=有时有 4=经常有 5=每天都有1 我感到愉快2 我感到郁闷3 我情绪不好时会想办法让自己高兴起来4 我感到自己不知怎么做才好5 我感到有压力6 我想哭就哭,我哭出来感觉好多了7 我感到没人能帮助我8 我感到精力旺盛9 我感到轻松10 我会把烦心的事情放在心里11

3、我遇到不高兴的事总是难以忘掉12 我把烦心事说给别人听,之后感觉好多了13 我感到紧张14 我感到疲乏 积极情绪:1、8、9 消极情绪:2、4、5、7、13、14 外向应对:3、6、12 内向应对:10、115)在路径分析模型(缺乏总的解释力)向结构方程模型Lisrel(可以有总解释力)转化中,潜在变量的影响作用常需作因子处理(因为太多了),结构分析因此由回归和因子分析组成。如经典的研究子女收入的路径分析中,子女教育程度被单向认为是决定子女收入的,但实际上子女收入也会反过来影响子女教育程度,且在子女收入上除教育程度外,个人各种能力也会影响收入,这时只能使用结构分析模型,个人能力影响部分就需先作

4、因子分析。二、因子分析的数据要求和基本步骤1、数据要求:1)进行因子分析的各基础变量应是定距变量,虚拟变量可以同时引入,但结果可能不好(Why?数量级的影响);2)各基础变量间应存在较强的相关关系。 可以计算各变量的相关矩阵(两两变量之间的相关系数),最好相关矩阵中的所有相关系数大于0.3;SPSS提供巴雷特球体检验和KMO值,要求检验通过且KMO值大于0.5,否则不能进行因子分析,KMO值大于0.9时效果最好 。3)数据样本量应达到一定水平一般要求样本量至少是变量数的5倍以上,最好达到10倍以上;理论上要求样本量不应该少于100。样本量越大越好。4)社会学中多见李克特量表(五级)用于因子分析

5、,使用时应注意该量表应具有一定的鉴别力(鉴别力不强的要删掉,即某一问题的回答基本一致),否则因子分析效果不佳。2、基本步骤:1)选择基础变量,并对基础变量的适合状况进行分析(相关关系测量);2)从基础变量中提取因子(公共因子法与主成分法),涉及因子个数判别,因子个数应少于基础变量;3)进行因子旋转,即通过坐标变换使因子两两独立,以得到更合理的因子解。不旋转,因子负荷有时可能过分偏低。可注意对比转轴前后的因子负荷矩阵;4)计算每个样本在各个因子上的因子得分,该得分即是每个样本在各因子变量上的取值。重要概念:因子负荷是一个矩阵,表示公因子与基础变量间的相关系数。负荷大,表示该公因子与某基础变量间存

6、在较大关系。观察负荷矩阵,可以看出公因子在哪些变量上有较大负荷,可以据此说明公因子的实际含义。若矩阵缺乏规律,不能看出某个含义,还需要进行因子旋转,(增加因子变量)以求得更好的解释。三、SPSS因子分析操作与结果解释analyzedata reductionfactor1、选择并描述基础变量,并对基础变量进行检验判断:Descriptives 对话框Univariate descriptives:单变量描述统计量,输出各基础变量的均值和标准差;coefficients:输出基础变量间的相关系数矩阵,注意各值是否大于0.3;KMO and Bartletts test of sphericity

7、:输出检验显著度及KMO值。2、提取因子两种方法:主成分法与公共因子法(数学原理完全不同,具体的差异可见郭P101-102)。早期人们使用主成分法,它对变量的分布没有要求。后期发展出因子法,更灵活有效。Extraction因子提取对话框Method中的principal components即为主成分法,为系统默认;如果数据良好,则各个方法提取因子的结果相同;若样本数超过1500,极大似然法会更精确;若数据不好,后两种方法更适用;如果条件不明,仍用主成分法。Extract:控制提取过程和提取结果。Eigenvalues over中默认值为1,即提取特征值(根)大于1的因子(小于1,说明该因子解

8、释力度还不如直接引入一个原变量的平均解释力度大);利用number of factors可指定提取因子的数目。Display:结果显示。Unrotated factor solution默认输出未经旋转的因子提取结果。命令执行后输出:Communalities变量共同度表(公因子方差比):表示各变量中所含信息被K个公因子所表示的程度,取值0-1,值越大说明该变量被因子说明的程度越高;Total variance explained总方差解释表:表示提取因子在总方差中的贡献率,注意特征值在1以上的各因子的累积贡献率。特征值大于1的因子被默认为提取的公因子,但同时还可以观察累积贡献率,一般最好高于

9、80%时为止。特征值与累积贡献率常综合考虑;Component Matrix因子负荷矩阵:即各因子对各变量的影响度,根据此矩阵可初步判断各基础变量与公因子的关系,并以此说明公因子的性质,是公因子命名的根据。3、进行因子旋转,进一步明确因子组合。旋转并不改变因子分析的整体结果,只是影响各因子在各个变量上的载荷分布,并影响各因子的贡献率。Rotation对话框。SPSS提供5种旋转方法。最常用的是Varimax方差最大正交旋转,其次为Quartimax四次方最大正交旋转。斜交旋转需要指明角度,一般不用。正交表示各变量间两两独立,斜交则有一定相关性。确定旋转后将输出旋转后的因子负荷表。4、计算每个样

10、本在各个因子上的因子得分Scores对话框Save as variables (regression方法)。即可在数据库中将因子存为单独的变量,每个样本在该变量上的取值为因子得分,是根据因子得分矩阵的线性方程计算得出的。这些因子变量及其取值存储在数据库中,以便在其他分析中直接使用。对话框中选择display factor score coefficient matrix将输出:Component score coefficient matrix因子得分函数系数矩阵,据此矩阵可写出各公因子的线性表达式。四、因子分析结果与其他分析方法的结合主要依赖因子变量。注意因子变量是标准化的变量。因子变量成为

11、因变量;因子变量成为自变量;因子变量成为分析变量,如根据因子变量进行聚类。(因子分析是下一步分析的起点,不是终点,而聚类是终点)五、因子分析应用范例1、问卷题目删留情况:问卷的第三部分关于“群体身份认同”的调查采用里克特五等级尺度总加量表,在问卷录入时,根据回答强态度的强弱对回答结果进行赋值,具体赋值情况是:完全不同意为1,有点不同意为2,说不清为3,基本同意为4,完全同意为5。项目分析的目的是为了对项目进行筛选和修订,项目的选择采用双重标准,首先计算项目鉴别系数,然后计算单项与总分的相关系数。项目鉴别度的计算公式为:项目鉴别指数=(RH-RL)/N在此公式中,RH表示高分组在每个项目上的平均

12、得分(高分组之和除以N),RL表示低分组在每个项目上的平均得分(低分组之和除以N),N表示抽出的项目数。从数据分析结果看,有2项的鉴别指数达不到0.25(第21题和第26题),首先删除;再进行单项与总分的相关系数计算(本量表采用Pearson相关系数),结果显示有一项(第25题)相关系数达不到显著性程度(P0.05),最后保留8项。 2、因子特征值及百分比ComponerInitial EigenvaluesCraction Sums ofSquared LoadingsRotation Sums ofSquared LoadingsTotal% of VarianceCumula-tive

13、%Total% of VarianceCumula-tive %Total% of VarianceCumula-tive %12.55231.90031.9002.55231.90031.9002.23827.97227.97221.27515.93347.8331.27515.93347.8331.51318.91446.88631.07213.40261.2351.07213.40261.2351.14814.34961.23540.81110.13971.374-50.6838.53679.911-60.6428.02487.935-70.5486.85694.791-80.4175.

14、209100.90-3、旋转与解释将因子负荷矩阵进行正交旋转(Component Matrix),通过改变坐标轴位置,重新分配各因子所解释方差的比例,使因子结构更简单,更易于解释。 题号及因子名题项因子1(身份区隔感):C5若条件允许,我也想跟其他同学一样买昂贵的信息产品C6我们青年人在购买产品时总是首先考虑它的时尚元素C7有钱人有有钱人的玩法,穷人有穷人的玩法(例如,有钱人旅游或度假,穷人看电视或打牌)因子2(身份符合感):C1花钱消费应当与大学生的身份相符合C2人的生活和消费要有自己的特点C8我买这个产品是因为周围的人都用因子3(身份紧张感):C3我喜欢模仿周围朋友的消费方式,买和他们一样

15、的东西C4我会因为不能拥有和其他同学一样的品牌或高档信息技术产品而心情不愉快第一个因子命名为身份区隔感,主要强调个体在休闲消费方式中对于群体差异的感受性。第二个因子命名为身份符合感,主要是通过消费方式来融入群体形象的心理感受性,它追求的不是个体所属感,而是集体所属感。第三个因子命名为身份紧张感,身份紧张感是一种担心自己比不上他人或者自己的身份和地位得不到群体的承认,而试图通过炫耀性消费或攀比性消费方式,从而在心理上获得一种群体隶属来消除内部的身份紧张感。 4、从因子分析结果出发形成的路径分析图身份区隔感品牌考虑广告兴趣外观设计流行时尚身份符合感身份紧张感w0.818uv0.2790.4330.

16、2810.120=0.516=0.5020.3970.3100.2140.7460.7550.860结果表明,身份区隔感对大多数消费符号存在影响,而且是直接性的,它对品牌、广告以及时尚的作用强度分别达到0.310、0.397和0.279,这说明大学生在进行电子产品消费时受到所在群体的影响,他们消费的欲望更多的来源于符号价值的需求而不是使用价值的需要。一件商品,越是能体现消费者的社会品味和身份,越是能将消费者与他人区分开来,就越是受到大学生们的喜爱。身份符合感和身份区隔感存在相关,达到0.502,身份符合感与广告兴趣和外观设计两者的相关系数分别为0.433和0.281,通过广告的宣传渲染、外观设计的强化的推动,这种对于融入群体的身份符合感也就越强,因此,在身份符合方面,大学生们更多的把目光转向了外观设计和流行时尚。在身份紧张感方面,由于身份紧张感在某种程度上可以看作是身份区隔感和身份紧张感的缩影,因此相关系数仅为0.120和0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论