教育与心理统计 因素分析_第1页
教育与心理统计 因素分析_第2页
教育与心理统计 因素分析_第3页
教育与心理统计 因素分析_第4页
教育与心理统计 因素分析_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因子分析是处理多变量数据的一种统计方法,它可以揭示多变量之间的关系,其主要目的是从为数众多的可观测的变量中概况和综合出少数几个因子,用较少的因子变量来最大程度地概况和解释原有的观测信息,从而建立起简洁的概念系统,揭示出事物之间本质的联系。因子分析方法是英国心理学家斯皮尔曼在考察“智力”结构时发展起来的统计方法,目前它已经发展成为统计学的一个分支。第一节实例分析例1:职业能力倾向自我评定量表第二节因子分析的类别一、R型因子分析与Q型因子分析R型因子分析是针对变量所做得因子分析,其基本思想是通过对变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量去描述多个随机变量之间的相关关系。但这少数几个随机变量是不能直接观测的,通常称为因子。然后再根据相关性的大小把变量分组,使同组内的变量之间的相关性较高,不同组变量之间的相关性较低。Q型因子分析是针对样品所做的因子分析。二、探索性因子分析与验证性因子分析1、探索性因子分析(EFA)就是指传统的因子分析。在典型的EFA中,研究者通过共变关系的分解,找出共同因子,然后进一步探讨这些共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。

由于传统的因子分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量两者间寻找平衡点。因为因子分析至多可抽取出相等于观察变量总数的因子数目,这样,虽可解释全部100%的变异,但失去因子分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必将损失部分可解释变异来作为代价。2、验证性因子分析(CFA)要求研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因子分析的目的是为了检验这一先期提出的因子结构的适合性。三、因子分析基本思想、模型与条件1、因子与因子负荷因子分析发展最初目的是在简化一群庞杂的测量,找出可能存在于观察变量背后的因子结构,使之更为明确,增加其可理解性。因子分析的基本假设是那些不可观测的“因子”隐含在许多现实可观察的事物背后,虽然难以直接测量,但可以从复杂的外在现象中计算、估计或抽取得到。

因子分析运算的过程,与回归分析类似。为了进行因子分析,必须假定每一测试的分数都符合正态分布,对于一个给定的被试,每一测试分数都是它在一组或因子上的分数再加上该因子测试特有成分的线性组合。即Xij=bj1Fi1+bj2Fi2+……+bjmFim+ij。其中Xij是第i个被试在第j个子测试中的分数值,Fik是同一被试在第k个维度上的“分数”。ij是Xij的一部分,它不能用普通的维度来说明,可以认为是第j个测试中的特殊量。该因子等式可写成更简单的形式:Xj=bj1F1+bj2F2+……+bjmFm+j。这个等式的意思是“第j个子测试的分数是在公共因子F1,F2,…,Fm上的分数加一个特殊因子所贡献的j线性组合”。bjk是第k个因子在第j个子测试分数中的负荷,又称为因子分数系数。2、因子分析的条件因子分析的进行必须满足以下几个条件:①因子分析的变量都必须是连续变量,符合线性关系的假设;②抽样过程必须随机,并具有一定规模,专家建议样本数在100以下不宜进行因子分析,样本数最好大于300。或样本数最少为变量数的五倍,且大于100;③变量之间具有一定程度的相关,对于一群相关太高或太低的变量,不太适合进行因子分析。第三节因素分析的原理与过程一、效度与探索性因素分析1、效度的分类效度分为内容效度、效标关联效度、建构效度和专家评定效度。建构效度(constructvalidity):指测验能够测量出理论的特质或概念的程度,即实际的测验分数能解释某一心理特质有多少。

2关系

统计学上,检验建构效度的最常用的方法是因素分析。研究者如果以因素分析去检验测验工具的效度,并有效地抽取共同因素,此共同因素与理论结构的心理特质甚为接近,就可以说,量表具有“建构效度”。二、计算过程1、计算相关矩阵因子分析的基础是变量之间的相关。因子分析的第一步是计算各个题目之间的两两相关。(1)巴特莱球形检验。Bartlett球型检验(bartlett’stestofsphercity)用于检验相关阵是否是单位阵,检验这些相关系数是否不同且大于零。(2)KMO检验。以判断数据是否适合进行因素分析。Kaiser认为,KMO>0.9时,极适合进行因素分析;KMO>0.8时,适合进行因素分析;KMO>0.7时,尚可进行因素分析;KMO>0.6时,勉强进行因素分析;KMO>0.5时,不适合进行因素分析,KMO<0.5时,非常不宜做因素分析。(3)共同性指数检查。在某一变量上各因子负荷量平方值的总和。变量的共同性越高,因子分析的结果越理想。题项平均共同性最好在.70以上,如果样本数大于250,平均共同性应该在.60以上。2、因子抽取的方法A主成分分析法:是以线性组合式将所有变量加以合并,计算所有变量共同解释的变异量,该线性组合称为主要成分。第一次线性组合所解释的变异量最大,分离此变异量所剩余的变异量,经第二个线性组合式,可以分离出第二个主成分,其所包含的变异量属于第二个主成分的变异量,依次类推。B主轴因素法:是分析变量间的共同变量而非全体变异量,其计算方式是将相关矩阵中的对角线,由原来的1.00改为共同性来取代,其目的在于抽出一系列互相独立的因素。第一个因素解释最大的原始变量间共同变异量;第二个因素解释剩余共同变异量的最大变异。此法符合因素分析模式的假设,即分析变量间共同变异,而非分析变量的总变异,且因素的内容较易了解。一般化最小二乘法未加权最小二乘法极大似然法Alpha因素抽取法映象因素抽取法3、因子数目(1)特征值主要根据特征值的大小。特征值代表某一因子可解释的总变异量,特征值越大,代表改因子解释力越强。一般情况下,选取特征值大于1的因素。(2)碎石图即陡坡检验。将每一个因子依其特征值从达到小排序,当因子的特征值逐渐接近,没有变化之时,代表特殊的因子已经无法抽取出来。4、转轴方法在因素抽取上,通常最初因素抽取后,对因素无法做有效解释,转轴的目的就在于改变题项在各因素的负荷量的大小,转轴时根据题项与因素结构关系的密切程度,调整各因素负荷量的大小,转轴后,大部分题项在每个共同因素中有一个差异较大的因素负荷量。说明:※因素旋转的目的是寻找一个“最简结构”,即经过使得:①在K个因素上所有原变量变异矢量的投影(又称因素负荷)都尽可能都是正的;②取值为零的因素负荷的数目尽可能地多。※寻找一个“最简结构”的目的,为了能够更加逻辑合理地辨识因素并且为它们命名。(1)正交旋转正交,指旋转过程中,因子之间的轴线夹角为90度,即因子之间的相关设定为0。有最大变异法,四方最大法,均等变异法。(2)斜交旋转:先求得在正交因素模型下的因素负荷矩阵B,然后对因素负荷矩阵A作斜交变换T*,求得斜交负

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论