教育与心理统计因素分析_第1页
教育与心理统计因素分析_第2页
教育与心理统计因素分析_第3页
教育与心理统计因素分析_第4页
教育与心理统计因素分析_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育与心理统计因素分析第一页,共三十五页,2022年,8月28日因子分析方法是英国心理学家斯皮尔曼在考察“智力”结构时发展起来的统计方法,目前它已经发展成为统计学的一个分支。第二页,共三十五页,2022年,8月28日第一节实例分析例1:职业能力倾向自我评定量表第三页,共三十五页,2022年,8月28日第二节因子分析的类别一、R型因子分析与Q型因子分析R型因子分析是针对变量所做得因子分析,其基本思想是通过对变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量去描述多个随机变量之间的相关关系。但这少数几个随机变量是不能直接观测的,通常称为因子。然后再根据相关性的大小把变量分组,使同组内的变量之间的相关性较高,不同组变量之间的相关性较低。Q型因子分析是针对样品所做的因子分析。第四页,共三十五页,2022年,8月28日二、探索性因子分析与验证性因子分析1、探索性因子分析(EFA)就是指传统的因子分析。在典型的EFA中,研究者通过共变关系的分解,找出共同因子,然后进一步探讨这些共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。第五页,共三十五页,2022年,8月28日

由于传统的因子分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量两者间寻找平衡点。因为因子分析至多可抽取出相等于观察变量总数的因子数目,这样,虽可解释全部100%的变异,但失去因子分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必将损失部分可解释变异来作为代价。第六页,共三十五页,2022年,8月28日2、验证性因子分析(CFA)要求研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因子分析的目的是为了检验这一先期提出的因子结构的适合性。第七页,共三十五页,2022年,8月28日三、因子分析基本思想、模型与条件1、因子与因子负荷因子分析发展最初目的是在简化一群庞杂的测量,找出可能存在于观察变量背后的因子结构,使之更为明确,增加其可理解性。因子分析的基本假设是那些不可观测的“因子”隐含在许多现实可观察的事物背后,虽然难以直接测量,但可以从复杂的外在现象中计算、估计或抽取得到。第八页,共三十五页,2022年,8月28日

因子分析运算的过程,与回归分析类似。为了进行因子分析,必须假定每一测试的分数都符合正态分布,对于一个给定的被试,每一测试分数都是它在一组或因子上的分数再加上该因子测试特有成分的线性组合。即Xij=bj1Fi1+bj2Fi2+……+bjmFim+ij。其中Xij是第i个被试在第j个子测试中的分数值,Fik是同一被试在第k个维度上的“分数”。ij是Xij的一部分,它不能用普通的维度来说明,可以认为是第j个测试中的特殊量。该因子等式可写成更简单的形式:Xj=bj1F1+bj2F2+……+bjmFm+j。这个等式的意思是“第j个子测试的分数是在公共因子F1,F2,…,Fm上的分数加一个特殊因子所贡献的j线性组合”。bjk是第k个因子在第j个子测试分数中的负荷,又称为因子分数系数。第九页,共三十五页,2022年,8月28日2、因子分析的条件因子分析的进行必须满足以下几个条件:①因子分析的变量都必须是连续变量,符合线性关系的假设;②抽样过程必须随机,并具有一定规模,专家建议样本数在100以下不宜进行因子分析,样本数最好大于300。或样本数最少为变量数的五倍,且大于100;③变量之间具有一定程度的相关,对于一群相关太高或太低的变量,不太适合进行因子分析。第十页,共三十五页,2022年,8月28日第三节因素分析的原理与过程一、效度与探索性因素分析1、效度的分类效度分为内容效度、效标关联效度、建构效度和专家评定效度。建构效度(constructvalidity):指测验能够测量出理论的特质或概念的程度,即实际的测验分数能解释某一心理特质有多少。第十一页,共三十五页,2022年,8月28日

2关系

统计学上,检验建构效度的最常用的方法是因素分析。研究者如果以因素分析去检验测验工具的效度,并有效地抽取共同因素,此共同因素与理论结构的心理特质甚为接近,就可以说,量表具有“建构效度”。第十二页,共三十五页,2022年,8月28日二、计算过程1、计算相关矩阵因子分析的基础是变量之间的相关。因子分析的第一步是计算各个题目之间的两两相关。第十三页,共三十五页,2022年,8月28日(1)巴特莱球形检验。Bartlett球型检验(bartlett’stestofsphercity)用于检验相关阵是否是单位阵,检验这些相关系数是否不同且大于零。第十四页,共三十五页,2022年,8月28日(2)KMO检验。以判断数据是否适合进行因素分析。第十五页,共三十五页,2022年,8月28日Kaiser认为,KMO>0.9时,极适合进行因素分析;KMO>0.8时,适合进行因素分析;KMO>0.7时,尚可进行因素分析;KMO>0.6时,勉强进行因素分析;KMO>0.5时,不适合进行因素分析,KMO<0.5时,非常不宜做因素分析。第十六页,共三十五页,2022年,8月28日(3)共同性指数检查。在某一变量上各因子负荷量平方值的总和。变量的共同性越高,因子分析的结果越理想。题项平均共同性最好在.70以上,如果样本数大于250,平均共同性应该在.60以上。第十七页,共三十五页,2022年,8月28日2、因子抽取的方法A主成分分析法:是以线性组合式将所有变量加以合并,计算所有变量共同解释的变异量,该线性组合称为主要成分。第一次线性组合所解释的变异量最大,分离此变异量所剩余的变异量,经第二个线性组合式,可以分离出第二个主成分,其所包含的变异量属于第二个主成分的变异量,依次类推。第十八页,共三十五页,2022年,8月28日B主轴因素法:是分析变量间的共同变量而非全体变异量,其计算方式是将相关矩阵中的对角线,由原来的1.00改为共同性来取代,其目的在于抽出一系列互相独立的因素。第一个因素解释最大的原始变量间共同变异量;第二个因素解释剩余共同变异量的最大变异。此法符合因素分析模式的假设,即分析变量间共同变异,而非分析变量的总变异,且因素的内容较易了解。第十九页,共三十五页,2022年,8月28日一般化最小二乘法未加权最小二乘法极大似然法Alpha因素抽取法映象因素抽取法第二十页,共三十五页,2022年,8月28日3、因子数目(1)特征值主要根据特征值的大小。特征值代表某一因子可解释的总变异量,特征值越大,代表改因子解释力越强。一般情况下,选取特征值大于1的因素。第二十一页,共三十五页,2022年,8月28日(2)碎石图即陡坡检验。将每一个因子依其特征值从达到小排序,当因子的特征值逐渐接近,没有变化之时,代表特殊的因子已经无法抽取出来。第二十二页,共三十五页,2022年,8月28日4、转轴方法在因素抽取上,通常最初因素抽取后,对因素无法做有效解释,转轴的目的就在于改变题项在各因素的负荷量的大小,转轴时根据题项与因素结构关系的密切程度,调整各因素负荷量的大小,转轴后,大部分题项在每个共同因素中有一个差异较大的因素负荷量。说明:※因素旋转的目的是寻找一个“最简结构”,即经过使得:①在K个因素上所有原变量变异矢量的投影(又称因素负荷)都尽可能都是正的;②取值为零的因素负荷的数目尽可能地多。第二十三页,共三十五页,2022年,8月28日※寻找一个“最简结构”的目的,为了能够更加逻辑合理地辨识因素并且为它们命名。(1)正交旋转正交,指旋转过程中,因子之间的轴线夹角为90度,即因子之间的相关设定为0。有最大变异法,四方最大法,均等变异法。(2)斜交旋转:先求得在正交因素模型下的因素负荷矩阵B,然后对因素负荷矩阵A作斜交变换T*,求得斜交负荷矩阵A*=BT*。这种方法因子与因子之间具有一定的相关性。有最小斜交法,最大斜交法和四方最小法。第二十四页,共三十五页,2022年,8月28日至于采用何种转轴法,研究者可以根据文献探究与理论基础分析结果作为依据,如果相关理论上显示共同因素层面间是彼此独立,没有关系存在的,则应采取正交转轴法;如果依理论研究所得,因素层面间,彼此有相关并且非独立的,则应采取斜交转轴法。第二十五页,共三十五页,2022年,8月28日5、决定因素与命名根据心理学专业知识。第二十六页,共三十五页,2022年,8月28日三、量值的关系旋转前旋转后第二十七页,共三十五页,2022年,8月28日说明:(1)旋转前后。特征值的和不变(2)旋转前后,共同性不变(3)共同性为行负荷值的平方和(4)特征值为列负荷值的平方和。第二十八页,共三十五页,2022年,8月28日第四节探索性因素分析的拓展一、探索性因素分析的反复性1、你所编制的量表必须依据于前人对抑郁的理解以及已有的研究成果。2、编制纯粹的抑郁量表对现实社会有什么意义?我们进一步了解到承受力与抑郁应该结合考虑,为什么?如果抑郁程度高,心理承受力低,那么他可能会从这个楼上跳下去,如果抑郁程度高,但心理承受力高,他也不会出现过激行为。所以,通过探索性因素分析编制题目时就需要考虑心理承受力因素,或者编制另外的心理承受力量表,做有关抑郁研究时,将心理承受力作为协变量处理。3、由于量表题目有价值倾向,所以需要加入测谎题。4本土化问题。第二十九页,共三十五页,2022年,8月28日

由于是探索性因素分析,在因素分析时,根据项目分析或题项与总分的判别,剔除题项后,剩下的量表题项均纳入因素分析变量范围内,以特征值等于1为判别基准时,研究者常会发觉计算机所抽取的因素过多,或某些因素所包含的题项不够恰当、因素命名不容易。在探索因素中,这是可以理解的,因为受受试者填答、量表编制过程的严谨性等变化因素的影响,常导致部分量表的因素分析结果,不完全符合研究者当初编制的层面因素,所以研究者可能会删除题项进行第二、第三次的因素分析。第三十页,共三十五页,2022年,8月28日探索性因素分析与验证性因素分析模型假设的区分:探索性因素分析的假设:(1)所有的公共因素都相关(或都无关)(2)所有的公共因素直接影响所有的观测变量(3)特殊因素之间相互独立(4)所有观测变量只受一个特殊因素的影响(5)公共因素和特殊因素相互独立(6)观测变量与潜在变量之间的关系不是事先假定的;(7)潜在变量的个数不是在分析前确定的(8)模型通常是不可识别的第三十一页,共三十五页,2022年,8月28日验证性因素分析的假设:(1)公共因素之间可以相关也可以无关(2)观测变量可以只受某一个或几个公共因素的影响而不必受所有公共因素的影响(3)特殊因素之间可以有相关,还可以出现不存在误差因素的观测变量(4)公共因素和特殊因素之间相互独立(5)观测变量与潜变量之间的关系事先假定的;(6)潜在变量的个数在数据分析前确定的(7)模型通常要求是可识别的第三十二页,共三十五页,2022年,8月28日[考研与考试真题]1、判断:对一元线性回归方程,可以有多种方法检验其显著性。第三十三页,共三十五页,2022年,8月28日2、下面是对8个项目作主成分分析,然后进行旋转后的因素载荷矩阵:因素I因素II因素III因素IV

项目1.81.05.20.13

项目2.78.21.01.12

项目3.65-.04.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论