




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
探索性因素分析因素分析简介行为科学与社会科学研究中多变量之间得统计分析方法主要有:1、将多个变量与某种称为准则变量得外部变量联系起来进行分析。回归分析、方差分析等。2、不使用外部准则而同等地对待所有变量,分析它们之间得相互关系。相关分析、因素分析等。探索性因素分析探索性因素分析(ExploratoryFactorAnalysis)就是一种常用得多元数据分析方法,它就是从众多可观测“变量”中,概括与推论出少数不可观测得“潜变量”(又称因素),目得在于用最少得因素去概括与解释大量得观测事实,并建立起最简洁得,基本得概念系统,以揭示事物之间得本质联系得一种统计分析方法。这种方法得原则就是在尽可能保存原有资料信息得前提下,用较少得维度去表示原来得数据结构。因素分析模型因素分析假定个体在某一变量上得反应由两部分组成:一就是各个变量共有得部分,称为共同因素(monFactor);另一部分就是各变量所特有得部分,称为独特因素(UniqueFactor),可用下式表示:
就是第i个体在第j观测变量上得得分,(
jk)就是因素对观测变量得加权系数,(Fik)就是个体i在因素Fk上得得分,Uij为特殊因素,dj为特殊因素对观测变量得加权系数;N为样本容量,n为观测变量得个数,m为共因素得个数。
因素分析得模型主要有全分量模型与公因子模型两个。
全分量模型(主成分分析模型)
就是指用n个新得因素来线性表示n个观测变量得因素分析模型(m=n)。此模型希望从一组相关观测变量中每次取得得一个公共因素得方差在观测变量得全部方差(或剩余方差)中所占得比例最大,这一思想也就是全分量模型确定公共因素得一种数学准则。
但在实际应用中,人们总就是只取少数几个对观测变量得方差贡献较大得即为首得几个因素。于就是得到截分量模型
截分量模型(主成分分析模型)在实际应用中,人们总就是只取少数几个对观测变量得方差贡献较大得即为首得几个因素。有些人把几个方差贡献较小得因素瞧作误差项。于就是全分量模型就成为:
(j=1,2,3,……nm<n)
这一模型确切地说应称为截分量模型(truncatedponentmodel),但经常被称作主成分分析模型。误差项ajej表示被忽略得几项因素之与。
公共因素模型
指所有观测变量中每个观测变量均可被表示为m个公共因素与一个唯一性因素得线性加权之与:
(j=1,2,3,……nm<n)
其中公共因素可以解释观测变量之间得相关,唯一性因素则用以解释观测变量除去公共因素得影响后所剩下得那部分方差。公共因素模型这一模型希望从观测变量中抽取到得因素能尽可能好地再生观测变量之间得相关。在这一模型中将观测变量、公共因素与唯一性因素都假定为标准变量,平均数为0,标准差为1,而且n个唯一因素uj之间相互独立,每个唯一性因素与各个公共因素Fp(p=1,2,……,m)之间相互独立。各公共因素Fp就是随机变量。若假定各公共因素为互相独立得正态分布,则观测变量Zj就服从多元正态分布。在实际应用公共因素分析方法时,通常把唯一性因素瞧作不包括模型误差,也就就是说因素分析没有考虑抽样误差。因此,抽样就必须足够大,以使抽样误差被忽视,样本究竟多大合适,一般至少要大于100,或者就是变量数目得
5——10倍。
因素分析中得基本概念因素载荷(Factorloading)公共因素方差(munality)唯一性方差(uniqueness)特征值(Eigenvalue)贡献率(ExplainofVariance)因素载荷(Factorloading)
因素载荷指因素分析模型中各公共因素对观测变量得加权系数
jk
。一般情况下,称共因素得系数为因素载荷。即因素分析模型中得系数。将所有得因素载荷以矩阵得形式表示即为因素载荷以矩阵。公共因素方差公共因素方差一般用h2表示,又称作“共同度”或“公共性”,公共因素方差就是指被公共因素所决定得方差在观测变量总方差中所占得比例。在对观测数据进行标准化得情况下,一个观测变量得总方差Sj2为:其中由公共因素决定得方差为:12大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流公共因素方差在测验或特质行为得研究方面主要有以下用途:1、公共因素方差能反映该测验对所要测量行为属性得测量程度,公共因素方差越大,该因素所能反映得行为属性程度就越强,某一因素得方差贡献率越大,说明该因素在她所测量得特质中,它所起得作用就越大。2、如果在构成一个测验得诸多项目中,某些项目构成得因素得公共方差大,说明这些项目测定被试得个别差异得功能强,也说明该组项目得区分度好,鉴别力高,同理公共因素方差越小,该项目得鉴别力越低。因此项目得公共因素方差,可用作评价项目区分度得一种指标。唯一性方差(uniqueness)归因于唯一性因素得那部分方差称为唯一性方差,唯一性方差表示m个公共因素对观测变量得方差不能作出解释得部分,一部分归因于所选变量得特殊性,称为特殊性方差;剩余部分归因于测量得不完备性。特征值特征值:对于一个n阶矩阵A,如果存在一个n维向量v与一个常数,满足条件则称为矩阵A得一个特征值,称v为对应于特征值得一个特征向量。
特征值在因素分析中,特征值表示每个因素在所有变量上得因素负荷得平方之与,它反映某一公共因素对各观测变量得影响程度,也说明该公共因素得重要性。特征值越大,说明该公共因素相对重要。贡献率各因素得特征值(
j)在总得公共因素方差之与中所占得比例。反映该因素对所有观测变量变异影响得大小。第j个共因素得方差贡献率为:变量共同度得估计在全分量模型中可以直接用相关矩阵求解因素载荷矩阵,在公共因素模型中,由于考虑特殊因素对变量得影响,求解因素载荷矩阵则以约相关矩阵为出发点。估计变量得共同度就是得到约相关矩阵估计得关键,最大相关系数估计法最大相关系数估计法就是把原相关矩阵每一行(或每一列)绝对值最大得一个元素作为该行(或该列)变量共同度得估计。复相关系数平方估计法ZJ变量得复相关系数得平方为:其中RJJ为对角线元素为1得相关矩阵R得逆矩阵中第j个变量对角线得元素,SMC就是共同度估计得下限。公共因素个数得确定根据累计贡献率确定因子个数以特征值就是否大于等于1为标准碎石检验根据累积贡献率确定因子个数将约相关矩阵(在主成分分析中,用相关矩阵)得特征值从大到小排列,根据前面若干个共同因素所对应得特征值之与得百分比来确定。一般来说,这一比例要达到80%以上,但根据问题得复杂程度可做适当调整。、以特征值就是否大于等于1为标准特征值大于等于1得选为共因素,小于1得不选。碎石检验(screentest)以特征值为纵坐标,以因素个数为横坐标,按照因子被提取得顺序,画出因子得特征值随因子个数变化得散点图,根据图得形状来判断抽取因子得个数。从第一个因子开始,曲线逐渐下降,然后变得平缓,最后近似于一条直线,曲线变平得前一点被认为就是提取得最大因子数。初始因素载荷矩阵求解对于全分量模型来说,直接从变量相关矩阵入手求解因素载荷矩阵;而对于公共因素模型,则从约相关矩阵出发来求解因素载荷矩阵A。目前,求解因素载荷矩阵使用较为普遍得一种方法就是主因素解法(在全分量模型中称为主成分分析法)。它得基本思想就是,考虑第一共同因素得方差对所有变量得方差贡献最大,第二共同因素对所有变量得方差贡献次之,……依次将全部变量得方差分解为各共同因素方差,最终求得因素载荷矩阵。
求初始因素载荷矩阵得一般方法PrincipalponentsUnweightedLeastSquaresGeneralizedLeastSquaresMaximumLikelihoodPrincipalAxisFactoringAlphaFactoringImageFactoring旋转变换初始因子解达到了数据化简得目得。在求初始因子这一步中,我们既确定了共因素个数,又确定了每个变量得公因子方差。可就是根据初始因子解,往往很难解释因子得意义,大多数因子都与很多变量相关,但就是在实际研究中,我们往往关心每个因子得实际意义就是什么。因子旋转就是寻求这一实际意义得有效工具,因子旋转得目得就是通过改变坐标轴得位置,重新分配各个因子所解释得方差得比例,使因子结构简单并易于解释。因子旋转不改变模型对数据得拟合程度,不改变每个变量得公因子方差。因子旋转得方式因子旋转得方式有两种,一种就是正交旋转,另一种就是斜交旋转。正交旋转就是使因子轴之间仍然保持90度角,即因子之间就是不相关得,而在斜交旋转中,因子之间得夹角可以就是任意得,即因子之间可以相关。正交旋转①四次方最大法(QUARTIMAX)通过使因子载荷矩阵中每一行因子负荷平方得方差达到最大求得因子解。最终得简化准则为:
②方差最大法(VARIMAX)四次方最大法得不同就是它从简化因子负荷矩阵得每一列出发,使与每个因子有关得负荷平方得方差最大。方差最大法通过使下式达到最大求得因子解:
③等量最大法(EQUIMAX)等量最大法把四次方最大法与方差最大法结合起来,取V与Q得加权平均作为简化准则,通过使下式达到最大:权数γ等于m/2,与因子数有关,当因子数为2时,等量旋转法结果与方差最大法旋转结果相同。斜交旋转常见得为OBLIMIN,该方法应用斜交参考轴求解。所谓得斜交参考轴就是指斜主因子轴得垂直线。斜交因子解应使变量尽可能落在主轴附近,变量落在主轴附近与变量在参考轴上得投影近似为零这两个条件就是相同得。OBLIMIN方法首先求出斜交参考矩阵,斜交因子负荷矩阵等于斜交参考阵得逆矩阵再按行进行规范化处理,使矩阵中每一行得元素得平方与等于1。参数δ控制因子斜交得程度,其取值一般小于等于零,等于零时,因子之间得斜交程度最大,小于零时因子之间得斜交程度减小。另外还有Promax法。6、因子得分及应用在公式中可以将变量表示成公共因素得线性组合。但在有些场合,需要考虑通过变量Z得值来获得共因素指标F得值。这种由变量得观测值来估计各公共因素值得方法称为因素得分。因素得分及其应用求因素得分涉及到用观测变量来描述因素,第p个因子在第i个个案上得值可以表示为:其中,zji
就是第j个变量在第i个个体上得值,wpj
就是第p个因子与第j个变量之间得因子值系数。因素得分及其应用因子分析模型中就是用因子得线性组合来表示一个观测变量,因子负荷实际就是该线性组合得权数。求因子得分得过程正好相反,它就是通过观测变量得线性组合来表示因子,因子得分就是观测变量得加权平均。因为各个变量在因子上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年CPMM核心技能试题及答案
- 重要的物流交易平台对比试题及答案
- 老年肺炎的诊断、治疗与预防2025
- 餐饮美学基础 课件 2.3口鼻审美
- 2024年供应链管理师考试重点章节试题及答案
- 放松心态:2024年CPMM试题及答案
- 2024国际物流师的实务考查与试题及答案
- CPSM考试组织管理知识点解析及试题及答案
- 在线学习技巧CPMM试题及答案
- 国际物流师的专业认证解析试题及答案
- 新增供应商准入制度
- 制造业数字化车间与智能化生产流程实施方案
- 水泥稳定碎石在填筑路面基层中的应用
- 信息检索与利用课件 第8章 网络信息检索(下)
- 单招课件教学课件
- DB43T 1606-2019 烟花爆竹涉药机械设备安全论证规程
- 《产后出血预防与处理指南(2023)》解读课件
- 2024年安徽省初中(八年级)学业水平考试地理试卷含答案
- 2024年四川省泸州市中考化学试题含答案
- 江苏省苏州市姑苏区草桥中学校2022-2023学年七下期中数学试题(原卷版)
- 供应商8D报告模版
评论
0/150
提交评论