因子分析课件因素分析详解_第1页
因子分析课件因素分析详解_第2页
因子分析课件因素分析详解_第3页
因子分析课件因素分析详解_第4页
因子分析课件因素分析详解_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因子分析课件因素分析详解一、案例引读二、基本原理三、历史渊源四、分析步骤目录五、案例详解一、案例引读二、基本原理三、历史渊源四、分析步骤五、案例详解因素分析我要定制衣服身高袖长胸围腰围肩宽肩厚颜色我们厂要批量制作衣服SML长度胖瘦……指标一指标三指标二一、案例引读因素分析身高袖长胸围腰围肩宽肩厚颜色……降维第一主成分第二主成分第三主成分将错综复杂的原变量归结为少数几个主成分主成分分析二、基本原理三、历史渊源四、分析步骤五、案例详解主成分分析特点原始变量间相关性较大几个主成分之间相互独立主成分信息由大到小身高肩宽袖长132原始变量数与主成分数相等5色5变量5色5主成分一、案例引读因素分析二、基本原理三、历史渊源四、分析步骤五、案例详解一、案例引读二、基本原理因素分析

因素分析(FactorAnalysis)就是将错综复杂的实测变量归结为少数几个因子的多元统计分析方法。其目的是揭示变量之间的内在关联性,简化数据维数,便于发现规律或本质。

因素分析的基本原理是根据相关性大小把变量分组,使得同组变量之间的相关性较高,不同组变量之间相关性较低。每组变量代表一个基本结构,这个结构用公共因子来进行解释。三、历史渊源四、分析步骤五、案例详解一、案例引读二、基本原理因素分析

因子负荷量是指因素结构中原始实测变量与因素分析时抽取出共同因素的相关程度。在因素分析中,用两个重要指标“共同度”和“特殊因子”描述。

特征值是每个变量在某一共同因素之因素负荷量的平方总和(一直行所有因素负荷量的平方和)。方差贡献率----指公共因子对实测变量的贡献,又称变异量。

共同度是每个变量在每个共同因素之负荷量的平方总和(一横列中所有因素负荷量的平方和)。从共同性的大小可以判断这个原始实测变量与共同因素间之关系程度。三、历史渊源四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读CharlesSpearman1904年对智力测验得分进行统计分析古典语(C)法语(F)英语(E)音乐(Mu)数学(M)判别(D)R因素分析四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读古典语(C)法语(F)英语(E)音乐(Mu)数学(M)判别(D)R4个假设:已知21xi=aiF+ei因素分析四、分析步骤五、案例详解二、基本原理三、历史渊源一、案例引读x1=a11F1+a12F2+…+a1mFm+a1є1x2=a21F1+a22F2+…+a2mFm+a2є2……xp=ap1F1+ap2F2+…+apmFm+apєp

因素分析把每个原始变量分解成两部分:一部分由所有变量共同具有的少数几个因子构成,即所谓公共因素部分;另一部分是每个变量独自具有的因素,即所谓独特因子部分。其中,F1,F2,…,Fm叫做公共因子,它们是在各个变量中共同出现的因子。Єi(i=1,2,…,p)表示影响xi的独特因子,指原有变量不能被因子变量所解释的部分,相当于回归分析中的残差部分。aij叫做因子负荷(载荷),它是第i个变量在第j个主因子上的负荷,它反映了第i个变量在第j个主因素的相对重要性。xp

为第p个变量的标准化分数;m为所有变量共同因素的数目;F1,F2,…,Fm彼此独立(转轴方法问题)数学模型因素分析四、分析步骤五、案例详解四、分析步骤样本的优劣因子得分xi=aiF+ei因子负荷主成分法因子旋转F→F’便于解释因素分析二、基本原理一、案例引读五、案例详解三、历史渊源四、分析步骤因素分析二、基本原理一、案例引读五、案例详解三、历史渊源因子负荷主成分法因子旋转F→F’利用主成分分析把前几个主成分作为未旋转的公共因子。F’=DF共同度不变每个因子的贡献度变化因子载荷矩阵变化四、分析步骤因素分析二、基本原理一、案例引读五、案例详解三、历史渊源因子旋转F’=DF保持F’间相互独立斜交旋转正交旋转不是很容易解释因子放弃F’间相互独立容易解释因子五、案例详解二、基本原理一、案例引读五、分析步骤三、历史渊源案例一案例二详见《问卷统计与分析实务》吴明隆著;因素分析章节北京中等职业教育发展水平分析对北京18个区县中等职业教育发展水平的9个指标进行因子分析,然后进行综合评价。x1:每万人中等职业教育在校生数

x2:每万人中等职业教育招生数

x3:每万人中等职业教育毕业生数

x4:每万人中等职业教育专任教师数

x5:本科以上学校教师占专任教师的比例

x6:高级教师占专任教师的比例

x7:学校平均在校生人数

x8:国家财政预算中等职业教育经费占国内生产总值的比例

x9:生均教育经费案例1(1)选择“Analyze(分析)——DataReduction(数据缩减)——Factor(因子)…”命令,弹出“FactorAnalyze(因子分析)”对话框,将变量“x1”到“x9”选入“Variables(变量)”框中。图1-1FactorAnalyze对话框案例1描述性统计量分数转轴法萃取选项操作过程案例1(2)设置描述性统计量:单击图1-1对话框中的“Descriptives…”按钮,弹出“FactorAnalyze:Descriptives”(因素分析:描述性统计量)对话框。单变量描述性统计量未转轴之统计量系数

倒数模式显著水平重制的行列式反映像KMO与Bartlett球形检验①“Statistics”(统计量)对话框

A“Univariatedescriptives”(单变量描述性统计量):显示每一题项的平均数、标准差。B“Initialsolution”(未转轴之统计量):显示因素分析未转轴前之共同性、特征值、变异数百分比及累积百分比。②“CorrelationMatric”(相关矩阵)选项框A“Coefficients”(系数):显示题项的相关矩阵B“Significancelevels”(显著水准):求出前述相关矩阵地显著水准。C“Determinant”(行列式):求出前述相关矩阵地行列式值。D“KMOandBartlett’stestofsphericity”(KMO与Bartlett的球形检定):显示KMO抽样适当性参数与Bartlett’s的球形检定。E“Inverse”(倒数模式):求相关矩阵的反矩阵。F“Reproduced”(重制的):显示重制相关矩阵,上三角形矩阵代表残差值;而主对角线及下三角形代表相关系数。G“Anti-image”(反映像):求出反映像的共变量及相关矩阵。图1-2FactorAnalyze:Descriptives对话框操作过程案例1(3)设置对因素的抽取选项:单击图1-1对话框中的“Extraction…”按钮,弹出“FactorAnalyze:Extraction”(因素分析:萃取)对话框。①“Method”(方法)选项框:下拉式选项内有其中抽取因素的方法:

A“Principalcomponents”法:主成份分析法抽取因素,此为SPSS默认方法。

B“Unweightedleastsquares”法:未加权最小平方法。

C“Generalizedleastsquare”法:一般化最小平方法。

D“Maximumlikelihood”法:最大概似法。

E“Principal-axisfactoring”法:主轴法。

F“Alphafactoring”法:α因素抽取法。

G“Imagefactoring”法:映像因素抽取法。②“Analyze”(分析)选项框

A“Correlationmatrix”(相关矩阵):以相关矩阵来抽取因素。B“Covariancematrix”(共变异数矩阵):以共变量矩阵来抽取因素。③“Display”(显示)选项框A“Unrotatedfactorsolution”(未旋转因子解):显示未转轴时因素负荷量、特征值及共同性。B“Screeplot”(陡坡图):陡坡图。④“Extract”(抽取)选项框

A“Eigenvaluesover”(特征值):后面的空格默认为1,表示因素抽取时,只抽取特征值大于1者,使用者可随意输入0至变量总数之间的值。

B“Numberoffactors”(因子个数):选取此项时,后面的空格内输入限定的因素个数。

相关矩阵共变异数矩阵未旋转因子解陡坡图特征值因子个数图1-3FactorAnalyze:Extraction对话框操作过程案例1(4)设置因素转轴:单击图1-1对话框中的“Rotation…”按钮,弹出“FactorAnalyze:Rotation”(因素分析:旋转)对话框。②“Display”(显示)选项框:

A“Rotatedsolution”(转轴后的解):显示转轴后的相关信息,正交转轴显示因素组型矩阵及因素转换矩阵;斜交转轴则显示因素组型、因素结构矩阵与因素相关矩阵。

B“Loadingplots”(因子负荷量):绘出因素的散步图。③“MaximumIterationsforConvergence”:(收敛最大迭代):转轴时执行的迭代最多次数,后面默认数字为25,表示算法执行转轴时,执行步骤的次数上限。①“Method”(方法)选项方框内六种因素转轴方法:

A“None”:不需要转轴。

B“Varimax”:最大变异法。

C“Quartimax”:四次方最大值法。

D“Equamax”:相等最大值法。

E“DirectOblimin”:直接斜交转轴法。

F“Promax”:Promax转轴法。正交旋转斜交旋转不转轴最大变异法四次方最大值法相等最大值法直接斜交转轴法Promax转轴法转轴后的解因子负荷量收敛最大迭代图1-4FactorAnalyze:Rotation对话框操作过程案例1(5)设置因素分数:单击图1-1对话框中的“Scores…”按钮,弹出“FactorAnalyze:Scores”(因素分析:因素分数)对话框。①“Saveasvariable”(因素存储变量)选项框:

勾选时可将新建立的因素分数存储至数据文件中,并产生新的变量名称(默认为fact_1、fact_2、fact_3、fact_4等)。在“Method”(方法)框中表示计算因素分数的方法有三种:

A“Regression”:使用回归法。

B“Bartlett”:使用Bartlette法。

C“Anderson-Robin”:使用Anderson-Robin法。

②“Displayfactorcoefficientmatrix”(显示因素分数系数矩阵)选项:

勾选时可显示因素分数系数矩阵。因素存储变量方法使用回归法使用Bartlette法使用Anderson-Robin法显示因素分数系数矩阵图1-5FactorAnalyze:Scores对话框操作过程案例1(6)设置因素分析的选项:单击图1-1对话框中的“Options…”按钮,弹出“FactorAnalyze:Options”(因素分析:选项)对话框。①“MissingValues”(缺失值)选项框:缺失值的处理方式。

A“Excludecaseslistwise”(完全排除缺失值):观察值在所有变量中没有缺失值后才加以分析。

B“Excludecasespairwise”(成对排除观察值):在成对相关分析中出现缺失值的观察值舍弃。C“Replacewithmean”(用平均数置换):以变量平均值取代缺失值。②“CoefficientDisplayFormat”(系数显示格式)选项框:因素负荷量出现的格式。

A“Sortedbysize”(依据因素负荷量排序):根据每一因素层面的因素负荷量的大小排序。B“Suppressabsolutevalueslessthan”(绝对值舍弃的下限):因素负荷量小于后面数字者不被显示,默认的值为。图1-6FactorAnalyze:Options对话框操作过程完全排除缺失值用平均数置换依据因素负荷量排序绝对值舍弃的下限成对排除观察值SPSS正在吭哧吭哧地为我们计算结果,请大家耐心等待哦!案例1(7)设置完所有的选项后,单击“OK”按钮,输出结果。经过千辛万苦的努力,我们终于可以看到结果数据了,大家有没有很兴奋呢?案例1结果分析(1)相关系数矩阵及其检验结果相关矩阵表1-7相关系数矩阵及其检验结果

表1-7是原有变量的相关系数矩阵及其检验。可以看到,大部分的相关系数都较高,各变量呈较强的线性关系,能够从中提取公共因子,初步判定适合进行因素分析。结果分析案例1KMO是Kaiser-Meyer-Olkin的取样适当性量数,用于比较变量间简单相关和偏相关系数。

KMO的取值范围在0-1之间。当KMO值越大时,表示变量间的共同因素越多,越适合进行因素分析。

Kaiser(1974)给出一个KMO的选取适合做因子分析的标准:KMO>0.9非常适合0.8<KMO<0.9适合0.7<KMO<0.8一般0.6<KMO<0.7不太适合不适合KMO<0.5非常不适合进行因素分析的普通准则至少要在以上此处的KMO值为,表示适合因素分析。KMO取样适切性量数Bartlett球形检验近似卡方分布自由度显著性Bartlett’s球形检验是以变量的相关系数矩阵为出发点,零假设相关矩阵是一个单位阵。(即sig.值小于时,适合做因子分析。)此题中,Bartlett’s球形检验的2值为,自由度为36,sig.值为,达到显著,适合进行因素分析。表1-8KMO及Bartlett检验结果(2)KMO及Bartlett检验结果具体标准结果分析案例1(3)共同性表1-9因素间共同性结果共同性初始萃取萃取法:主成分分析法

表1-3为每个变量的初始共同性以及主成分分析法抽取主成分后的共同性。共同性越低,表示该变量不适合投入主成分分析中;共同性越高,表示该变量与其他变量可测量的共同特质越多,即该变量越有影响力。采用主成分分析法抽取共同因素时,初步的共同性估计值均为1。

此题中,所有变量的共同性均较高,各个变量信息丢失较少。因此本次因子提取的总体效果较理想。

我们所选的3个主成分反映了x1(在校生数)的信息程度。X1的共同度结果分析案例1(4)解释总变异量表1-10解释总变异量

表1-10分三大部分,①初始特征值(初步抽取共同因素的结果)。Total(总和)直列的数字为每一因子的特征值,特征值越大表示因子在解释9个变量的变异量时越重要;第二直列“%ofVariance”(方差的%)为每一个抽取因素可解释变量的百分比;第三直列“Cumulative%”(累计%)为解释变量的变异量的累计百分比。②平方和负荷量萃取(转轴前的特征值、解释变异量和累计解释变异量)将左边9个成份中抽取3个特征值最大的列于右边。

③转轴平方和负荷量(转轴后的特征值、解释变异量及累计解释变异量)。解释总变异量初始特征值平方和负荷量萃取转轴平方和负荷量累计%方差的%总和成分萃取法:主成分分析法②③①

第一个因子的特征值为,解释原有9个变量总方差的55.415%(9100%),累计方差贡献率55.275%;其余数据含义类似。由于特征值是由大到小排列,所以第一个因子的解释变异量通常是最大者,它解释了总变异量的55.415%,其次是第二个,再是第三个。指定提取三个因子后,三个因子共解释了原有变量总方差的84.390%。总体上,三个因子反映了原有变量的大部分信息,因子分析效果理想。

转轴前三个因子的特征值分别为,,,特征值总和为7.595;转轴后为,,,特征值总和为。???

转轴后,个别因子的特征值会改变,但所有因子的总特征值不变,转轴后三个因子的特征值间差异较小。转轴后四个因子可以解释的总变异量不变,仍然是。特征值碎石图因子数目结果分析案例1(5)碎石图图1-11因素间共同性结果

碎石图(陡坡图)检验的判断准则是取坡线突然剧升的因素,删除坡线平坦的因素。图1-11中我们可以看出,第三个因素以后,坡线甚为平坦,因而保留2个因素较为适宜。此题中我们保留了3个因子,其实第3个因子似乎可以删除。

成分矩阵(a)成分转轴后的成分矩阵(a)成分结果分析案例1(5)成分矩阵表1-12成分矩阵表1-13转轴后的成分矩阵

表1-12显示了因子负荷矩阵,是因子分析的核心内容。可以看出,9个变量在第1个因子上的负荷都很高,意味着它们与第1个因子的相关程度高,其余2个因子与9个变量的相关性较小。另外还可以看到,这三个因子的实际含义比较模糊。

表1-12显示了旋转后的成分矩阵。招生数、在校生数、毕业生数、专任教师数和经费比例4个变量在第1个因子上有较高的负荷,第1个因子主要解释这4个变量,其意义代表中等职业教育的相对规模大小,可解释为发展规模;生均教育经费、高级教师比例、本科教师比例3个变量在第2个因子上有较高的负荷,第2个因子主要解释这3个变量,其意义代表中等职业教育的办学条件(师资、经费),可解释为办学条件;第3个因子主要解释学校平均在校生人数这个原有变量,其意义可表示中等职业教育的学校规模,可解释为学校规模效益。与转轴前相比,因子含义较为清晰。每变量在三个因子上的相关系数。成分矩阵(a)成分转轴后的成分矩阵(a)成分结果分析案例1(5)成分矩阵表1-12成分矩阵表1-13转轴后的成分矩阵

转轴的目的在于获得简单结构(simplestructure),使一个共同因素很清楚的被一组变量数所界定,使每一个变量能归属于一个明确的主因素(homefactor)(Spicer,2005)。

因素负荷量的选取标准一般以来检验。(即3个因素负荷量中只能有一个的绝对值大于。)“经费比例”这一变量与共同因素二的因素负荷量为,表示该变量虽然归属于共同因素一,但其与共同因素二仍有很密切的关联。“本科教师比例”这一变量也类似。这种结果显示,以直交转轴的最大变异法来进行因素转轴,并未完全符合简单结构的要求。

转轴后的成分矩阵(a)成分结果分析案例1(5)成分矩阵表1-13转轴后的成分矩阵

根据该表可以写出本例的因子分析模型:招生数123在校生数123……平均人数F1F23222=共同性为每个变量在各主成分上的负荷量的平方和。结果分析案例1(6)因素转换矩阵表1-14成分转换矩阵

表1-14为因素转换矩阵,利用转轴前的因素矩阵乘以此处的因素转换矩阵可得转轴后的因素矩阵。结果分析案例1成分2转轴后空间中的成分图成分1成分3图1-15负荷散点图

图1-15为根据表1-13“转轴后的成分矩阵”所绘出的负荷散点图,这里为3个因子的三维因子负荷散点图,以3个因子为坐标,给出各原始变量在该坐标中的负荷散点图。(7)负荷散点图结果分析案例1(8)因子得分矩阵表1-16因子得分矩阵

表1-16为因子得分矩阵,这是根据回归算法计算出来的因子得分函数的系数,根据该表可以得到下面的因子得分函数。

F1在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费;

F2在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费;

F3=在校生数招生数毕业生数专任教师数本科教师比例高级教师比例平均人数经费比例生均教育经费;

据这3个因子得分函数自动计算18个样本的3个因子得分,并且将3个因子得分作为新变量,保存在数据编辑窗口中(分别为fac_1、fac_2、fac_3,如图1-17所示)。图1-17因子得分结果分析案例1(9)因子得分表1-18因子的协方差矩阵结果分析案例1(9)因子的协方差矩阵

表1-18显示了3个因子的协方差矩阵。可知,3个因子没有线性相关性,实现了因子分析的设计目标。图1-19综合评价结果分析案例1(9)综合评价

我们可根据上述分析结果对18个区县的中等职业教育发展水平进行综合评价。首先,根据3个因子的方差贡献率确定权重。由于3个因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论