版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于因子分析主成分分析问题的提出 假定你现在掌握了一个区域内评价自然资源的多个指标。这些指标从不同的侧面反映所评价自然资源特征 如果让你分析该区域的自然资源情况,能不能找到综合变量来对该区域内的发展水平排序呢?
第2页,共89页,2024年2月25日,星期天方法的选择常用方法:主成分分析找出主要影响因素(主成分)因子分析找出公共因子,该公共因子可以概括其所包含的变量第3页,共89页,2024年2月25日,星期天方法的选择主成分分析找出主要影响因素(主成分)减少需要考虑的变量综合排序优先考虑第一主成分各变量对整个样本的影响程度第4页,共89页,2024年2月25日,星期天方法的选择因子分析找出公共因子综合排序综合考虑各公共因子各变量对整个样本的影响程度第5页,共89页,2024年2月25日,星期天方法的选择主成分分析与因子分析的区别对原始数据的要求因子分析要求各变量互不相关主成分分析要考虑各变量的物理意义(即是否有些变量可以不考虑)计算方法因子分析:要对系数矩阵做旋转主成分分析:不需要对系数矩阵旋转第6页,共89页,2024年2月25日,星期天方法的选择主成分分析与因子分析的优缺点比较对原始变量的保留因子分析:不对原始变量进行取舍,只是重新组合主成分分析:舍弃小部分原始变量对实际工作量的影响因子分析:对工作量减少的影响有限(因综合考虑各变量)主成分分析:大幅减少工作量(因只考虑主成分,实际工作中可以舍弃非主成分)综合排序的准确性(理论上)因子分析大于主成分分析第7页,共89页,2024年2月25日,星期天方法的选择分析建立在大样本的基础之上有人认为样本容量要大于50个有人认为样本容量要是变量个数的10倍以上有人认为如果数据均匀,则不需要大样本有人认为……第8页,共89页,2024年2月25日,星期天方法的选择本实验适合做因子分析,不适合做主成分分析本实验首先详细介绍因子分析然后用本实验的数据,介绍SPSS中主成分分析的方法第9页,共89页,2024年2月25日,星期天方法的选择因子分析试图:在力保数据信息丢失最少原则下研究指标体系的少数几个线性组合几个线性组合所构成的综合指标能尽可能多地保留原来指标的信息这些综合指标就称公共因子。第10页,共89页,2024年2月25日,星期天方法的选择选择几个公共因子???因子分析的目的是简化变量,公共因子的个数应该小于原始变量个数保留几个公共因子??应该权衡公共因子个数和保留的信息的程度,一般要保留原始信息的85%以上。第11页,共89页,2024年2月25日,星期天方法的选择SPSS适用于统计初学者或非统计学专业人员数据转换功能较强Spss(*.sav)Excel(*.xls)Text(*.txt)dBase(*.dbf)……..第12页,共89页,2024年2月25日,星期天实验步骤1.数据的准备操作打开保存数据2.数据描述分析(Descriptive)3.因子分析4.输出结果分析第13页,共89页,2024年2月25日,星期天一、数据准备1)首先在Excel中打开“水样元素成分分析数据”,删除表名“水样元素成分分析数据”,保存数据。2)在SPSS中打开保存好的Excel数据第14页,共89页,2024年2月25日,星期天一、数据准备在Excel中删除在SPSS中自动转为列标题第15页,共89页,2024年2月25日,星期天数据准备启动SPSS双击SPSS15.0图标在开始菜单中找到SPSS15.0forWindows,点击。。。。第16页,共89页,2024年2月25日,星期天选择文件选择
Openanexistingdatasource双击MoreFile第17页,共89页,2024年2月25日,星期天选择文件在文件类型中选择Excel第18页,共89页,2024年2月25日,星期天选择文件“Worksheet”表示的是Excel表格中的行范围第19页,共89页,2024年2月25日,星期天数据编辑窗口SPSS中的列名为Excel中第一行第20页,共89页,2024年2月25日,星期天数据编辑窗口左下角的两个选项卡,DataView和VariableView默认状态下是DataView切换到VariableView第21页,共89页,2024年2月25日,星期天变量格式设置窗口在VariableView中可以设置变更的名称、类型等参数名称类型小数显示位数输出结果中变量的显示名称输出结果中变量内容的显示名称第22页,共89页,2024年2月25日,星期天VariableViewName—更改变量名称Type—选择变量类型(如numeric
、string)Decimals—设定小数显示的位数Label—分析输出结果中变量的显示名称Values—分析输出结果中变量内容的显示名称第23页,共89页,2024年2月25日,星期天结果输出窗口Output为结果输出窗口,可以显示我们对文件的操作信息以及对数据的分析结果第24页,共89页,2024年2月25日,星期天数据格式转换将Excel数据转换成为SPSS数据,第25页,共89页,2024年2月25日,星期天保存文件点击File菜单下的SaveAs选项第26页,共89页,2024年2月25日,星期天保存文件保存时类型为SPSS(*.sav)第27页,共89页,2024年2月25日,星期天保存结果输出文件Output结果输出窗口点击File菜单下的SaveAs选项第28页,共89页,2024年2月25日,星期天保存结果输出文件保存时类型为SPSS(*.spo)第29页,共89页,2024年2月25日,星期天因子分析的步骤:1.判断是否需要进行因子分析判断方法:对变量进行线性回归分析(spss中的Descriptive命令可以实现)通常各变量的线性回归系数没有明显差别,为了使各变量的线性回归系数向0或1两极分化,要进行旋转依据变量的相关性进行判断,采用Bartlett球检验法或KMO检验法,确定是否有进行因子分析的必要2.如果有因子分析的必要,则进行因子分析第30页,共89页,2024年2月25日,星期天二、数据特征描述操作:命令Descriptive该命令可完成多种统计指标:均值、中位数、众数、和标准差、方差(标准差的平方)极大值、极小值、全距均值的标准误差偏度、峰度。第31页,共89页,2024年2月25日,星期天Descriptives过程点击Analyze下的DescriptiveStatistics(描述统计)选项,选择该选项下的Descriptives第32页,共89页,2024年2月25日,星期天Descriptives选中待处理的变量(左侧的As…..Hg等);点击使变量As…..Hg移至Variable(s)中;选中Savestandrdizedvaluesasvariables(保存标准化值作为变量);点击Options(选项)12第33页,共89页,2024年2月25日,星期天Descriptives过程选择所要的特征值:Mean(均数)Std.deviation(标准差)Minimum(最小值)Maximum(最大值)升序排列(Ascendingmeans)点击Continue第34页,共89页,2024年2月25日,星期天Descriptives过程原始数据标准化将原始数据转换成标准Z分值并存入数据库根据原始数据与均值的大小,大于均值的为正值,小于均值的为负值,相等的为零输出原始数据特征的描述参数,如均值、方差等第35页,共89页,2024年2月25日,星期天数据标准化标准化过程就是将数据进行处理后,新数据具有均值为0、标准差为1的特征第36页,共89页,2024年2月25日,星期天因子分析法(数据标准化)
对于具有不同级或不同单位的数据进行处理,使资料在更平等的条件下进行分析。假设为原观测值,为数据均值,S为标准差,则标准化后的观测值(标准正态变换)为
第37页,共89页,2024年2月25日,星期天Descriptives过程点击OK第38页,共89页,2024年2月25日,星期天Descriptives过程标准化处理后的数据第39页,共89页,2024年2月25日,星期天Descriptives过程样品数量最小值最大值均数标准差第40页,共89页,2024年2月25日,星期天三、因子分析点击Analyze下的DataReduction(数据降维)选项,选择该选项下的Factor(因子分析)过程第41页,共89页,2024年2月25日,星期天因子分析1、选中待处理的变量,移至Variables第42页,共89页,2024年2月25日,星期天因子分析2、点击Descriptives判断是否有进行因子分析的必要Coefficients(计算相关系数矩阵)Significancelevels(显著水平)KMOandBartlett’stestofsphericity(对相关系数矩阵进行统计学检验)第43页,共89页,2024年2月25日,星期天因子分析判断是否有进行因子分析的必要Inverse(倒数模式):求出相关矩阵的反矩阵(因子分析用不到)Reproduced(重制的):显示重制相关矩阵(因子分析用不到)Determinant(行列式):求出前述相关矩阵的行列式值(因子分析用不到)Anti-image(反映像):求出反映像的共同量及相关矩阵。(因子分析用不到)第44页,共89页,2024年2月25日,星期天因子分析Statistics选项框:选中
Univariatedescriptive单变量描述统计量(输出被选中的各变量的均数与标准差)Initialsolution未旋转之统计量(显示未旋转前之共同性、特征值、变异数百分比及累积百分比,由于因子分析要求进行旋转操作,所以此处不必选择)点击Continue第45页,共89页,2024年2月25日,星期天因子分析3、点击Extraction(因子提取)第46页,共89页,2024年2月25日,星期天因子分析选择因子分析方法(因子分析一般使用用Principalcomponents,即公共因子分析法),该方法要求Extract选项中的特征值大于1)输出未旋转的因子载荷矩阵(可选)第47页,共89页,2024年2月25日,星期天因子分析Method所提供的选项有:PrincipalComponents公共因子分析法Unweightedleastsquares未加权最小平方法Generalizedleastsquares综合最小平方法Maximumlikelihood极大似然估计法Principalaxisfactoring主轴因子法Alpphafatoringα因子法Imagefatoring多元回归法第48页,共89页,2024年2月25日,星期天因子分析选中Principalcomponents(注:此对话框中的选项,除Display外,均为Principalcomponents法默认的选项,一般情况下,不需要更改以相关矩阵为依据提取因子变量提取特征值大于1的因子作为因子变量旋转前输出未旋转的因子载荷矩阵迭代到25次后终止分析
碎石图(显示特征值的贡献率,可选)此处可输入限定之因子个数以共变量矩阵为依据提取因子变量第49页,共89页,2024年2月25日,星期天因子分析4、点击Rotation(旋转)第50页,共89页,2024年2月25日,星期天因子分析输出旋转后的因子载荷矩阵第51页,共89页,2024年2月25日,星期天因子分析选中
Varimax(正交旋转选中
Rotatedsolution(输出选中后的因子载荷矩阵)点击Continue因子载荷图:绘出因子载荷散布图(可选)全体旋转
四分旋转
直接斜交旋转法
旋转时执行的叠代最多次数六种因素旋转方法斜交法
第52页,共89页,2024年2月25日,星期天因子分析因子载荷矩阵旋转使用方差最大正交旋转或斜交旋转,其他旋转方法一般不用于因子分析中方差最大正交旋转:保持变量之间互不相关,使载荷向0、1两端分化。本实验中,认为As、Pb、Cu等变量之间无必然的联系,所以采用方差最大正交旋转斜交旋转:在变量之间必定存在某种联系的时候使用,比如,在经济学中,人的消费心理、产品质量、文化差异之间必定会存在联系,所以用斜交旋转第53页,共89页,2024年2月25日,星期天因子分析5、点击Scores第54页,共89页,2024年2月25日,星期天因子分析选中
Saveasvariables(把因子得分保存在数据文件中)选中
Regression(回归因子得分)点击Continue计算因素分数的方法在分析结果中给出因子得分系数矩阵及其相关矩阵第55页,共89页,2024年2月25日,星期天因子分析Regression:回归因子得分Bartlett:极大似然估计Anderson-Rubin:Bartlett算法的改进算法计算因素分数的方法第56页,共89页,2024年2月25日,星期天因子分析6、点击Options第57页,共89页,2024年2月25日,星期天因子分析选中Excludecaseslistwise(去除所有含缺失数据的样本、再进行分析,只要样品数据中有缺失,就删除该样品数据)选中Sortedbysize(载荷系数将按照数值大小排列,并构成矩阵)不显示绝对值小于设定值的载荷系数,设定值范围0~1点击Continue第58页,共89页,2024年2月25日,星期天因子分析Excludecasespairwise(当样品数据中缺少2个或2个以上的数据时,才删除该样品数据,选中此项最大限度的利用得来不易的数据)Raplacewithmean(当分析计算涉及含有缺失值的变量时,用平均值代替该缺失值)第59页,共89页,2024年2月25日,星期天因子分析7、点击OK第60页,共89页,2024年2月25日,星期天结果分析SPSS输出的第一个表格列出了标准化后数据的平均值(Mean)、标准差(Std.Deviation)和分析用到的取值个数(N)
Univariatedescriptive单变量描述统计量(输出被选中的各变量的均数与标准差)第61页,共89页,2024年2月25日,星期天结果分析系统输出的第2个表格是8个原始变量的相关矩阵与单尾显著性检验第62页,共89页,2024年2月25日,星期天结果分析多个变量之间的相关系数较大,说明这些变量之间存在着较为显著的相关性,且其对应的Sig值(显著性)普遍较小,根据分析,这些数据有进行因子分析的必要。第63页,共89页,2024年2月25日,星期天结果分析KMO检验法和巴特利特球形检验法(KMOandBartlettTestofSphericity)的检验结果第64页,共89页,2024年2月25日,星期天结果分析Bartlett球形检验统计量的Sig<0.01,认为各变量之间存在着显著的相关性,可以进行因子分析.第65页,共89页,2024年2月25日,星期天结果分析一般,KMO大于0.9时,认为因子分析的结果可靠,0.7以上可以接受,0.5以下可能不能接受第66页,共89页,2024年2月25日,星期天结果分析SPSS输出的第四个表格“成分矩阵”是初始的未经旋转的因子载荷矩阵第67页,共89页,2024年2月25日,星期天结果分析已选出了3个主因子,以替代原有的8个变量第68页,共89页,2024年2月25日,星期天结果分析SPSS输出的第七个表格“旋转成分矩阵”是经过旋转后的因子载荷矩阵。第69页,共89页,2024年2月25日,星期天结果分析旋转后每个公因子上的载荷分配地更清晰,因子变量代表的变量相对集中,比未旋转时更容易解释各因子的意义。第70页,共89页,2024年2月25日,星期天结果分析载荷绝对值较大的因子与变量的关系更为密切,也更能代表这个变量第71页,共89页,2024年2月25日,星期天结果分析第1公因子代表Cd、Zn、As、Pb这几个变量因素第2公因子代表Cr、P两个变量第3公因子代表Cu、Hg两个变量第72页,共89页,2024年2月25日,星期天结果分析可以根据实际情况对第1公因子、第2公因子、第3公因子命名我们将第1公因子命名为镉类,第2公因子命名为铬类,第3公因子命名为铜类第73页,共89页,2024年2月25日,星期天结果分析SPSS输出的第八个表格,是将Cd、Zn、As、Pb用第1因子代替、Cr、Pb用第2因子代替,Cu、Hg用第3因子代替,显示了因子分析后,提取出的各因子之间的相关性,因子之间相关性越小,结果越可靠可以看到,本实验的各公共因子之间的相关性比较大,认为本实验的因子分析结果不可靠第74页,共89页,2024年2月25日,星期天结果分析SPSS输出的第六个表格表示各因子变量的特征值与累积贡献率提取因子的初始值旋转后提取因子的值特征值贡献率累计贡献率第75页,共89页,2024年2月25日,星期天结果分析由于前3个因子累计贡献率达到91.798%,根据累计贡献率大于85%的原则,故选取这三个因子提取因子的初始特征值旋转后提取因子的特征值特征值贡献率累计贡献率第76页,共89页,2024年2月25日,星期天结果分析SPSS输出的第五个表格表示所提取的公共因子对该变量的信息综合、解释能力第77页,共89页,2024年2月25日,星期天结果分析As的为0.974,可以理解为3个公共因子能够综合As的信息的97.4%;Pb的为0.581,可以理解为3个公共因子能够解释As的信息的58.1%。第78页,共89页,2024年2月25日,星期天结果分析回到DataView窗口的当前数据集,会看到文件中增加了3列FAC1_1(第1因子得分)、FAC2_1(第2因子得分)和FAC3_1(第3因子得分),得分表示的是每个公共因子所占的权重。比如,本实验中表示的是每类元素的含量所占的权重。第1公因子代表Cd、Zn、As、Pb第2公因子代表Cr、P第3公因子代表Cu、Hg第79页,共89页,2024年2月25日,星期天结果分析我们可以通过第1因子得分来了解镉类元素的分布情况,通过第2公因子来了解铬类元素的分布情况,通过第3公因子来了解铜类元素的分布情况第1公因子代表Cd、Zn、As、Pb第2公因子代表Cr、P第3公因子代表Cu、Hg第80页,共89页,2024年2月25日,星期天结果分析样号为Z-W-2-02的样品Cd、Zn、As、Pb含量较高,样号为C-W-06-01的样品Cr、P含量较高,样号为C-W-01-02的样品重金属含量较高第1公因子代表Cd、Zn、As、Pb第2公因子
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《险有害因素辨识》课件
- 一活动的意义满足基本的生理需要有助于解除心理压力减
- 《员工手册培训讲义》课件
- 病案查阅、借阅制度
- 《基本营养物质》课件
- 《合成树脂与塑料》课件
- 企业培训研修班汇报
- 《吉林社保政策全》课件
- 《基因操作》课件
- 《公共卫生监测》课件
- GB/T 6163-2011调频广播接收机测量方法
- GB/T 6003.1-2012试验筛技术要求和检验第1部分:金属丝编织网试验筛
- GB/T 13459-2008劳动防护服防寒保暖要求
- GB/T 1231-1991钢结构用高强度大六角头螺拴、大六角螺母、垫圈技术条件
- 立志做有理想敢担当能吃苦肯奋斗的新时代好青年PPT课件(带内容)
- 陶瓷基复合材料要点课件
- 翻译实习教学大纲
- 心力衰竭-英文版课件
- 邀请回国探亲邀请函范本
- 曾华 民族传统体育(陀螺)
- 留置胃管与胃肠减压术课件
评论
0/150
提交评论