多元统计学因子分析_第1页
多元统计学因子分析_第2页
多元统计学因子分析_第3页
多元统计学因子分析_第4页
多元统计学因子分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计学因子分析第1页,课件共26页,创作于2023年2月1.用较少的因子表示原来的变量;2.目的是尽可能保持原变量相互关系(结构)原则下;寻找变量的公共因子。3.参数估计,指定几个公因子,将其还原成相关系数矩阵,在和原样本相关矩阵最相似(最大似然法)原则下,估计各个公因子的估计值。4.应用:找到具有本质意义的少量因子来归纳原来变量的特征(因子降维、潜在因子)2第2页,课件共26页,创作于2023年2月3因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。第3页,课件共26页,创作于2023年2月例子:稻米品质评价

例如,在作物的产量、品质性状研究中,我们可以通过一些指标构成的评价体系,评价作物在各个方面(每个方面可能含有几个指标、或变量)的优劣。加工精度、水分、杂质、糠粉、矿物质、稗粒、谷粒、小碎米、不完善粒、气味、色泽、籽粒长、长宽比、阴糯率、白度、垩白率、垩白度、透明度、碱消值、胶稠度、直链淀粉、蛋白质、气味、色泽、形态、适口性、滋味、食味评价4这么多的指标,能否归纳为若干个方面(公因子)第4页,课件共26页,创作于2023年2月5第5页,课件共26页,创作于2023年2月6

因子分析的数学模型为:

原变量被表示为公共因子的线性组合,当载荷矩阵旋转之后,公共因子可以做出解释,通常的情况下,我们还想反过来把公共因子表示为原变量的线性组合。

因子得分函数:可见,要求得每个因子的得分,必须求得分函数的系数,而由于p>m,所以不能得到精确的得分,只能通过估计。第6页,课件共26页,创作于2023年2月

7

如果有3个公因子,称它们是不可观测的潜在因子(假想变量)。我们研究的多个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分,称为特殊因子:第7页,课件共26页,创作于2023年2月8

因子分析与主成分分析区别主成分分析仅仅是变量变换,而因子分析需要构造(假想变量)的因子模型。主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。第8页,课件共26页,创作于2023年2月

常用的公共因子参数估计方法9(一)主成分分析法

(二)主因子法(三)极大似然估计法(正态分布)(四)最小二乘法哪个方法好,不同数据不一样,须根据DPS提供的统计检验来确定。第9页,课件共26页,创作于2023年2月因子旋转

因子分析不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进一步分析,如果每个公共因子含义不清,则不便于实际背景解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转--使因子载荷阵结构简化,即载荷矩阵每列或行的元素平方值向0和1两极分化。10第10页,课件共26页,创作于2023年2月什么时候使用斜交旋转一般情况下,对因子载荷实施正交旋转;如果正交旋转之后,因子载荷0-1两极分化还不是很理想,这时可以试试斜交旋转的方法。11第11页,课件共26页,创作于2023年2月

因子得分

12

用公共因子来还原样本点的空间结构(类似主成分分析)。

得到的因子作为自变量来做回归分析,用于对样本进行分类或评价。第12页,课件共26页,创作于2023年2月因子分析流程图13初始因子模型正交旋转或斜交旋转因子命名、构造模型及评价KMO,Bartlett球形检验,判断是否适宜作因子分析计算相关系数矩阵因子个数确定1.累计贡献,2.Kaiser-Guffman3.ScreeTest,4.BartlettTest因子提取方法1.PC法,2.主因子法3.最大似然法,4.不加权LS法5.主轴因子法,6.Alpha第13页,课件共26页,创作于2023年2月因子分析例子14数学 物理 化学 语文 历史 英语65 61 72 84 81 7977 77 76 64 70 5567 63 49 65 67 5780 69 75 74 74 6374 70 80 84 81 7478 84 75 62 71 6466 71 67 52 65 5777 71 57 72 86 7183 100 79 41 67 5086 94 97 51 63 5574 80 88 64 73 6667 84 53 58 66 5681 62 69 56 66 5271 64 94 52 61 5278 96 81 80 89 7669 56 67 75 94 8077 90 80 68 66 6084 67 75 60 70 6362 67 83 71 85 77第14页,课件共26页,创作于2023年2月提取方法和因子个数15第15页,课件共26页,创作于2023年2月因子分析主要结果16RMS=0.004479平均绝对偏差=0.003633相关系数拟合偏差均小于0.05显著性水平p=0.68887该因子模型可接受。拟合指数Q=0.94268BARTLETT修正卡方=0.39057df=4p值=0.98324旋转方法:VarimaxwithKaiserNormalization因子载荷矩阵因子1因子2共同度特殊方差简化因子1因子2数学-0.3480.7960.7550.245数学0.796物理-0.1950.7150.5490.451物理0.715化学-0.2110.6910.5210.479化学0.691语文0.847-0.3830.8640.136语文0.847历史0.852-0.2420.7850.215历史0.852英语0.870-0.2500.8190.181英语0.870方差贡献2.4041.890累计贡献%40.06371.556第16页,课件共26页,创作于2023年2月相关系数矩阵的还原情况17相关矩阵估计值(下三角)0.760.640.550.620.530.52-0.60-0.44-0.440.86-0.49-0.34-0.350.810.79-0.50-0.35-0.360.830.800.82相关矩阵残差R(下三角)(0.2448)0.00(0.4508)0.000.01(0.4785)-0.010.010.00(0.1364)0.000.000.000.00(0.2149)0.00-0.010.000.000.00(0.1812)第17页,课件共26页,创作于2023年2月如何确定一个“正确”的因子模型?

因子分析,用哪种方法提取共因子,以及提取多少个公因子?文献已有方法都不是很管用。DPS提出了一个确定因子估计方法和提取公因子个数的统计检验方法:检验统计量越大,p值越大(最好大于0.05),这时的因子估计方法和提取公因子个数的组合越好。18第18页,课件共26页,创作于2023年2月学生6门功课成绩相关系数矩阵(LawleyandMaxwell,1971)GaelicEnglishHistoryArithmeticAlgebraGeometryGaelic10.4390.4100.2880.3290.248English0.43910.3510.3540.3200.329History0.4100.35110.1640.1900.181Arithmetic0.2880.3540.16410.5950.470Algebra0.3290.3200.1900.59510.464Geometry0.2480.3290.1810.4700.464119学生6门功课成绩相关系数矩阵(LawleyandMaxwell,1971)第19页,课件共26页,创作于2023年2月Testingonthefittedmodel20提取方法检验项目2个公因子3个公因子PCAW-value0.89480.8864P-value0.07940.0584Q-index0.53260.4129PFAW-value0.9326负特征值P-value0.2983Q-index0.7472MLW-value0.94390.8706P-value0.43340.0046Q-index0.89090.7653ULSW-value0.92770.9556P-value0.25230.617Q-index0.8760.9118第20页,课件共26页,创作于2023年2月

提取2个公因子时,4种公因子提取方法得到的结果,其残差都可通过方法正态性检验,即可认为模型拟合良好、残差为白噪声。这时得到的公因子模型结构相同。6个变量中的Gaelic,English,History为一个公因子,即文科因子;另外3个变量,Arithmetic,Algebra和Geometry为另一个公因子,即理科因子。21第21页,课件共26页,创作于2023年2月如果对公因子模型进一步细分,提取3个公因子。这时出PF方法因有负特征值而不能提取3个公因子外,用其余3种方法分别提取了3个公因子结构模型。这3个公因子结构模型中,应用ML法提取的公因子模型,其残差正态性检验得到的统计量=0.8706,p=0.0046,因p<0.05,故可认为该公因子模型拟合不好,该公因子结构模型不合适。实际上,应用ML方法提取3个公因子时,它将原来的文科公因子中的English和Gaelic、History分开,这样明显的是不合理的。22第22页,课件共26页,创作于2023年2月Loadingmatrix23ML(p=0.0046)ULS(p=0.6170)PCA(p=0.0584)因子1因子2因子3因子1因子2因子3因子1因子2因子3Gaelic0.34140.68420.7045English0.95180.55230.8726History0.98040.57850.9457Arithmetic0.74220.86740.8136Algebra0.76600.58560.8159Geometry0.57000.93230.7686第23页,课件共26页,创作于2023年2月其它两种提取方法,ULS和PCA,提取得到的公因子模型,统计检验(p>0.05),故他们都可认为是可接受的。从实际意义来看,文科中的History和语言(English、Gaelic)分开,理科中的形象思维(Geometry)和抽象思维(Arithmetic,Algebra)分开都具有一定的合理性。只不过应用本文提出的鉴别方法认为,应用ULS提取得到的公因子更合理一些。24第24页,课件共26页,创作于2023年2月因子分析一般用于市场调研

在市场调研中,研究人员关心的是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论