《主成分分析与》PPT课件.ppt_第1页
《主成分分析与》PPT课件.ppt_第2页
《主成分分析与》PPT课件.ppt_第3页
《主成分分析与》PPT课件.ppt_第4页
《主成分分析与》PPT课件.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主成分分析与 因子分析,山西医科大学卫生统计教研室 刘桂芬 ,多变量大样本分析中,变量间存在共线性,增加了分析的复杂性。若分别分析各个指标,分析有可能是孤立的,而不是综合的;盲目地减少指标又有可能损失很多信息,得出错误结论。欲采用较少指标,反映原资料大部分信息,可采用主成分分析和因子分析。,主成分分析,概 念,主成分分析(principal component analysis)是将分散在一组变量上的信息,集中到某几个综合指标(主成分)上的一种探索性统计分析方法。它利用降维的思想,将多个变量化为少数几个互不相关的主成分,从而描述数据集的内部结构。,主成分的几何意义,x1,x2,p1,p2,x1,对应m个变量的q个主成分如下:,其中( )分别是变量相关阵的前q个特征根对应的特征向量。 的方差分别是q个特征根12q。( )是第i个变量在各个主成分上的载荷。而实际上载荷往往是指 ,它是第i个 变量在各个标准化主成分上的载荷。据此可用最小二乘法解得标准主成分得分。标准化主成分的方差为1。,PCA 常用统计量: .特征根 i .各成分贡献率 .前各成分累计贡献率 .特征向量 各成分表达式中标准化原始变量的系数向量,就是各成分的特征向量。,因子分析,一、因子分析模型,设X=(x1, x2, ,xp)为可观测的随机变量,且有 f=(f1,f2,fm)为公共(共性)因子(common factor),简称因子(factor),e=(e1,e2,ep)为特殊因子(specific factor) f和e均为不可直接观测的随机变量 =(1,2,p)为总体x的均值 A=(aij)p*m为因子负荷(载荷)(factor loading)矩阵,通常先对x作标准化处理,使其均值为零,方差为这样就有 假定()fi的均数为,方差为; ()ei的均数为,方差为i; () fi与ei相互独立 则称x为具有m个公共因子的因子模型,如果再满足()fi与fj相互独立(ij),则称该因子模型为正交因子模型。 正交因子模型具有如下特性: x的方差可表示为 设,()hi2是m个公共因子对第i个变量的贡献,称为第i个共同度(communality)或共性方差,公因子方差(common variance) ()i称为特殊方差(specific variance),是不能由公共因子解释的部分,因子载荷(负荷)aij是随机变量xi与公共因子fj的相关系数。 设 称gj2为公共因子fj对x的“贡献”,是衡量公共因子fj重要性的一个指标。,二、因子分析的步骤,1.输入原始数据xn*p,计算样本均值和方 差,进行标准化计算(处理); 2.求样本相关系数矩阵R=(rij)p*p; 3.求相关系数矩阵的特征根i (1,2,p0)和相应的标准正交的特征向量li;,4.确定公共因子数; 5.计算公共因子的共性方差hi2; 6.对载荷矩阵进行旋转,以求能更好地解释公共因子; 7.对公共因子作出专业性的解释。,三、因子分析提取因子的方法,主成分法(principal component factor),每一个公共因子的载荷系数之平方和等于对应的特征根,即该公共因子的方差。,极大似然法(maximum likelihood factor) 假定原变量服从正态分布,公共因子和特殊因子也服从正态分布,构造因子负荷和特殊方差的似然函数,求其极大,得到唯一解。,主因子法(principal factor) 设原变量的相关矩阵为R=(rij),其逆矩阵为R-1=(rij)。各变量特征方差的初始值取为逆相关矩阵对角线元素的倒数,i=1/rii。则共同度的初始值为(hi) 。,以(hi)2代替相关矩阵中的对角线上的元素,得到约化相关矩阵R 。,R的前m个特征根及其对应的单位化特征向量 就是主因子解。,迭代主因子法(iterated principal factor) 主因子的解很不稳定。因此,常以估计的共同度为初始值,构造新的约化矩阵,再计算其特征根及其特征向量,并由此再估计因子负荷及其各变量的共同度和特殊方差,再由此新估计的共同度为初始值继续迭代,直到解稳定为止。,因子载荷(负荷)aij是随机变量xi与公共因子fj的相关系数。 设 称gj2为公共因子fj对x的“贡献”,是衡量公共因子fj重要性的一个指标。,四、因子旋转,目的:使因子负荷两极分化,要么接近于0,要么接近于1。 常用的旋转方法:,(1)方差最大正交旋转(varimax orthogonal rotation) 基本思想:使公共因子的相对负荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。 可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。,(2)斜交旋转(oblique rotation) 因子斜交旋转后,各因子负荷发生了较大变化,出现了两极分化。各因子间不再相互独立,而彼此相关。各因子对各变量的贡献的总和也发生了改变。 适用于大数据集的因子分析。,五、因子得分,Thomson法,即回归法 回归法得分是由Bayes思想导出的,得到的因子得分是有偏的,但计算结果误差较小。,Bartlett法 Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。 因子得分可用于模型诊断,也可用作进一步分析的原始资料。,六、因子分析应用的注意事项,应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论