主成分分析与因子分析的主要方法和思想_第1页
主成分分析与因子分析的主要方法和思想_第2页
主成分分析与因子分析的主要方法和思想_第3页
主成分分析与因子分析的主要方法和思想_第4页
主成分分析与因子分析的主要方法和思想_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 10分数据中央化和标准化在回归分析中的意义是什么?在多元线性回归分析中,由于涉及多个自变量,自变量的单位往往不同,会给分析带来一 定的困难,又由于涉及的数据量很大,就可能会以舍入误差而使得计算结果不理想.1 .中央化处理后可以减少一个未知参数,减少了计算的工作量,对手工计算尤为重要.2 .标准化处理后有利于消除量纲不同和数量级的差异所带来的影响,防止不必要的误差.2. 10分在实际问题中运用多元线性回归应注意哪些问题?在实际问题中,人们用复相关系数 R来表示回归方程对原有数据拟合程度的好坏 ,但是拟 合优度并不是检验模型优劣的唯一标准 ,有时为了使模型从结构上有较合理的经济解释,R2等于

2、0.7左右也给回归模型以肯定的态度 .在多元线性回归分析中,我们并不看重简单相关系数,而认为偏相关系数才是真正反映因 变量y与自变量Xi以及自变量Xi与xj的相关性的数量.用相关系数R2大小来衡量模型的拟合优度,不能仅由R2值很大来推断模型优劣.在实际应用回归方程进行限制和预测时,给定的X0值不能偏离样本均值太大,如果太大,用回归方程无论是作因素分析还是经济预测,效果都不会理想.得到实际问题的经验回归方程后,还不能马上用它去作分析和预测,还需运用统计方法对 回归方程进行检验.3. 15分主成分分析与因子分析的主要方法和思想是什么?两者有何联系与区别?求解主成分的方法:从协方差阵出发协方差阵,从

3、相关阵出发相关阵R,采用的方法只有主成分法.一、主成分分析的根本思想在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其开展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也称为变量.这样就产可编辑生了如下问题:一方面人们为了防止遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考虑指标的增多增加了问题的复杂性,同时由于各指标均是对同一事物的反映,不可防止地造成信息的大量重叠, 这种信息的重叠有时甚至会抹杀事物的真正特征与内在规律.基于上述问题,人们就希望在定量研究中涉及的变量较少,而得到的信息量又较多. 主成分分析正是研究如何通过原来变量的少数几个线性组合来解释原

4、来变量绝大多数信息的一种多元统计方法.既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标主成分,在保存原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾.一般地说,利用主成分分析得到的主成分与原始变量之间有如下根本关系:1,每一个主成分都是各原始变量的线性组合;2.主成分的数目大大少于原始变量的数目3,主成分保存了原始变量绝大多数信息4.各主成分之间互不相关通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,

5、从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系, 得到对事物特征及其开展规律的一些深层次的启发,把研究工作引向深入.因子分析方法:求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法.因子分析的根本思想可编辑使得同组内的变量之间相因子分析的根本思想是根据相关性大小把原始变量分组,关性较高,而不同组的变量间的相关性那么较低.每组变量代表一个根本结构, 并用一个不可观测的综合变量表示,这个根本结构就称为公共因子.对于所研究的某一具体问题,原始变 量就可以分解成两局部之和的形式,一局部是少数几个不可测的所谓公共因子的线性函数, 另一局部是与公共因子无关的特殊

6、因子.在经济统计中,描述一种经济现象的指标可以有很多,比方要反映物价的变动情况,对各种商品的价格做全面调查固然可以到达目的,但这样做显然耗时耗力,为实际工作者所不取.两者的联系主成分分析和因子分析方法都属于多元统计分析中处理降维的统计方法.在数理统计的根本原理上,两者都是基于多变量的相关系数矩阵,在保证较少信息缺失的前提下一般小于或等于15%,用少数几个不相关综合变量概括多个变量的信息多个变量之间存在较强的相关性.即用少数不相关的综合变量尽可能全面的反映多个原始变量的信息,消除了原始变 量的相关性,可信度得到提升,统计结果可以有效地解释现实问题.需要注意的是,两种方法产生的新的变量因子不是原始

7、变量筛选后的剩余变量,而是综合所有变量信息后的新变量.其中,在主成分分析过程中,新变量是原始变量的线性组合,即将多个原始变量经过线性坐标变换得到新的变量.在因子分析过程中,新变量那么是通过原始变量之间的复杂 关系对原始变量进行分解,得到公共因子和特殊因子.其中公共因子是所有原始变量中所共 同具有的特征,而特殊因子那么是原始变量所特有的局部.两种方法下得到的主成分变量与因子变量在数量上显著少于原始变量,起到了降维的作用,也提升了数据有效利用程度.主成分分析与因子分析的区别老师的版本可编辑1、因子分析把展示在我们面前的诸多变量看成由对每一个变量都有作用的一些公共因子和一些仅对某一个变量有作用的特殊

8、因子线性组合而成.因此,我们的目的就是要从数据中探查能对变量起解释作用的公共因子和特殊特殊因子,以及公共因子和特殊因子组合系数.主成分分析那么简单一些,它只是从空间生成的角度寻找能解释诸多变量变异绝大局部的几组彼 此不相关的新变量主成分.2、因子分析中是把变量表示成各因子的线性组合,而主成分分析中那么是把主成分表示成各 变量的线性组合.3、主成分分析中不需要有假设,因子分析那么需要一些假设.因子分析的假设包括:各个公共因子之间不相关,特殊因子 specific factor 之间也不相关,公共因子和特殊因子之 间也不相关.4、抽取主因子的方法不仅仅有主成分法,还有极大似然法等,基于这些不同算法

9、得到的结果一般也不同.而主成分只能用主成分法抽取.5、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是固定的;而因子分析中因子不是固定的,可以旋转得到不同的因子.6、在因子分析中,因子个数需要分析者指定 spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析,指定的因子数量不同而结果不同.在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分.7、和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势.而如果想把现有的变量变成少数几个新的变量新的变量几乎带有原来所有变量的信息来进入后续的分析, 那么可以使用主成分分析.

10、当然,这中情况也可以使用因子得分做到.所以这种区分不是绝对的.网上的版本可编辑1 .原理不同主成分分析根本原理:利用降维线性变换的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标主成分,即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能主成分必须保存原始变量90%以上的信息,从而到达简化系统结构,抓住问题实质的目的.因子分析根本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成.就是要从数据中提取对变量起解释作用的少数公共

11、因子因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系2 .线性表示方向不同因子分析是把变量表示成各公因子的线性组合;而主成分分析中那么是把主成分表示成各变量的线性组合.3 .假设条件不同主成分分析:不需要有假设 assumptions,因子分析:需要一些假设.因子分析的假设包括:各个共同因子之间不相关,特殊因子specificfactor 之间也不相关,共同因子和特殊因子之间也不相关.4 .求解方法不同求解主成分的方法:从协方差阵出发协方差阵,从相关阵出发相关阵R,可编辑采用的方法只有主成分法.实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计考前须知

12、:由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;一般当变量单位相同或者变量在同一数量等级的情况下,可以直接采用协方差阵进行计算;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分; 实际应用中应该尽可能的防止标准化,由于在标准化的过程中会抹杀一局部原本刻画变量之间离散程度差异的信息.此外,最理想的情况是主成分分析前的变量之间相关性高,且变量之间不存在多重共线性问题会出现最小特征根接近 0的情况;求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法.5 .主成分和因子的变化不同主成分分析:当

13、给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的;因子分析:因子不是固定的,可以旋转得到不同的因子.6 .因子数量与主成分的数量主成分分析:主成分的数量是一定的,一般有几个变量就有几个主成分只是主成分所解释的信息量不等,实际应用时会根据碎石图提取前几个主要的主成分.因子分析:因子个数需要分析者指定SPSS和sas根据一定的条件自动设定,只要是特征可编辑值大于1的因子主可进入分析,指定的因子数量不同而结果也不同;7 .解释重点不同:主成分分析:重点在于解释个变量的总方差,因子分析:那么把重点放在解释各变量之间的协方差.8 .算法上的不同:主成分分析:协方差矩阵的对角元素是变量

14、的方差;因子分析:所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度变量方差中被各因子所解释的局部9 .优点不同:因子分析:对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势; 其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;主成分分析:第一:如果仅仅想把现有的变量变成少数几个新的变量新的变量几乎带有原来所有变量的信息来进入后续的分析,那么可以使用主成分分析,不过一般情况下也可以使用因子分析;第二:通过计算综合主成分函数得分,对客观经济现象进行科学评价;第三:它在应用上侧重于信息

15、奉献影响力综合评价.可编辑其技术来源是矩阵运算的技第四:应用范围广,主成分分析不要求数据来自正态分布总体,术以及矩阵对角化和矩阵的谱分解技术,因而但凡涉及多维度问题, 都可以应用主成分降维;10 .应用场景不同:主成分分析:可以用于系统运营状态做出评估,一般是将多个指标综合成一个变量,即将多维问题降维至一维,这样才能方便排序评估;此外还可以应用于经济效益、经济开展水平、经济开展竞争力、生活水平、生活质量的评价研究上;主成分还可以用于和回归分析相结合,进行主成分回归分析,甚至可以利用主成分分析进行挑选变量,选择少数变量再进行进一步的研究.一般情况下主成分用于探索性分析,很少单独使用,用主成分来分析数据,可以让我们对数据有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论