中国传媒大学-市场调查与预测-课件-第十一章主成分分析与因子分析_第1页
中国传媒大学-市场调查与预测-课件-第十一章主成分分析与因子分析_第2页
中国传媒大学-市场调查与预测-课件-第十一章主成分分析与因子分析_第3页
中国传媒大学-市场调查与预测-课件-第十一章主成分分析与因子分析_第4页
中国传媒大学-市场调查与预测-课件-第十一章主成分分析与因子分析_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【本章学习目的】 通过对本章的学习理解主成分分析的基本理论;掌握用 SPSS 软件求解主成分的方法; 了解因子分析的基本理论;掌握求解因子的方法步骤;能够用 SPSS 软件进行因子分析, 并能正确理解系统输出结果。 第十一章 主成分分析与因子分析第一节 主成分分析与因子分析概述 第二节 主成分分析与因子分析的统计原理 第三节 主成分分析与因子分析实例主要内容第一节主成分分析与因子分析概述 问题发现:在对某一事物进行实证研究时,为了更全面、准确地反映事物的特征及其发展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也称为变量。这样就产生了如下问题:一方面人们为了避免遗漏重要的信息而

2、考虑尽可能多的指标,另一方面考虑指标的增多增加了问题的复杂性,同时由于各指标均是对同事物的反映,不可避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹杀事物的真正特征与内在规律。主成分分析正是研究如何通过原来变量的少数几个线性组合来解释原来变量绝大多数信息的一种多元统计方法。一、主成分分析的基本思想第一节主成分分析与因子分析概述 主成分:通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。主成分与原始变量之间有如下基本关系:1.每个主成分都是各原

3、始变量的线性组合;2.主成分的数目大大少于原始变量的数目;3.主成分保留了原始变量绝大多数信息;4.各主成分之间互不相关。一、主成分分析的基本思想第一节主成分分析与因子分析概述 问题发现:人们在研究实际问题时,往往希望尽可能多地收集相关变量,以期望对问题有比较全面、完整的把握和认识。例如,企业综合评价研究中,可能会收集诸如盈利能力、负债能力、运营能力等方面的经济指标数据。这些数据在带来有关信息的同时,也给数据的分析带来了一定的困难:这众多的变量之间可能存在着或多或少的相关性,实际观测到的数据包含的信息有一部分可能是重复的。因子分析:在尽可能不损失信息或者少损失信息的情况下,将多个变量减少为少数

4、几个因子的方法。这几个因子可以高度概括大量数据中的信息,这样,既减少了变量个数,又同样能再现变量之间的内在联系。二、因子分析的基本思想第一节主成分分析与因子分析概述 主成分分析(principal component analysis, PCA)是把原来多个变量转换为少数几个综合指标的一种统计分析方法。因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想因子来表示其基本的数据结构。主成分分析不要求明确的理论指导,属于探索性工具;而因子分析常常是在有明确理论指导或明确假设时对理论进行验证,故属于验证性工具

5、。三、主成分分析与因子分析的概念第二节主成分分析与因子分析的的基本原理一、主成分分析的统计原理 主成分分析的本质是坐标的旋转变换,将原始的 n 个变量进行重新的线性组合,生成 n 个新的变量,它们之间互不相关,称为 n 个“成 分”。同时按照方差最大化的原则,保证第一个 成分的方差最大,然后依次递减。这 n 个成分是 按照方差从大到小排列的,其中前 m 个成分可能 就包含了原始变量的大部分方差(及变异信息)。 那么这 m 个成分就成为原始变量的“主成分”, 它们包含了原始变量的大部分信息。 注意:得到的主成分不是原始变量筛选后的 剩余变量,而是原始变量经过重新组合后的“综 合变量”。第二节主成

6、分分析与因子分析的的基本原理案例:用最简单的二维数据来直观的解释主成分分析的原理。假设现在有两个变量X1、X2,在坐标上画出散点图如下:可见,x1、x2之间存在相关关系,如果我们将坐标轴整体逆时针旋转45度,变成新的坐标系Y1、Y2。第二节主成分分析与因子分析的的基本原理案例:根据坐标变化的原理,我们可以算出:Y1=sqrt(2)/2* X1+sqrt(2)/2* X2Y2=sqrt(2)/2* X1-sqrt(2)/2* X2其中sqrt(x)为x的平方根。通过对X1、X2的重新进行线性组合,得到了两个新的变量Y1、Y2。此时,Y1、Y2变得不再相关,而且Y1方向变异(方差)较大,Y2方向的

7、变异(方差)较小,这时我们可以提取Y1作为X1、X2的主成分,参与后续的统计分析,因为它携带了原始变量的大部分信息。至此我们解决了两个问题:降维和消除共线性。对于二维以上的数据,就不能用上面的几何图形直观的表示了,只能通过矩阵变换求解,但是本质思想是一样的。第二节主成分分析与因袭分析的的基本原理二、因子分析的统计原理 原理:对原始变量间的内在相关结构进行分组,相关性强的分在一组, 组间相关性较弱,各组变量代表一个基本要素(公共因子)。通过原始变量之间的复 杂关系分解原始变量,得到公共因子和特殊因子。原始变量被表示成公共因子的线性组合。 其中公共因子是所有原始变量所共同具有的特征,而特殊因子则是

8、原始变量所特有的部分。因子分析强调对新变量(因子)的实际意义的解释。因子分析的过程:(1)确认待分析的原变量是否适合做因子分析;(2)构造因子变量;(3)利用旋转方法使因子变量更具有可解释性;(4)计算因子变量得分。第二节主成分分析与因子分析的的基本原理三、主成分分析与因子分析的联系与区别 (一)联系 两者都是降维和信息浓缩的方法。生成的新变量均代表了原始变量的大部分信息且互 相独立,都可以用于后续的回归分析、判别分析、聚类分析等。(二)区别 (1)主成分分析是按照方差最大化的方法生成的新变量,强调新变量贡献了多大比 例的方差,不关心新变量是否有明确的实际意义; (2)因子分析着重要求新变量具

9、有实际意义,能解释原始变量间的内在结构。第三节主成分分析与因子分析实例一、主成分分析实例SPSS没有提供单独的主成分分析方法,而是混在因子分析当中,下面通过一个例子来讨论主成分分析与因子分析的实现方法及相关问题。案例:某市为全面分析机械类企业的经济效益,选择了8个不同的利润指标,14家企业关于这8个指标的统计数据如下表所示,试进行主成分分析。企业序号净资产利润率(%)Xi1固定资产利润率(%)Xi2总资产利润率(%)Xi3销售收入利润率(%)Xi4产品成本利润率(%)Xi5物耗利润率(%)Xi6人均利润率(千元/人)(%)Xi7流动资金利润率(%)Xi812345678910111213144

10、0.425.013.222.334.335.622.048.440.624.812.51.832.338.524.712.73.36.711.812.57.813.419.18.09.70.613.99.17.211.23.95.67.116.49.910.919.89.84.20.79.411.36.111.04.33.77.116.710.29.919.08.94.20.78.39.58.312.94.46.08.022.812.610.929.711.94.60.89.812.28.720.25.57.48.929.317.613.939.616.26.51.113.316.42.4423.5420.5780.1761.7263.0170.8471.7722.4490.7890.8740.0562.1261.32720.09.13.67.327.526.610.617.835.813.73.91.017.111.6第三节主成分分析与因子分析实例第三节主成分分析与因子分析实例二、因子分析实例在企业经济效益的评价中,设计的指标往往很多。为了简化系统结构,抓住经济效益评 价中的主要问题,我们可由原始数据矩阵出发求主成分。我国部分省、直辖市、自治区独立 核算的工业企业的经济效益的评价中,涉及 9 项指标,即样品数 n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论