Chp因子分析实用_第1页
Chp因子分析实用_第2页
Chp因子分析实用_第3页
Chp因子分析实用_第4页
Chp因子分析实用_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学1Chp因子分析实用Chp.8因子分析8.1概述

固定资产利税率资金利税率销售收入利税率资金利税率固定资产产值率流动资金周转天数万元产值能耗全员劳动生产率观测变量盈利能力产值能耗资金和人力利用公共因子第1页/共51页Chp.8因子分析8.1概述

1.一个分类问题

在碳酸岩的分类研究中,用其中C、O、Ca、Mg、Si等元素的含量,而不考虑各元素相互间的内在联系,分类效果不好。

如果考虑元素间的内在联系,例如用CaCO3、MgCO3、SiO2三个因素来进行研究,则可取得很好的效果。

第2页/共51页Chp.8因子分析8.1概述

2.问题的延伸

①用三个组合比用5个元素研究碳酸岩合理,易于解释。②可以把C、O、Ca、Mg、Si看成原始变量,把CaCO3、MgCO3、SiO2看成是原始变量的组合,它们是新变量(公共因子),更反映事物的本质。③从多个变量(5个)减少为少数变量(3个)有利于研究。第3页/共51页Chp.8因子分析8.1概述

④新变量的组合可表示为:

Fj=βj1x1+βj2x2+…+βjpxp→

F1(CaCO3)=β11Ca+β12C+β13O+β14Mg+β15SiF2(MgCO3)=β21Ca+β22C+β23O+β24Mg+β25SiF3(SiO2)=β31Ca+β32C+β33O+β34Mg+β35Si⑤反过来,也可用三个组合表示原始变量,来研究组合与原始变量的关系:

Zj=aj1F1+aj2F2+…+ajmFm+αjUj

如对Si,可用Si=a51F1+a52F2+a53F3

第4页/共51页Chp.8因子分析8.1概述

⑥因子分析的任务,就是分析、表征事物的属性与其影响因素之间的数据结构和关系,达到简化问题、突出事物本质的目的。第5页/共51页Chp.8因子分析8.1概述

因子分析主要是由心理学家发展起来的,由ChalesSpearman于1904年提出,主要用于智力测验得分的统计分析。

1957年,Krumbein将因子分析方法从心理学研究引入岩石学,它是把一些具有复杂关系的样品或变量归结为少数几个综合因子,然后进行进一步的研究。目前因子分析在心理学、社会学、经济学、人口学、地质学和教育学中都取得了成功的应用。3.因子分析的基本思想第6页/共51页Chp.8因子分析8.1概述

从数学角度而言,因子分析是一种寻找潜在支配因子的模型分析方法,其实质就是一种降维的多元统计方法。其特点包括:3.因子分析的基本思想

①通过数学方法把数目较多的原始变量进行变换,找到一些新变量(组合);②新变量较原始变量数目少得多,且使原来复杂的关系相对简单化,有助于了解自然现象的规律,在变量多、数据量大时更具优点。③少数组合能尽量反映原来多变量的信息,它们又彼此正交,便于对变量进行分类解释。

第7页/共51页Chp.8因子分析8.1概述

有两种主要的分析方法:①R型因子分析:研究变量之间的相互关系,通过对变量间的相关系数阵的内部结构的研究,找出控制着所有变量的几个主成分,所以又称主成分分析(PrincipalComponentAnalysis)。②Q型因子分析:研究样品间的相关关系,通过对样品间的相似系数阵的内部结构的研究,找出控制着所有样品的几个主要因素,所以又称主因素分析。

4.因子分析的主要方法

第8页/共51页Chp.8因子分析8.1概述

①归纳综合地质现象,剔除原始观测值中重复的成分,用更简练的形式描述地质现象。②用于研究诸如成因、成岩、共生组合、指示元素等地质问题。5.因子分析的地质学用途

第9页/共51页Chp.8因子分析8.1概述

进行因子分析前,必须对数据进行初始化:6.进行因子分析的前提标准化后数据的均值为0,标准差为1。这时,变量j与k之间的相关系数为设原始数据为xji,j=1,…,n(变量),i=1,…,N(样品)标准化后的数据为:其中:第10页/共51页Chp.8因子分析8.2因子分析的基本原理

①设有N个样品,每个样品有n个变量(x1,…,xn),它们有m个综合因子,记为F1,F2,…,Fm(m<=n)1.主因子(主成分、主因素)的几何意义F1F2②为了方便,现设有两个变量x1,x2

对于二元正态分布变量,N个点的散布点大致为一椭圆,若在椭圆长轴方向取坐标F1,短轴方向取F2,相当于作了一个坐标变换(x1→F1,x2→F2)第11页/共51页Chp.8因子分析8.2因子分析的基本原理

变换后的坐标有如下性质:ⅰ)N个样品点的坐标F1,F2的相关性→0ⅱ)N个点的波动(方差)大部分可以归结为F1轴上的波动,而F2上波动趋近于0。ⅲ)F1,F2为x1,x2的综合因子

X1=a11F1+a12F2X2=a21F1+a22F21.主因子(主成分、主因素)的几何意义当图中椭圆很扁平时,可只考虑F1上的波动,忽略F2上的波动,这样,二维可以降为一维。第12页/共51页Chp.8因子分析8.2因子分析的基本原理

③把两个变量推广到n个变量(x1,x2,…,xn),将它们综合成m个综合因子时,则原始变量:

Zj=aj1F1+aj2F2+…+ajmFm+αjUj

而综合因子:

F1=β11x1+β12x2+…+β1nxnF2=β21x1+β22x2+…+β2nxn……………Fm=βm1x1+βm2x2+…+βmnxn

而且要求:βk12+βk22+…+βkn2=11.主因子(主成分、主因素)的几何意义第13页/共51页Chp.8因子分析8.2因子分析的基本原理

④确定上式中系数βij的原则

ⅰ)Fi与Fj(i≠j,j=1,2,…,m)互相无关(正交);

ⅱ)F1是x1,x2,…,xn的所有线性组合中方差最小的,即F1提取了最多的信息量,F2提取了次大信息量,F3再次之,…。

ⅲ)F1,F2,…,Fm称第1,2,…,m主因子,实际工作中只选前几个因子。1.主因子(主成分、主因素)的几何意义第14页/共51页Chp.8因子分析8.2因子分析的基本原理

①信息(或方差)的分解各变量的统计信息来源于方差,可以把n个变量提供的信息分解为:2.因子模型(因子分析的数学模型)1)由所有变量共同具有的少数几个因子构成的部分,即所谓公共因素部分—公共因子(m个,且m<=n);

2)每个变量独自具有的因素,即所谓独特因素部分—唯一因子。

因子分析的基本任务是将以上两部分分开。

第15页/共51页Chp.8因子分析8.2因子分析的基本原理

②n个变量的R型因子分析模型(主成分分析模型)将变量用若干个因子(公共因子、唯一因子)表示的模型,称为因子模型。

其中最简单的为线性模型,主成分分析中每一变量Zj由下列线性组合表示:

Z1=a11F1+a12F2+…+a1mFm+α1U1Z2=a21F1+a22F2+…+a2mFm+α2U2……………

…Zn=an1F1+an2F2+…+anmFm+αnUn2.因子模型(因子分析的数学模型)第16页/共51页Chp.8因子分析8.2因子分析的基本原理

③n个样品的Q型因子分析模型(主因素分析模型)

xi=ai1F1+ai2F2+…+aimFm+αiUi④向量Zj可以由m个互不相关的独立因子F1,F2,…,Fm和Uj表示,这个线性表示(一组线性方程)叫因子模型。2.因子模型(因子分析的数学模型)第17页/共51页Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的数学模型)⑤主成分分析因子模型中的符号意义

1)F1,F2,…,Fm表示m个公因子(commonfactor):它们之间线性无关,在几何上等同于m个相互垂直的参考矢量;2)U1,U2,…,Un为唯一因子或特殊因子(uniquefactor),只出现于一个变量中;3)aj1,aj2,…,ajm为公因子系数,称因子负荷(factorloading),它是变量Zj在公因子Fp(p=1,2,…,m)上的负荷,表示第j个变量在第p个主因子上的权,亦即该变量在第p主因子上的相对重要性;第18页/共51页Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的数学模型)⑤主成分分析因子模型中的符号意义

4)当我们把变量Zj看成是m维空间中的一个向量时,则因子负荷ajp(p=1,2,…,m)表示变量Zj在坐标轴Fp上的坐标;5)αj为唯一因子系数,下标j表示变量序号;

6)从几何角度看,找主因子就是在n维空间中寻找椭球体的主轴问题;从数学角度看,则是从n个变量x1,x2,…,xn的相关矩阵中找出p个较大特征值对应的特征向量。

第19页/共51页Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的数学模型)⑥因子模型的矩阵形式:Z=A•F+αU矩阵A:因子负荷阵,求解A阵是因子分析中关键的一步;矩阵Z:标准化后的观测值阵;矩阵F:公因子阵;矩阵U:唯一因子阵。第20页/共51页Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的数学模型)⑦因子模型的几点说明

1)在正交条件下,ajp就是第j个变量(j=1,2,…,n)与第n个公因子(p=1,2,…,m)的相关系数;2)一个变量Zj的总方差由三部分组成:

a)公因子方差(hj2):全部公因子(F1,…,Fm)对变量Zj的总方差所作的贡献;

b)误差因子方差(cj2);c)特殊因子方差(bj2);由于标准化后的方差为1,故有:hj2+bj2+cj2=1

第21页/共51页Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的数学模型)⑦因子模型的几点说明

3)可以证明:即公因子方差为因子负荷阵A中各行元素的平方和;a)当hj2=1时,说明该变量的全部原始信息被所选的因子说明了;

b)当hj2=0.8时,说明该变量80%的原始信息被所选的因子说明了。第22页/共51页Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的数学模型)⑦因子模型的几点说明

4)因子负荷矩阵A中各列元素的平方和称为公因子Fp的方差贡献。

Sp表示:同一公因子Fp对诸变量所提供的方差的总和,它是衡量公因子相对重要性的标志;第23页/共51页Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的数学模型)⑦因子模型的几点说明

5)对一个因子模型的解释

a)F1反映了Cu、Ag矿化;

b)F2反映了Ni、Co矿化(另一期矿化);

c)Cu的hj2=0.942+0.022+(-0.02)2=0.884,说明三个公因子说明了Cu变差的88.4%;

d)

公因子方差hj2的分析为选择公共因子数提供了依据,一般hj2≥80%即可认为所选因子数对变量Zj已满足,否则再补加公因子,如Ag的hj2=0.3245,显然不够(对于Ag三个公因子不够)。第24页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

1.概述①A阵是对观测变量的相关矩阵R分解的结果;②公因子的计算过程为:求相关矩阵的特征值和特征向量,求得特征值(为求Fp)及特征向量(为求ajp)即可完成A阵。第25页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

2.主成分的主要性质(R型)①矩阵A第j行的因子负荷平方之和等于第j个变量的hj2;

②因子负荷等于相关阵的特征向量αjp乘以对应的特征值λp的平方根,它表示Zj与Fp的相关程度;③第p个公因子的因子负荷的平方之和等于该公因子对应的特征值λp:第26页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

2.主成分的主要性质(R型)④R阵全部特征值之和等于阶数;⑤对于全部n个变量,若第t个因子的ajt与第s个因子的ajs的乘积之和等于0,说明因子t与s正交。第27页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法①计算相关矩阵(以5个样,3个变量为例)首先,对原始数据进行标准化:第28页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法①计算相关矩阵其次,计算相关系数:例如:=0.916第29页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法②求特征值及特征向量1)R的特征方程为:|R-λi|=0,即:解此方程得:

λ1=2.87,λ2=0.128,λ3=0.002说明:λ1+λ2+λ3=3,等于变量个数。第30页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法②求特征值及特征向量2)计算特征向量,通过下列矩阵方程求出:

RX-λX=0X即为特征向量

将λ1=2.87代入,解得:

X1λ1=0.586,X2λ1=0.564,X3λ1=0.581同样,求得:X1λ2=0.317,X2λ2=-0.820,X3λ2=0.476由于λ3=0.002太小,从略。第31页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法②求特征值及特征向量3)按一定的标准选取特征值变量Zj,它所涉及的公因子个数称为该变量的“复杂性”;选取合理的公因子个数,关键在于合理选其公因子方差hj2;选取的原则是:

a)根据特征值在特征值总数中所占的比例,比值越大,说明变化性越多,一般取0.8~0.9,在本题中,∑λi=3,(λ1+λ2)/∑λi=(2.87+0.128)/3≈100%,即选两个Fp即可;

b)另一种方法:选取特征值λi>1的即可。

第32页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法②求特征值及特征向量4)计算因子负荷αjp为第p个特征值对应的第j个特征向量对应λ1=2.87:

对应λ2=0.128:于是,初始因子矩阵第33页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法②求特征值及特征向量5)公因子方差

h12=a112+a122=0.9932+0.1122=0.999h22=0.998h32=0.9976)公因子Fp的方差贡献

S1=0.9932+0.9552+0.9842=2.87=λ1S2=0.1132+(-0.293)2+0.1702=0.128=λ2第34页/共51页Chp.8因子分析8.3初始因子矩阵及其计算方法

3.求初始因子阵A的方法②求特征值及特征向量7)给出正交因子模型FpajiXjF1F2hj2X10.9930.1130.999X20.955-0.2930.998X30.9840.1700.997Sp2.870.128

第35页/共51页Chp.8因子分析8.4因子旋转1.概述

建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。

如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,以便得到比较满意的主因子。第36页/共51页Chp.8因子分析8.4因子旋转1.概述

进行因子旋转,就是要使因子载荷矩阵中因子载荷向0和1两个方向分化,使大的载荷更大,小的载荷更小。

如有两个变量x1,x2,在F1,F2上的投影值相似,当把F1,F2旋转为FⅠ,FⅡ后,就变得清晰了。第37页/共51页Chp.8因子分析8.4因子旋转1.概述

因子旋转过程中,如果因子对应轴相互正交,则称为正交旋转;

旋转的方法有很多,正交旋转(orthogonalrotation)和斜交旋转(obliquerotation)是因子旋转的两类方法。最常用的方法是最大方差正交旋转法(Varimax)。

如果因子对应轴相互间不是正交的,则称为斜交旋转。

常用的斜交旋转方法有Promax法等。第38页/共51页Chp.8因子分析8.4因子旋转2.判断因子解好坏的Thurstone简单结构准则①每一因子Fp仅有少数研究对象(变量、样品)在它上面有高值(或集中分布);②任一研究对象(变量、样品)只能在极少数因子上有高值(不计正负)。即:每一变量尽可能只与一个因子有关,因子负荷ajp尽可能趋于0、+1、-1。第39页/共51页Chp.8因子分析8.4因子旋转3.简单示例

煤炭中除常量元素外,还含有多种潜在毒害元素,如Hg、Se、Pb、Cd、As、Zn、Sb和Ti等。煤在燃烧过程中,这些元素呈气态或吸附在烟气中细小颗粒物中呈气溶胶态,并能通过各种烟气污染控制设施而释放到大气环境中,成为大气环境的主要污染源。为了了解和有效地控制煤炭使用过程引起的这些潜在毒害元素的环境污染程度,不仅要弄清煤中这些元素的分布规律,更重要的是要弄清这些元素在煤中的赋存状态。

第40页/共51页Chp.8因子分析8.4因子旋转3.简单示例

只有As、Fe比较理想!第41页/共51页Chp.8因子分析8.4因子旋转3.简单示例

对比:

旋转前:初始因子解难以对各因子作出合理的解释。旋转后:

F1中As、Hg、Sb、Fe、S等有高的因子载荷;

F2与Se和Zn有较大的相关性;

F3中Cd有较高的因子载荷;

F4中只有Pb有较高的因子载荷;

F5只与Ti相关。第42页/共51页Chp.8因子分析8.4因子旋转3.简单示例

煤层中As、Hg、Sb、Fe主要赋存于次生黄铁矿中;

Zn和Se主要赋存于闪锌矿中;

Pb以方铅矿形式存在于煤中;从元素地球化学性质上讲,Cd应赋存于闪锌矿中,但由于其在煤中的含量较低,造成分析数据的误差较大,从而掩盖了它与Zn之间的相关关系;煤中Ti的赋存状态较为复杂。第43页/共51页Chp.8因子分析8.5因子计量(FactorScore)1.计量的目的

因子分析有两大任务:①将变量表示为公因子的线性组合(因子解)

Zj=aj1F1+aj2F2+…+ajmFm因子模型建立后,一个重要的作用是应用它去评价每个样品在整个模型中的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论