主成分与因子分析教材课件_第1页
主成分与因子分析教材课件_第2页
主成分与因子分析教材课件_第3页
主成分与因子分析教材课件_第4页
主成分与因子分析教材课件_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计分析方法1统计分析方法1主成分分析与因子分析2主成分分析与因子分析2第一部分主成分分析3第一部分主成分分析3我们经常遇到有很多变量的数据。在如此多的变量之中,有很多是相关的。人们希望能够找出它们的少数“代表”(综合指标)来对它们进行描述。4我们经常遇到有很多变量的数据。4下面介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principal component analysis)和因子分析(factor analysis)。5下面介绍两种把变量维数降低以便于描述、理解和分析的方法:主成主成分法的基本思想考虑二维情形,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值

2、都有相应于这两个坐标轴的两个坐标值;这些数据大致分布于一个椭圆形的区域中,如下图所示:6主成分法的基本思想考虑二维情形,即只有两个变量,它们由横坐标77这个椭圆有一个长轴和一个短轴。在短轴方向上,数据变化很少;在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点的变化了;这样,由二维到一维的降维就自然完成了。8这个椭圆有一个长轴和一个短轴。8如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的两个变量(舍去次要的一维),降维就完成了。椭圆(球)的长短轴相差得越大,降维效果越好。9如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的主成分法的数学模型10主成分法的

3、数学模型10对原变量x1,x2等变换为y1,y2, y3等使得y1方差最大,y2次之等等;y1,y2,y3等相互独立。11对原变量x1,x2等变换为y1,y2, y3等使得11可以写成向量形式:y1=a x问题:在a a=1的条件下,求a使y1方差最大: D(y1)= aD( x) a其中: D( x)为x的方差协方差矩阵。当x为标准化后的变量向量,则D(x)为相关系数矩阵R。 y1的方差为:D(y1)= aR a 12可以写成向量形式:12实际使用过程中,先将变量标准化运用拉格朗日乘子法求约束条件下的极值:令 得:可见:a为R的特征向量,为R的特征值。此时, D(y1)= aRa= aa=

4、a a=于是:第一主成分y1的方差为最大特征值。13实际使用过程中,先将变量标准化可见:a为R的特征向量,为R结论(以y1为例)原变量相关系数矩阵的最大特征值即为y1的方差,原变量相关系数矩阵的最大特征值对应的特征向量。14结论(以y1为例)14第二部分因子分析15第二部分因子分析15一、因子分析的作用因子分析的作用主要有两个:1.数据简化可为进一步应用其他统计方法(如相关分析、回归方法、判别分析法等)提供便利条件。2.寻求变量的基本结构16一、因子分析的作用16二、因子分析的基本步骤1.计算所有变量的相关矩阵,根据计算结果判断应用因子分析方法是否合适。如果各变量独立性较强,则不适合。2.提取

5、因子。该步要确定求因子解的方法,和提取因子的个数。3.进行因子旋转,对旋转后的新因子作出实际意义解释。4.计算因子值。即每个Case的各因子值(称为因子得分值)17二、因子分析的基本步骤1.计算所有变量的相关矩阵,根据计算结三、因子分析法的基本操作Analyze Data Reduction Factor 打开Factor Analysis对话框将参与因子分析的变量依次选入Variables框中 分别对“Extraction”, “Rotation”, “Scores” 等项进行设置.单击“OK”即可18三、因子分析法的基本操作Analyze18“Extraction”对话框选项Method:

6、Principal components (主成分分析,系统默认)Unweighted least square (普通最小二乘法)Generalized least squares (广义最小二乘法)Maximum likelihood (最大似然法)Principal Axis factoring (主轴因子法)Alpha (因子提取法)Image (映像分析法)19“Extraction”对话框选项Method:19Extract:决定提取因子的个数Eigenvalue over: 指定要提取因子的最小特征值,系统默认值为1Number of factors:直接指定提取的因子个数。20

7、Extract:决定提取因子的个数20Display:指定与初始因子有关的输出项Unrotated factor solution:显示未旋转的因子解Scree plot:显示碎石图,用于决定因子提取个数。21Display:指定与初始因子有关的输出项21“Rotation”对话框选项Method:选择因子旋转方法None(不进行旋转)Varimax (方差最大法)Equamax (等量最大法)Quartimax (四次方最大法)Direct Oblimin (斜交旋转)22“Rotation”对话框选项Method:选择因子旋转方法Display:指定输出选项Rotated solution

8、:显示旋转后的因子解Loading plots:显示因子载荷图23Display:指定输出选项23“Scores”对话框选项Method:指定计算因子值方法Regression:回归法Bartlett:巴特利特法Anderson-Rubin:安德森鲁宾法24“Scores”对话框选项Method:指定计算因子值方法2Save as variables:将因子值作为新变量保存在数据文件中。25Save as variables:将因子值作为新变量保存在例1对公司业绩评价,选取了11个指标。(详见“因子分析”数据文件)本例目的:将11个指标进行简化综合26例1对公司业绩评价,选取了11个指标。26

9、2727全部有关变量28全部有关变量28判断“是否适合作因子分析”请进行以下操作.29判断“是否适合作因子分析”2930303131输出“碎石图” 请作以下操作.32输出“碎石图”3233333434进行因子旋转(一般都需要)否则所得因子无法命名(缺乏实际经济意义)操作.35进行因子旋转(一般都需要)353636该选项(方差最大法)最常用37该选项(方差最大法)最常用37计算因子得分操作.38计算因子得分3839394040要求因子载荷系数按大小顺序排列操作.41要求因子载荷系数按大小顺序排列41424243434444输出结果:相关系数矩阵用于判断是否作因子分析如果存在大量的接近零的相关系数

10、,则不适合作因子分析。45输出结果:相关系数矩阵45KMO指标大于0.7时,适合作因子分析。 0.6以上,作因子分析还可以 0.6以上,不太适合作因子分析Bartlett 球度检验显著时(P-值较低),则表明适合作因子分析。46KMO指标大于0.7时,适合作因子分析。46共同度表明将11个变量简化为3个因子后,对X1变量的解释能力为86.2%,对X2的解释能力为76.3%,等等。47共同度47特征值及方差贡献率和累计方差贡献率旋转前,第1个因子对原11个变量的解释能力为39.35%旋转前,前3个因子对原11个变量的解释能力为86.50%旋转后,前3个因子对原11个变量的解释能力为86.50%4

11、8特征值及方差贡献率和累计方差贡献率48该图用于分析提取几个公因子较为适当。方法:保留下降速度较快特征值对应的因子。49该图用于分析提取几个公因子较为适当。495050 总资产收益率=0.981F1 0.015F2 +0.019F3 净资产收益率=0.976F1 0.013F2 +0.028F3 营业收益率=0.973F1 0.035F2 +0.047F3 . 旋转后的因子载荷的含义(以前三行为例)51 总资产收益率=0.981F1 0.015F因子载荷系数的含义以前述第一个式子为例: 总资产收益率=0.981F1 0.015F2 +0.019F3 总资产收益率与F1 (因子1)的相关系数为0

12、.981总资产收益率与F2 (因子2)的相关系数为-0.015总资产收益率与F3 (因子3)的相关系数为0.01952因子载荷系数的含义以前述第一个式子为例:52因子的命名知道了因子载荷的含义后,我们就可以发现各因子的实际经济意义,并据此对各因子进行命名。53因子的命名知道了因子载荷的含义后,我们就可以发现各因子的实际对因子1(F1)的命名 总资产收益率= 0.981F1 0.015F2 + 0.019F3 净资产收益率= 0.976F1 0.013F2 + 0.028F3 营业收益率= 0.973F1 0.035F2 + 0.047F3 净利润= 0.873F1 0.012F2 + 0.03

13、2F3 净利润率= 0.747F1 0.035F2 + 0.183F3主营业务收入增长率= 0.058F1 + 0.987F2 + 0.183F3 固定资产增长率= 0.058F1 + 0.986F2 + 0.012F3 总资产增长率= 0.055F1 + 0.986F2 + 0.005F3 税后利润增长率= 0.062F1 + 0.809F2 + 0.145F3 主营业务收入= 0.032F1 + 0.124F2 + 0.919F3 净资产= 0.147F1 + 0.004F2 + 0.895F354对因子1(F1)的命名 总资产收益率=对因子1(F1)的命名 总资产收益率= 0.981F1

14、 0.015F2 + 0.019F3 净资产收益率= 0.976F1 0.013F2 + 0.028F3 营业收益率= 0.973F1 0.035F2 + 0.047F3 净利润= 0.873F1 0.012F2 + 0.032F3 净利润率= 0.747F1 0.035F2 + 0.183F3主营业务收入增长率= 0.058F1 +0.987F2 + 0.183F3 固定资产增长率= 0.058F1 + 0.986F2 + 0.012F3 总资产增长率= 0.055F1 + 0.986F2 + 0.005F3 税后利润增长率= 0.062F1 + 0.809F2 + 0.145F3 主营业务

15、收入= 0.032F1 + 0.124F2 + 0.919F3 净资产= 0.147F1 + 0.004F2 + 0.895F3与因子1相关的指标有:总资产收益率净资产收益率营业收益率净利润净利润率这些指标都属于盈利能力指标,由此可知,因子1反映盈利能力,因此因子1可以命名为“盈利能力因子”55对因子1(F1)的命名 总资产收益率= 对因子2(F2)的命名 总资产收益率= 0.981F1 0.015F2 + 0.019F3 净资产收益率= 0.976F1 0.013F2 + 0.028F3 营业收益率= 0.973F1 0.035F2 + 0.047F3 净利润= 0.873F1 0.012F

16、2 + 0.032F3 净利润率= 0.747F1 0.035F2 + 0.183F3 主营业务收入增长率= 0.058F1 + 0.987F2 + 0.183F3 固定资产增长率= 0.058F1 + 0.986F2 + 0.012F3 总资产增长率= 0.055F1 + 0.986F2 + 0.005F3 税后利润增长率= 0.062F1 + 0.809F2 + 0.145F3 主营业务收入= 0.032F1 + 0.124F2 + 0.919F3 净资产= 0.147F1 + 0.004F2 + 0.895F3与因子2相关的指标有:主营业务收入增长率、固定资产增长率总资产增长率、税后利润

17、增长率这些指标都属于“成长性”指标,由此可知,因子2反映“成长性”,因此因子2可以命名为“成长性因子”56对因子2(F2)的命名 总资产收益率=对因子3(F3)的命名 总资产收益率= 0.981F1 0.015F2 + 0.019F3 净资产收益率= 0.976F1 0.013F2 + 0.028F3 营业收益率= 0.973F1 0.035F2 + 0.047F3 净利润= 0.873F1 0.012F2 + 0.032F3 净利润率= 0.747F1 0.035F2 + 0.183F3主营业务收入增长率= 0.058F1 + 0.987F2 + 0.183F3 固定资产增长率= 0.058

18、F1 + 0.986F2 + 0.012F3 总资产增长率= 0.055F1 + 0.986F2 + 0.005F3 税后利润增长率= 0.062F1 + 0.809F2 + 0.145F3 主营业务收入= 0.032F1 + 0.124F2 + 0.919F3 净资产= 0.147F1 + 0.004F2 + 0.895F3与因子2相关的指标有:主营业务收入、净资产这些指标都属于“公司规模”指标,由此可知,因子3反映“公司规模”,因此因子3可以命名为“公司规模因子”57对因子3(F3)的命名 总资产收益率=因子命名(总结)因子1:盈利能力因子因子2:成长性因子因子3:公司规模因子58因子命名

19、(总结)因子1:因子2:因子3:58对公司业绩衡量的原指标(11个)现在可以用三个新的业绩综合指标盈利能力(F1)、成长性(F2) 、公司规模(F3)表示。原来的11个指标可以舍弃各公司上述三个综合指标值(称为因子得分)以在原始数据文件中(见下页)。至此,因子分析以达到“浓缩数据”或“精简变量”的目的。59对公司业绩衡量的原指标(11个)59因子得分(部分数据)60因子得分(部分数据)60例2:运用因子分析建立综合评价模型运用上例数据61例2:运用因子分析建立综合评价模型运用上例数据61基本操作同前与上例有所不同之处:计算因子得分 操作增加以下选项.62基本操作同前6263636464输出结果

20、:与上例相比增加了因子得分系数矩阵:65输出结果:65F1= -0.049主营业务收入0.211 净利润 0.021净资产 0.234营业收益率0.236净资产收益率 0.238总资产收益率0.17净利润率 0.005总资产增长率0.004主营营业收入增长率 0.021税后利润增长率 0.004固定资产增长率同样可以写出F2和F3的表达式66F1= -0.049主营业务收入0.211 净利润 0建立总业绩评价指标利用上例结论,我们将原来的11个业绩评价指标简化为三个综合业绩指标: 盈利能力F1、成长性F2 、公司规模F3下面,我们通过对这三个综合指标进行加权平均,得到业绩评价总指标S。基本思路

21、,确定各综合指标的权重W1 、 W2 、 W3 ,用于反映F1 、F2 、F3的重要程度。继而得到业绩评价的总指标 S= W1*F1+ W2*F2+ W3*F367建立总业绩评价指标利用上例结论,我们将原来的11个业绩评价指用于反映F1 、F2 、F3的重要程度的权重W1 、 W2 、 W3 确定方法68用于反映F1 、F2 、F3的重要程度的权重W1 、 W2 各因子的方差贡献率代表该因子的“信息含量”,为使各权重系数之和为1,因此有:W1 =38.35/86.5=0.44W2 =32.65/86.5=0.38W3 =15.51/86.5=0.1869各因子的方差贡献率代表该因子的“信息含量

22、”,为使各权重系数之最终我们得到业绩评价的总指标 S= 0.44*F1+ 0.38*F2+ 0.18*F3 S= 0.44*FAC1_1+ 0.38*FAC2_1+ 0.18*FAC3_1该指标的优点:权重是客观的,非主观的。70最终我们得到业绩评价的总指标70计算每个公司总业绩指标值操作方法如下:见下页。71计算每个公司总业绩指标值操作方法如下:7172727373在原数据文件中得到各公司总业绩指标值S74在原数据文件中得到各公司总业绩指标值S747575依据各公司总业绩指标值,可对所有公司的业绩进行综合排名,方法如下:76依据各公司总业绩指标值,可对所有公司的业绩进行综合排名,767777

23、7878这时,各公司已按总业绩指标值从高到低的顺序排列。79这时,各公司已按总业绩指标值从高到低的顺序排列。79因子分析进一步举例因子分析在上市公司投资价值综合评价中的应用80因子分析进一步举例因子分析80指标选取19个指标净资产利润率-X1总资产利润率-X2每股收益-X3每股净资产-X4主营业利润率-X5市盈率-X6市净率-X7股价-X881指标选取19个指标净资产利润率-X181存货周转率-X9应收帐款周转率-X10总资产周转率-X11流动比率-X12速动比率-X13资产负债率-X1482存货周转率-X982利保障倍数-X15利润增长率-X16主营业务利润率增长率-X17每股收益增长率-X

24、18总资产增长率-X1983利保障倍数-X1583数据选取选取1997年水泥行业13家上市公司: 广西虎威、大同水泥、新疆屯河、河北威远、冀东水泥、江西水泥、尖锋集团、祁连山、福建水泥、云南保山、四川金顶、天鹅股份、华新水泥84数据选取选取1997年水泥行业13家上市公司:841997年度水泥行业投资价值评价指标851997年度水泥行业投资价值评价指标85共同度表明将19个变量简化为五个因子后,对X1变量的解释能力为96.5%,对X2的解释能力为98.3%,等等。86共同度86特征值及方差贡献率和累计方差贡献率旋转前,第1个因子对原19个变量的解释能力为34.43%旋转前,前5个因子对原19个

25、变量的解释能力为86.13%旋转后前五个因子对原19个变量的解释能力为86.13%87特征值及方差贡献率和累计方差贡献率87旋转前的因子结构不够简化 ,不易于对因子作出实际意义的解释。为了得到结果更好的因子载荷阵 ,初始因子实行旋转。88旋转前的因子结构不够简化 ,不易于对因子作出实际意义的解释。啊旋转后的因子载荷阵89啊旋转后的因子载荷阵89第一公因子 F1在指标 X1,X2,X3,X10,X16和X18上有较大的载荷 ,这些是从净资产利润率、总资产利润率、每股收益率、应收账款周转率、利润增长率和每股收益增长率 6个方面来反映公司投资价值的 ,因此可称公因子 F1为获利能力因子。90第一公因

26、子 F1在指标 X1,X2,X3,X10,X16和X第二公因子 F2在 X12 、X13、X14、X17上有较大的载荷 ,这些是从流动比率、速动比率、资产负债率、主营业务利润率增长率四个方面来反映公司投资价值的,因此可称 F2为负债经营程度与财务杠杆效应因子。91第二公因子 F2在 X12 、X13、X14、X17上有较大第三公因子 F3在 X9、X11 、X15、X19上有较大的载荷 ,这些是从存货周转率、总资产周转率、利息保障倍数、总资产增长率来反映公司投资价值的 ,因此可称F3为经营与偿债能力。92第三公因子 F3在 X9、X11 、X15、X19上有较大的第四公因子 F4在 X5、X7

27、、X8上有较大的载荷 ,这些是从主营业务利润率、市净率、股价来反映公司投资价值的,综合反映了市场对公司资产创利能力的认可程度 ,因此称 F4为资产价值因子。93第四公因子 F4在 X5、X7、X8上有较大的载荷 ,这些是第五公因子F5在X6(市盈率)上有较大的载荷 ,反映了市场对公司前景的即时评价 ,因此称 F5为市场景气因子。94第五公因子F5在X6(市盈率)上有较大的载荷 ,反映了市场对通过以上因子分析可知 ,影响本例各公司投资价值的主要指标由原来的19个,可浓缩成以下五个综合因素:1.获利能力因素;2.资本结构与财务杠杆因素;3.经营与偿债能力因素;4.资产价值因素;5.市场景气因素。95通过以上因子分析可知 ,影响本例各公司投资价值的主要指标由原因子分析模型96因子分析模型96 Fj为公共因子, 每个公共因子是对模型中每个变量都起作用的因子; 而i为特殊因子, 每个特殊因子只对一个变量起作用.F和独立E(F)=0, Cov(F)=IE( )=0, Cov()是对角矩阵97 Fj为公共因子, 每个公共因子是对模型中每个变量都起根据前面模型,可以得出下面结果:Sjaij2称为共同度而yi2称为特殊方差.变量共同度刻画全部公共因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论