主成分与因子分析_第1页
主成分与因子分析_第2页
主成分与因子分析_第3页
主成分与因子分析_第4页
主成分与因子分析_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析方法1主成分分析

因子分析2

第一部分

主成分分析3我们经常遇到有很多变量的数据。在如此多的变量之中,有很多是相关的。人们希望能够找出它们的少数“代表”(综合指标)来对它们进行描述。4下面介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principalcomponentanalysis)和因子分析(factoranalysis)。5主成分法的基本思想考虑二维情形,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值;这些数据大致分布于一个椭圆形的区域中,如下图所示:67这个椭圆有一个长轴和一个短轴。在短轴方向上,数据变化很少;在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点的变化了;这样,由二维到一维的降维就自然完成了。8如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的两个变量(舍去次要的一维),降维就完成了。椭圆(球)的长短轴相差得越大,降维效果越好。9主成分法的数学模型10对原变量x1,x2等变换为y1,y2,

y3等使得y1方差最大,y2次之等等;y1,y2,y3等相互独立。11可以写成向量形式:y1=a’x问题:在a’a=1的条件下,求a使y1方差最大:

D(y1)=a’D(x)a其中:D(x)为x的方差协方差矩阵。当x为标准化后的变量向量,则D(x)为相关系数矩阵R。y1的方差为:D(y1)=a’Ra12实际使用过程中,先将变量标准化运用拉格朗日乘子法求约束条件下的极值:令得:可见:a为R的特征向量,λ为R的特征值。此时,

D(y1)=a’Ra=a’λa=λa’a=λ于是:第一主成分y1的方差为最大特征值。13结论(以y1为例)原变量相关系数矩阵的最大特征值即为y1的方差,原变量相关系数矩阵的最大特征值对应的特征向量。14第二部分

因子分析15一、因子分析的作用因子分析的作用主要有两个:1.数据简化可为进一步应用其他统计方法(如相关分析、回归方法、判别分析法等)提供便利条件。2.寻求变量的基本结构16二、因子分析的基本步骤1.计算所有变量的相关矩阵,根据计算结果判断应用因子分析方法是否合适。如果各变量独立性较强,则不适合。2.提取因子。该步要确定求因子解的方法,和提取因子的个数。3.进行因子旋转,对旋转后的新因子作出实际意义解释。4.计算因子值。即每个Case的各因子值(称为因子得分值)17三、因子分析法的基本操作Analyze→DataReduction→Factor…

打开FactorAnalysis对话框将参与因子分析的变量依次选入Variables框中

分别对“Extraction”,“Rotation”,“Scores”等项进行设置.单击“OK”即可18“Extraction”对话框选项Method:Principalcomponents(主成分分析,系统默认)Unweightedleastsquare(普通最小二乘法)Generalizedleastsquares(广义最小二乘法)Maximumlikelihood(最大似然法)PrincipalAxisfactoring(主轴因子法)Alpha(α因子提取法)Image(映像分析法)19Extract:决定提取因子的个数Eigenvalueover:指定要提取因子的最小特征值,系统默认值为1Numberoffactors:直接指定提取的因子个数。20Display:指定与初始因子有关的输出项Unrotatedfactorsolution:显示未旋转的因子解Screeplot:显示碎石图,用于决定因子提取个数。21“Rotation”对话框选项Method:选择因子旋转方法None(不进行旋转)Varimax(方差最大法)Equamax(等量最大法)Quartimax(四次方最大法)DirectOblimin(斜交旋转)22Display:指定输出选项Rotatedsolution:显示旋转后的因子解Loadingplots:显示因子载荷图23“Scores”对话框选项Method:指定计算因子值方法Regression:回归法Bartlett:巴特利特法Anderson-Rubin:安德森—鲁宾法24Saveasvariables:将因子值作为新变量保存在数据文件中。25例1对公司业绩评价,选取了11个指标。(详见“因子分析”数据文件)本例目的:将11个指标进行简化综合2627全部有关变量28判断“是否适合作因子分析”请进行以下操作………….293031输出“碎石图”请作以下操作………..323334进行因子旋转(一般都需要)否则所得因子无法命名(缺乏实际经济意义)操作……….3536该选项(方差最大法)最常用37计算因子得分操作…………..383940要求因子载荷系数按大小顺序排列操作……….41424344输出结果:相关系数矩阵用于判断是否作因子分析如果存在大量的接近零的相关系数,则不适合作因子分析。45KMO指标大于0.7时,适合作因子分析。

0.6以上,作因子分析还可以

0.6以上,不太适合作因子分析Bartlett球度检验显著时(P-值较低),则表明适合作因子分析。46共同度表明将11个变量简化为3个因子后,对X1变量的解释能力为86.2%,对X2的解释能力为76.3%,等等。47特征值及方差贡献率和累计方差贡献率旋转前,第1个因子对原11个变量的解释能力为39.35%旋转前,前3个因子对原11个变量的解释能力为86.50%旋转后,前3个因子对原11个变量的解释能力为86.50%48该图用于分析提取几个公因子较为适当。方法:保留下降速度较快特征值对应的因子。4950总资产收益率=0.981·F1–0.015·F2+0.019·F3

净资产收益率=0.976·F1–0.013·F2+0.028·F3

营业收益率=0.973·F1–0.035·F2+0.047·F3………..

旋转后的因子载荷的含义(以前三行为例)51因子载荷系数的含义以前述第一个式子为例:总资产收益率=0.981·F1–0.015·F2+0.019·F3

总资产收益率与F1

(因子1)的相关系数为0.981总资产收益率与F2

(因子2)的相关系数为-0.015总资产收益率与F3

(因子3)的相关系数为0.01952因子的命名知道了因子载荷的含义后,我们就可以发现各因子的实际经济意义,并据此对各因子进行命名。53对因子1(F1)的命名总资产收益率=0.981·F1–0.015·F2+0.019·F3

净资产收益率=0.976·F1–0.013·F2+0.028·F3

营业收益率=0.973·F1–0.035·F2+0.047·F3

净利润=0.873·F1–0.012·F2+0.032·F3

净利润率=0.747·F1–0.035·F2+0.183·F3主营业务收入增长率=–0.058·F1+0.987·F2+0.183·F3

固定资产增长率=–0.058·F1+0.986·F2+0.012·F3

总资产增长率=–0.055·F1+0.986·F2+0.005·F3

税后利润增长率=0.062·F1+0.809·F2+0.145·F3

主营业务收入=0.032·F1+0.124·F2+0.919·F3

净资产=0.147·F1+0.004·F2+0.895·F354对因子1(F1)的命名总资产收益率=0.981·F1–0.015·F2+0.019·F3

净资产收益率=0.976·F1–0.013·F2+0.028·F3

营业收益率=0.973·F1–0.035·F2+0.047·F3

净利润=0.873·F1–0.012·F2+0.032·F3

净利润率=0.747·F1–0.035·F2+0.183·F3主营业务收入增长率=–0.058·F1+0.987·F2+0.183·F3

固定资产增长率=–0.058·F1+0.986·F2+0.012·F3

总资产增长率=–0.055·F1+0.986·F2+0.005·F3

税后利润增长率=0.062·F1+0.809·F2+0.145·F3

主营业务收入=0.032·F1+0.124·F2+0.919·F3

净资产=0.147·F1+0.004·F2+0.895·F3与因子1相关的指标有:总资产收益率净资产收益率营业收益率净利润净利润率这些指标都属于盈利能力指标,由此可知,因子1反映盈利能力,因此因子1可以命名为“盈利能力因子”55对因子2(F2)的命名总资产收益率=0.981·F1–0.015·F2+0.019·F3

净资产收益率=0.976·F1–0.013·F2+0.028·F3

营业收益率=0.973·F1–0.035·F2+0.047·F3

净利润=0.873·F1–0.012·F2+0.032·F3

净利润率=0.747·F1–0.035·F2+0.183·F3

主营业务收入增长率=–0.058·F1+0.987·F2+0.183·F3

固定资产增长率=–0.058·F1+0.986·F2+0.012·F3

总资产增长率=–0.055·F1+0.986·F2+0.005·F3

税后利润增长率=0.062·F1+0.809·F2+0.145·F3

主营业务收入=0.032·F1+0.124·F2+0.919·F3

净资产=0.147·F1+0.004·F2+0.895·F3与因子2相关的指标有:主营业务收入增长率、固定资产增长率总资产增长率、税后利润增长率这些指标都属于“成长性”指标,由此可知,因子2反映“成长性”,因此因子2可以命名为“成长性因子”56对因子3(F3)的命名总资产收益率=0.981·F1–0.015·F2+0.019·F3

净资产收益率=0.976·F1–0.013·F2+0.028·F3

营业收益率=0.973·F1–0.035·F2+0.047·F3

净利润=0.873·F1–0.012·F2+0.032·F3

净利润率=0.747·F1–0.035·F2+0.183·F3主营业务收入增长率=–0.058·F1+0.987·F2+0.183·F3

固定资产增长率=–0.058·F1+0.986·F2+0.012·F3

总资产增长率=–0.055·F1+0.986·F2+0.005·F3

税后利润增长率=0.062·F1+0.809·F2+0.145·F3

主营业务收入=0.032·F1+0.124·F2+0.919·F3

净资产=0.147·F1+0.004·F2+0.895·F3与因子2相关的指标有:主营业务收入、净资产这些指标都属于“公司规模”指标,由此可知,因子3反映“公司规模”,因此因子3可以命名为“公司规模因子”57因子命名(总结)因子1:盈利能力因子因子2:成长性因子因子3:公司规模因子58对公司业绩衡量的原指标(11个)现在可以用三个新的业绩综合指标

盈利能力(F1)、成长性(F2)、公司规模(F3)表示。原来的11个指标可以舍弃各公司上述三个综合指标值(称为因子得分)以在原始数据文件中(见下页)。至此,因子分析以达到“浓缩数据”或“精简变量”的目的。59因子得分(部分数据)60例2:运用因子分析建立综合评价模型运用上例数据61基本操作同前与上例有所不同之处:计算因子得分操作增加以下选项……..626364输出结果:与上例相比增加了因子得分系数矩阵:65F1=-0.049主营业务收入+0.211净利润–0.021净资产+0.234营业收益率+0.236净资产收益率+0.238总资产收益率+0.17净利润率+0.005总资产增长率+0.004主营营业收入增长率+0.021税后利润增长率+0.004固定资产增长率同样可以写出F2和F3的表达式66建立总业绩评价指标利用上例结论,我们将原来的11个业绩评价指标简化为三个综合业绩指标:盈利能力F1、成长性F2、公司规模F3下面,我们通过对这三个综合指标进行加权平均,得到业绩评价总指标S。基本思路,确定各综合指标的权重W1、

W2、

W3,用于反映F1、F2、F3的重要程度。继而得到业绩评价的总指标

S=W1*F1+W2*F2+W3*F367用于反映F1、F2、F3的重要程度的权重W1、

W2、

W3确定方法68各因子的方差贡献率代表该因子的“信息含量”,为使各权重系数之和为1,因此有:W1=38.35/86.5=0.44W2=32.65/86.5=0.38W3=15.51/86.5=0.1869最终我们得到业绩评价的总指标

S=0.44*F1+0.38*F2+0.18*F3S=0.44*FAC1_1+0.38*FAC2_1+0.18*FAC3_1该指标的优点:权重是客观的,非主观的。70计算每个公司总业绩指标值操作方法如下:见下页。717273在原数据文件中得到各公司总业绩指标值S7475依据各公司总业绩指标值,可对所有公司的业绩进行综合排名,方法如下:767778这时,各公司已按总业绩指标值从高到低的顺序排列。79因子分析进一步举例因子分析在上市公司投资价值综合评价中的应用80指标选取——19个指标净资产利润率--X1总资产利润率--X2每股收益--X3每股净资产--X4主营业利润率--X5市盈率--X6市净率--X7股价--X881存货周转率--X9应收帐款周转率--X10总资产周转率--X11流动比率--X12速动比率--X13资产负债率--X1482利保障倍数--X15利润增长率--X16主营业务利润率增长率--X17每股收益增长率--X18总资产增长率--X1983数据选取选取1997年水泥行业13家上市公司:广西虎威、大同水泥、新疆屯河、河北威远、冀东水泥、江西水泥、尖锋集团、祁连山、福建水泥、云南保山、四川金顶、天鹅股份、华新水泥841997年度水泥行业投资价值评价指标85共同度表明将19个变量简化为五个因子后,对X1变量的解释能力为96.5%,对X2的解释能力为98.3%,等等。86特征值及方差贡献率和累计方差贡献率旋转前,第1个因子对原19个变量的解释能力为34.43%旋转前,前5个因子对原19个变量的解释能力为86.13%旋转后前五个因子对原19个变量的解释能力为86.13%87旋转前的因子结构不够简化,不易于对因子作出实际意义的解释。为了得到结果更好的因子载荷阵,初始因子实行旋转。88啊旋转后的因子载荷阵89第一公因子F1在指标X1,X2,X3,X10,X16和X18上有较大的载荷,这些是从净资产利润率、总资产利润率、每股收益率、应收账款周转率、利润增长率和每股收益增长率6个方面来反映公司投资价值的,因此可称公因子F1为获利能力因子。90第二公因子F2在X12、X13、X14、X17上有较大的载荷,这些是从流动比率、速动比率、资产负债率、主营业务利润率增长率四个方面来反映公司投资价值的,因此可称F2为负债经营程度与财务杠杆效应因子。91第三公因子F3在X9、X11、X15、X19上有较大的载荷,这些是从存货周转率、总资产周转率、利息保障倍数、总资产增长率来反映公司投资价值的,因此可称F3为经营与偿债能力。92第四公因子F4在X5、X7、X8上有较大的载荷,这些是从主营业务利润率、市净率、股价来反映公司投资价值的,综合反映了市场对公司资产创利能力的认可程度,因此称F4为资产价值因子。93第五公因子F5在X6(市盈率)上有较大的载荷,反映了市场对公司前景的即时评价,因此称F5为市场景气因子。94通过以上因子分析可知,影响本例各公司投资价值的主要指标由原来的19个,可浓缩成以下五个综合因素:1.获利能力因素;2.资本结构与财务杠杆因素;3.经营与偿债能力因素;4.资产价值因素;5.市场景气因素。95因子分析模型96

Fj为公共因子,每个公共因子是对模型中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论