



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS 软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据5见表2,定量综合赢利能力分 析如下:表2 2002年16家上市公司4项指标的数据公司销售净利率(X)资产净利率(X2)净资产收益率(X,)销售毛利率(X4)歌华有线 五粮液? 用友软件 太太药业 浙江阳光 烟台万华 方正科技 红河光明 贵州茅台 中铁二局 红星发展 伊利股份 青岛海尔 湖北宜化 雅戈尔? 福建南纸731.主成分分析的做法第一,将EXCEL中的原始数据导入到 SPSS软件中;注意:导入Spss的数据不能岀现空缺的现象,如岀现可用0补齐。第二,对四个指标进行标准化处理;【1】“分析” | “描述统计”
2、| “描述”。【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组 中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点 击确定。【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数 据的字段。所做工作:a.原始数据的标准化处理数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单的例子,一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标准化,都把它们标准到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为 0,方差为1,当然也有其他标准化,比如 0-1标准化等等,可根据自己的研究目的进行选择,这里介绍怎么进行
3、数 据的Z标准化。所的结论:标准化后的所有指标数据。SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理 ,所 以在得到计算结果后的变量都是指经过标准化处理后的变量,但SPSS并不直接给岀标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。第三,并把标准化后的数据保存在数据编辑窗口中然后利用SPSS的factor过程对数据进行因子分析(指标之间的相关性判定略)。【1】“分析”| “降维” | “因子分析”选项卡,将要进行分析的变量选入“变量”列表;【2】设置“描述”,勾选“原始分析结果”和“KMO与 Bartlett
4、球形度检验”复选框;【3】设置“抽取”,勾选“碎石图”复选框;【4】设置“旋转”,勾选“最大方差法”复选框;【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框; 【6】查看分析结果。所做工作:a. 查看KMO和Bartlett的检验KMO直接近值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析; Bartlett球度度检验的Sig值越小于显着水平,越说明变量之间存在相关关系。所的结论:符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。注意:(Kaiser-Meyer-Olkin)KMC统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关
5、系数平 方和时,KMO值接近值越接近于 1,意味着变量间的相关性越强,原有变量越适合作因子分析;当 所有变量间的简单相关系数平方和接近0时,KMO直接近值越接近于 0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。Kaiser给岀了常用的kmo度量标准:以上表示非常适合;表示适合;表示一般;表示不太适 合;以下表示极不适合。球度检验:巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应 的相伴概率值小于用户心中的显着性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单 位阵,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相 对
6、应的相伴概率大于显着性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于 做因子分析。Bartlett球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为小于显着水平,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。所做工作:b. 全部解释方差或者解释的总方差(Total Varianee Explained)初始特征根(Initial Eigenvalues)大于1,并且累计百分比达到 80%85%以上。查看相关系数矩阵的特征根及方差贡献率见表3,由于前2个主成分贡献率85%结合表4中变量不岀现丢失,所以提取的主成分个数m=2所的结论:初始特征根:入1=入2 =主成分贡献
7、率:r1= r 2=注意:主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚 好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据入值决定主成分数目的 准则有三:1. 只取入>1的特征根对应的主成分从Total Varianee Explained表中可见,第一、第二和第三个主成分对应的入值都大于1 ,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。2. 累计百分比达到80%85%以上的入值对应的主成分在Total Varianee Explained 表可以看岀,前三个主成分对应的入值累计百分比达到%这暗示只要选取三个
8、主成分,信息量就够了。3. 根据特征根变化的突变点决定主成分的数量从特征根分布的折线图(Scree Plot )上可以看到,第 4个入值是一个明显的折点,这暗示 选取的主成分数目应有 p<4。那么,究竟是 3个还是4个呢?根据前面两条准则,选3个大致合适(但小有问题)。第四,计算特征向量矩阵(主成分表达式的系数)【1】将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数 据编辑窗口(为变量V1、V2);F1=VdSQR(入 1)【2】然后利用“转换” | “计算变量”,打开“计算变量”对话框,在“目 标变量”文本框中输入“ R”,然后在数字表达式中输入“ V1/SQR(入1)”
9、注:入 1=,即可得到特征向量F1;【3】然后利用“转换” | “计算变量”,打开“计算变量”对话框,在“目 标变量”文本框中输入“ F2”,然后在数字表达式中输入“ M/SQR(入2)” 注:入 1=,即可得到特征向量F2;【4】最后得到特征向量矩阵(主成分表达式的系数)。所做工作:a.成分矩阵或者初始因子载荷矩阵( Component Matrix )初始因子载荷矩阵见上图,通过初始因子载荷矩阵还不能得出主成分的表达式,还需要把初 始因子载荷矩阵中的每列的系数(主成分的载荷)除以其相应主成分的特征根的平方根后才能得 到主成分系数向量(主成分的得岀系数); 所的结论:1. 用于计算主成分表达
10、式系数的初始因子载荷矩阵中每个指标的载荷。2. 计算后,得到的主成分表达式的系数矩阵。注意:1. 主成分表达式的系数提取岀来的全部主成分可以基本反映全部指标的信息,但这些新变量(主成分)的表达却不能从输出窗口中直接得到,即:主成分中每个指标所对应的系数不是初始因子载荷矩阵中的对应指标 的载荷,因为"Component Matrix "是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变 量的相关系数。2. 主成分表达式系数的计算方法初始因子载荷矩阵或主成分载荷矩阵(Compo nent Matrix)中的数据除以主成分相对应的特征根(或特征值)开平方根便得到两个主成分中每个
11、指标所对应的系数。F1=V1/SQR(入 1)3. 主成分的指标划分与命名初始因子载荷矩阵或主成分载荷矩阵(Comp onent Matrix)中每列表示相应主成分与对应变量 的相关系数,每个主成分所反映的原始指标各有不同,为进一步明确每个主成分侧重反应的具体 原始指标,需要对原始指标在每个主成分上的载荷进行比较,其中载荷越大,其对应的主成分反 映该原始指标的信息量越大,反之亦然;如果某一原始指标在几个主成分的载荷绝对值不相上下, 归类比较含混,导致主成分的原始指标划分不清。说明有必要作进一步的因子分析。从Component Matrix即主成分载荷表中可以看岀,哪一原始指标在哪一主成分上载荷
12、绝对值 较大,亦即与该主成分的相关系数较高【注:相关分为正负相关】。第五,计算主成分得分矩阵(主成分得分)【1】将得到的特征向量与标准化后白勺数圳.相乘,然后就可以得出主成分函 数的表达式;Zi= F ii*zX 1+ F i2*zX 2+ F i3*zX3+ F i4*zX 4Z2= F 2i*ZX i+ F 22*ZX 2+ F 23*ZX3+ F 24*zX 4?(其中,zXi 为标准化后的数据)【2】然后利用“转换” I “计算变量”,打开“计算变量”对话框,在“目 标变量”文本框中输入“ Zi”,然后在数字表达式中输入“* Z (销售净利率)+*Z (资 产净利率)+*Z (净资产收
13、益率)+*Z (销售毛利率)”注:Fi=,” ,即可得到特征向量 乙;【3】同理注:F2=,,可得到特征向量乙;【4】求出i6家上市公司的主成分值。所做工作:a.对原始数据标准化后的数据标准化后的数据;所的结论:i.用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。注意:i.特征向量矩阵载荷的用运乙=F ii*zXi+ F i2*zX2+ F i3*zX3+ F i4*zX4Z2= F 2i*ZXi+ F 22*zX2+ F 23*zX3+ F 24*zX4?(其中,ZX 为标准化后的数据)第六,最后利用主成分函数、综合主成分公式:I i I将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表 达式;Z=r i*Zi+r 2*Z2【2】然后利用“转换” | “计算变量”,打开“计算变量”对话框,在“目 标变量”文本框中输入“ Z”,然后在数字表达式中输入“ ri*Zi+r2*Z2” 注:r i=, r 2=,即可得到综合主成分;【3】综合主成分(赢利能力)值。所做工作:a.对原始数据标准化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《单簧管波尔卡》探究
- 餐厅店长培训课程
- CFA金融分析师模拟试题及答案
- 预防接种守护生命
- 高校师生假期培训
- 八年级上册《积的乘方》课件与练习
- 预防留置尿管感染
- 云南省昭通一中教研联盟2024-2025学年高一上学期期中质量检测地理 (B卷)试题
- 静脉输液治疗标准
- 卷3-2025年中考地理高频考题(广东专用)(解析版)
- 第10讲平面直角坐标系中图形面积的求解思路(原卷版+解析)-2021-2022学年七年级数学下册常考点(数学思想+解题技巧+专项突破+精准提升)
- 《烃的衍生物》复习课件
- 2024小学语文教学及说课课件:六年级上册语文《丁香结》
- 2024至2030年中国矿产勘探行业深度调查及投融资战略研究报告
- 医院培训课件:《输血相关法规及输血知识培训》
- 中国普通食物营养成分表(修正版)
- (新版)高级考评员职业技能鉴定考试题库(含答案)
- 《交流与传承-东西文化碰撞中的艺术嬗变》参考课件4
- 2024年北师大版中考数学模拟考试试卷(含答案)
- 养老院免责完整协议书(2024版)
- 酒店数字化运营概论 课件 项目一 信息技术在酒店应用概述
评论
0/150
提交评论