判别分析案例学习教案_第1页
判别分析案例学习教案_第2页
判别分析案例学习教案_第3页
判别分析案例学习教案_第4页
判别分析案例学习教案_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1判别分析案例判别分析案例(n l)第一页,共50页。机妙算”n“像泰山那么稳固”n“像钻石那么坚硬”n一些判别标准都是有原型的,虽然(surn)这些判别的标准并不那么精确或严格,但大都是根据一些现有的模型得到的。第1页/共49页第二页,共50页。sher判别(pnbi)法Bayes判别(pnbi)法逐步判别(pnbi)法第2页/共49页第三页,共50页。第3页/共49页第四页,共50页。第4页/共49页第五页,共50页。一类。第5页/共49页第六页,共50页。n主要(zhyo)利用一些检验来判断变量的判别能力。第6页/共49页第七页,共50页。数据数据介绍介绍SPSS实现实现结果结果分

2、析分析R语言语言实现实现disc.sav, disc.txt第7页/共49页第八页,共50页。找出分类标准,并对没分类的企业进行分类。第8页/共49页第九页,共50页。变量名称变量名称涵义描述涵义描述group表示类别。group-1代表上升,group-2代表稳定,group-3代表下降。is表示企业规模。se表示服务。sa表示雇员工资比例。prr表示利润增长。ms表示市场份额。msr表示市场份额增长。cp表示流动资金比例。cs表示资金周转速度。第9页/共49页第十页,共50页。该数据disc.sav共有90个样本,其中30个属于上升型,30个属于稳定性,30属于下降型。这个已知类别的数据称

3、为(chn wi)一个“训练样本”。group表示(biosh)类别8个用来建立判别标准的变量第10页/共49页第十一页,共50页。File Open Data “Disc.sav”第11页/共49页第十二页,共50页。第12页/共49页第十三页,共50页。第13页/共49页第十四页,共50页。第14页/共49页第十五页,共50页。两种变量选择两种变量选择(xunz)方法方法自变量同时自变量同时进入方程进入方程逐步逐步判别法判别法第15页/共49页第十六页,共50页。group选入分组变量(binling)is-cs选入自变量选择(xunz)自变量同时进入方程的方法第16页/共49页第十七页,

4、共50页。第17页/共49页第十八页,共50页。选择(xunz)Means进行均数估计选择(xunz)Boxs M进行各组协方差阵相等检验生成Bayes判别方程系数和Fisher判别方程系数。选择ANOVAs进行各组均值相等检验第18页/共49页第十九页,共50页。第19页/共49页第二十页,共50页。选择(xunz)以样本量百分比为先验概率显示每个单位判别分析后所属类别显示判别符合率表类别显示在同一散点图中以剔出某观察单位所建立的判别函数判别该观察单位所属类别第20页/共49页第二十一页,共50页。在数据中保存判别(pnbi)后数据所属类别在数据中保存数据的判别分第21页/共49页第二十二页

5、,共50页。90个变量100%读入,没有(mi yu)缺失值第22页/共49页第二十三页,共50页。各自(gz)变量的方差分析及统计量说明在3类企业间,各变量均有显著(xinzh)差异统计量在0-1之间。越接近0组间差异越显著;越接近1组间差异越不显著。第23页/共49页第二十四页,共50页。各组协方差阵相等(xingdng)的检验说明拒绝协方差矩阵相等(xingdng)的假设,即不能认为各组间协方差矩阵相等(xingdng)。从一些统计实践的结果来看,很少有碰到检验不显著的情况。而在一些实践中,比如线性判别分析,即使方差协方差结构不相等,对于结果的影响也不会有非常大的影响。第24页/共49页

6、第二十五页,共50页。标准化典型(dinxng)判别函数系数876543211435. 0019. 0355. 0457. 0334. 0365. 0433. 0415. 0 xxxxxxxxy得到2个标准化典型(dinxng)判别方程:876543212193. 0285. 0634. 0369. 0541. 0426. 0127. 0065. 0 xxxxxxxxy需要注意的是:这是标准化后的判别函数,若要将变量带入计算判别分,必须将变量进行标准化处理(即减均值除以标准差)。第25页/共49页第二十六页,共50页。结构(jigu)系数矩阵用来说明判别变量对标准化典型判别方程的相关程度结果说

7、明,前6个变量(binling)(*)对方程1贡献比较大,后两个变量(binling)对方程2贡献较大。第26页/共49页第二十七页,共50页。未标准化典型判别函数系数(xsh)Fisher判别法876543211384. 0004. 0023. 0068. 0007. 0037. 0257. 3035. 0088. 3xxxxxxxxy得到2个未标准化典型(dinxng)判别方程:876543212171. 0058. 0041. 0054. 0011. 0043. 0953. 0005. 0392. 5xxxxxxxxy可以将原变量值直接代入计算判别分进行分类。第27页/共49页第二十八页

8、,共50页。生成(shn chn)3个新的变量dis_1表示判别(pnbi)后所属组别的值dis1_1表示样本代入第1个判别函数所得的判别分dis2_1表示样本代入第2个判别函数所得的判别分第28页/共49页第二十九页,共50页。Fisher判别(pnbi)法得到的分组图各组重心描述在判别空间每一组的中心(zhngxn)位置第29页/共49页第三十页,共50页。判别(pnbi)力指数两个判别(pnbi)函数的作用并不是平等的,判别(pnbi)力指数给出了判别(pnbi)函数的重要程度。说明(shumng)第一个判别函数的贡献率高达98.8%,第二个判别函数的贡献率仅为1.1%。第30页/共49

9、页第三十一页,共50页。残余判别力指数残余判别力的含义(hny)是:在以前计算的函数已经提取过原始信息之后,残余的变量信息对于判别分组的能力。值越小表示越高的判别力。说明方程1提取了很大的信息量,而残余变量(binling)信息对于判别分组的能力很小了。第31页/共49页第三十二页,共50页。分类(fn li)结果从表上看,我们的分类函数(hnsh)能够100%的把训练数据的每一个观测值分到其本来的类。该表分成两部分:上面一半是用从全部数据得到的判别函数(hnsh)来判断每一个点的结果;下面一半是对每一个观测值,都用仅缺少该观测值的全部数据得到的判别函数(hnsh)来进行判断的结果。第32页/

10、共49页第三十三页,共50页。各分类(fn li)的先验概率先验概率是根据样本出现(chxin)概率确定的,本例3类企业各有30个,因此先验概率相等都为33.3%。第33页/共49页第三十四页,共50页。Bayes判别(pnbi)法得到的判别(pnbi)函数系数得到(d do)3个判别方程:87654321273. 7942. 0362. 0481. 0900 . 0401. 0068. 7122. 0355.67(1)xxxxxxxx原分类87654321985. 4853. 0167. 0857. 0320 . 0593. 0030. 72342. 0765.61(2)xxxxxxxx原分

11、类87654321496. 2895. 00.074323. 1020 . 0864. 0601. 74558. 0964.104(3)xxxxxxxx原分类将观察单位的各个变量分别代入3个判别函数中,可求出3个判别函数值,哪一个最大就属于哪一类。第34页/共49页第三十五页,共50页。结果就不一样了。第35页/共49页第三十六页,共50页。使用企业规模(ie)、服务(se)和雇员工资比例(bl)(sa)三个变量进行判别,得到的分类图。与8个变量进行判别相对(xingdu)比,明显的三类点分的就不那么开了。第36页/共49页第三十七页,共50页。基于3个变量的分类(fn li)结果表结果显示,

12、对于(duy)全部数据的判别,有85个点(94.4%)得到正确划分,5个点错判;其中第二类有3个被误判到第一类;有2个被误判到第三类。对于(duy)交叉验证的判别,有83个点(92.2%)得到正确划分,有7个点被错判;其中第二类有3个被误判为第一类,4个被误判为第三类。第37页/共49页第三十八页,共50页。选择(xunz)逐步判别法Method模块(m kui)被激活第38页/共49页第三十九页,共50页。第39页/共49页第四十页,共50页。选择(xunz)Wilks 统计量最小化法选择输出每一步统计量当F3.84时选入;当F 2.71时剔出。第40页/共49页第四十一页,共50页。经过(

13、jnggu)分析,淘汰了不显著的资金流动比例(cp)变量,当然判别系数也发生相应变化。第41页/共49页第四十二页,共50页。C C l la a s ss si if fi ic c a a t ti io on n R Re es su ul lt ts sb b, ,c c300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0组别上升企业稳定企业下降企业上升企业稳定企业下降企业上升企业稳定企业下降企业上升

14、企业稳定企业下降企业Count%Count%OriginalCross-validateda上升企业稳定企业下降企业Predicted Group MembershipTotalCross validation is done only for those cases in the analysis. In crossvalidation, each case is classified by the functions derived from all casesother than that case.a. 100.0% of original grouped cases correctl

15、y classified.b. 100.0% of cross-validated grouped cases correctly classified.c. 虽然判别系数(xsh)改变,但结果并未改变。第42页/共49页第四十三页,共50页。V1代表(dibio)Group。 V1=factor(V1) #把分组变量(binling)变成定性变量(binling)。第43页/共49页第四十四页,共50页。 train=sample(1:90,45) #随即抽取一般样本作训练样本。 table(V1train) #显示训练样本中各类的比例。 library(MASS); z=lda(V1.,d

16、ata=w,prior=c(1,1,1)/3,subset=train)#用V1作分组变量,V2-V9作判别变量,使用(shyng)训练样本生成判别函数,先验概率各为33.3%。第44页/共49页第四十五页,共50页。先验概率各为33.3%。判别(pnbi)系数第1个判别函数贡献率为98.7%;第2个判别函数贡献率为1.3%。第45页/共49页第四十六页,共50页。练样本外的点 a2=predict(z,w) #对z的结果预测所有样本点 a2$class #给出分类(fn li)结果 a2$x #给出每个点的二维坐标 y=cbind(a2$x,a2$class); y1=yy,3=1,-3; y2=yy,3=2,-3; y3=yy,3=3,-3; plot(y1,1,y1,2,pch=0,xlim=c(-10,8.5),ylim=c(-4,3),ylab=,xlab=) points(y2,1,y2,2,pch=1) points(y3,1,y2,2,pch=2)第46页/共49页第四十七页,共50页。第一类第二类第三类第47页/共

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论