版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
判别分析方法基于SPSS应用软件判别分析方法基于SPSS应用软件1一、判别分析意义判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。根据判别函数对未知所属类别的事物进行分类的一种分析方法。在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断。如动物学家对动物如何分类的研究和某个动物属于哪一类、目、纲的判断。不同:判别分析和聚类分析不同的在于判别分析要求已知一系列反映事物特征的数值变量的值,并且已知各个体的分类(训练样本)。一、判别分析意义判别分析是根据表明事物特点2方法有
距离判别——根据个案与总体均值间的距离大小的原则,进行判别。
贝叶斯判别——根据后验概率最大的原则。
典型判别——求原始变量的线性组合,使产生的新变量之更能将类分开。
逐步判别——有逐步筛选的办法,将对判别有贡献的变量选出。
方法有距离判别——根据个案与总体均值间的距离大小3
例中小企业的破产模型为了研究中小企业的破产模型,选定4个经济指标:X1总负债率(现金收益/总负债)X2收益性指标(纯收入/总财产)X3短期支付能力(流动资产/流动负债)X4生产效率性指标(流动资产/纯销售额)对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料:例中小企业的破产模型4总负债率收益性指标短期支付能力生产效率指标类别-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532总负债率收益性指标短期支付能力生产效率指标类别-.45-.45.38.113.27.552.19.052.25.332.32.074.24.632.31.054.45.692.12.052.52.692-.02.022.05.352.22.082.35.402.17.071.80.522.15.052.17.552-.10-1.012.50.582.14-.03.46.262.14.072.61.522-.33-.093.01.472.48.091.24.182.56.114.29.452.20.081.99.302.47.142.92.452.17.042.45.142.58.045.06.132.04.011.50.71待判-.06-.061.37.40待判.38.113.27.552.19.052.25.332.36.07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判.07-.011.37.34待判-.13-.141.42.47判别分析方法与SPSS分析课件8距离的判别由于已经知道所有点的类别了,所以可以求得每个类型的中心。这样只要定义了如何计算距离,就可以得到任何给定的点(企业)到这三个中心的三个距离。显然,最简单的办法就是离哪个中心距离最近,就属于哪一类。通常使用的距离是所谓的Mahalanobis距离(马氏距离)。用来比较到各个中心距离的数学函数称为判别函数(discriminantfunction).这种根据远近判别的方法,原理简单,直观易懂。距离的判别由于已经知道所有点9贝叶斯判别根据后验概率最大的原则,在企业的财务状况下,利用贝叶斯公式计算其判给各类的后验概率,哪个概率越大,则判给哪类。贝叶斯判别根据后验概率最大的10典型判别法(先计算新变量的线性组合)考虑只有两个(预测)变量的判别分析问题。假定这里只有两类。数据中的每个观测值是二维空间的一个点。见图(下一张幻灯片)。这里只有两种已知类型的训练样本。其中一类有38个点(用“o”表示),另一类有44个点(用“*”表示)。按照原来的变量(横坐标和纵坐标),很难将这两种点分开。于是就寻找一个方向,也就是图上的虚线方向,沿着这个方向朝和这个虚线垂直的一条直线进行投影会使得这两类分得最清楚。可以看出,如果向其他方向投影,判别效果不会比这个好。有了投影之后,再用前面讲到的距离远近的方法来得到判别准则。这种首先进行投影的判别方法就是典型判别法。典型判别法(先计算新变量的线性组合)11判别分析方法与SPSS分析课件12逐步判别法(仅仅是在前面的方法中加入变量选择的功能)有时,一些变量对于判别并没有什么作用,为了得到对判别最合适的变量,可以使用逐步判别。也就是,一边判别,一边引进判别能力最强的变量,这个过程可以有进有出。一个变量的判别能力的判断方法有很多种,主要利用各种检验,例如Wilks’Lambda、Rao’sV、TheSquaredMahalanobisDistance、SmallestFratio或TheSumofUnexplainedVariations等检验。其细节这里就不赘述了;这些不同方法可由统计软件的各种选项来实现。逐步判别的其他方面和前面的无异。逐步判别法(仅仅是在前面的方法中加入变量选择的功能13第一步:打开判别分析的窗口。变量全部选入。变量逐步选入全部选入。第一步:打开判别分析的窗口。变量全部选入。变量逐步选入全部选14第二步:定义类的代码。第二步:定义类的代码。15第三步:将变量放入独立变量框。第三步:将变量放入独立变量框。16Means-计算平均数;UnivariateANOVAs—讨论单变量的方差分析,看哪些本来在组间有差异;Box’sM统计量—总体的协方差相等的检验。Fisher’s-判别函数的系数;Unstandardized没有标准化的判别函数的系数;关于协方差矩阵的要求。第四步:选择统计量。Fisher’s-判别函数的系数;关于协方差矩阵的要求。第四17Prior—对先验概率的要求,上一个选项是先验概率相等,后一个是以样本的频率为先验概率;Display-对输出数据的要求。Casewiseresult——所有个案的结果;Summarytable——判别结果的表格;Leave-out-classification——交叉核实。UseCovariance—利用什么矩阵计算判别函数。组内的协方差矩阵,还是分组协方差矩阵;Plot—对典型变量进行分组,画直方图。分类区域散点图。
第五步:选择判类的一些前提条件和输出。第五步:选择判类的一些前提条件和输出。18关于逐步判别的选项。关于逐步判别的选项。19下面来观察输出结果一、首先做全模型要求:所有本来均进入;先验概率相等;输出判别函数;做交叉核实;画分类散点地图;保存后验概率,判类结果和判别函数得分。下面来观察输出结果一、首先做全模型20标准化的典型变量的函数标准化的典型变量的函数21典型判别函数和原始变量的相关系数。典型判别函数和原始变量的相关系数。22典型判别函数的系数,判别函数的得分由此计算。典型判别函数的系数,判别函数的得分由此计算。23典型变量在两类的均值。典型变量在两类的均值。24距离判别法的判别函数。在正态假定下,它与贝叶斯判别等价。距离判别法的判别函数。在正态假定下,它与贝叶斯25错判和正判的结果。标志处是回代核实和交叉核实的正判率。错判和正判的结果。标志处是回代核实和交叉核26误判和正确判别率从这个表来看,我们的分类能够100%地把训练数据的每一个观测值分到其本来的类。该表分成两部分;上面一半(Original)是用从全部数据得到的判别函数来判断每一个点的结果(前面三行为判断结果的数目,而后三行为相应的百分比)。下面一半(Crossvalidated)是对每一个观测值,都用缺少该观测的全部数据得到的判别函数来判断的结果。这里的判别结果是100%判别正确,但一般并不一定。
误判和正确判别率从这个表来看,我们的分类能够100%地把训练27二、利用SPSS软件的逐步判别法的结果
选择了两个变量。二、利用SPSS软件的逐步判别法的结果28判别分析要注意什么?训练样本中必须有所有要判别的类型,分类必须清楚,不能有混杂。
要选择好可能由于判别的预测变量。这是最重要的一步。当然,在应用中,选择的余地不见得有多大。
要注意数据是否有不寻常的点或者模式存在。还要看预测变量中是否有些不适宜的;这可以用单变量方差分析(ANOVA)和相关分析来验证。判别分析是为了正确地分类,但同时也要注意使用尽可能少的预测变量来达到这个目的。使用较少的变量意味着节省资源和易于对结果进行解释。
判别分析要注意什么?训练样本中必须有所有要判别的类型,分类必29判别分析要注意什么?在计算中需要看关于各个类的有关变量的均值是否显著不同的检验结果(在SPSS选项中选择Wilks’Lambda、Rao’sV、TheSquaredMahalanobisDistance或TheSumofUnexplainedVariations等检验的计算机输出),以确定是否分类结果是仅仅由于随机因素。此外成员的权数(SPSS用priorprobability,即“先验概率”,和贝叶斯统计的先验概率有区别)需要考虑;一般来说,加权要按照各类观测值的多少,观测值少的就要按照比例多加权。对于多个判别函数,要弄清各自的重要性。注意训练样本的正确和错误分类率。研究被误分类的观测值,看是否可以找出原因。
判别分析要注意什么?在计算中需要看关于各个类的有关变量的均值30SPSS选项打开.sav数据。然后点击Analyze-Classify-Discriminant,把group放入GroupingVariable,再定义范围,即在DefineRange输入1-3的范围。然后在Independents输入所有想用的变量;但如果要用逐步判别,则不选Enterindependentstogether,而选择Usestepwisemethod,在方法(Method)中选挑选变量的准则(检验方法;默认值为Wilks’Lambda)。SPSS选项打开.sav数据。然后点击Anal31为了输出Fisher分类函数的结果可以在Statistics中的FunctionCoefficient选Fisher和UnStandardized(点则判别函数系数)
,在Matrices中选择输出所需要的相关阵;为了输出Fishe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《活动管理观念篇》课件
- 《诗歌鉴赏解题技巧》课件
- 2024年农业局振兴农业科技工作总结
- 寒假自习课 25春初中道德与法治八年级下册教学课件 第三单元 第六课 第5课时 国家司法机关
- 某省房屋建筑和基础设施工程标准施工招标文件
- 《诗词赏析》课件
- 2015年高考语文试卷(北京)(解析卷)
- 体育用品销售代表工作总结
- 建筑行业增强施工现场卫生保障
- 《电动力学》课件
- 口腔癌放疗护理
- 护理质量委员会会议
- 2024年护理质量分析
- 2024-2025学年高中物理举一反三专题2.1 简谐运动【八大题型】(含答案)
- EPC模式承包人建议书及承包人实施方案
- 2025人教版九年级英语全册知识点清单
- 2024版 新能源电站单位千瓦造价标准
- 临床医技科室6S管理制度
- 小红书代运营协议模板
- DB11T 1611-2018 建筑工程组合铝合金模板施工技术规范
- 湖南省益阳市2023-2024学年高二上学期普通高中期末质量检测数学试题 含解析
评论
0/150
提交评论