判别分析实验报告SPSS_第1页
判别分析实验报告SPSS_第2页
判别分析实验报告SPSS_第3页
判别分析实验报告SPSS_第4页
判别分析实验报告SPSS_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、实验目的及要求:1、目的用SPSS软件实现判别分析及其应用。2、内容及要求 用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数并判定宿州、广安等13个地级市分别属于哪个管理水平类型。二、仪器用具:仪器名称规格/型号数量备注计算机1有网络环境SPSS软件1三、实验方法与步骤:准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中,同时,由于只有当被解释变量是属性变量而解释变量是度量变量时,判别分析才适用,所以将城市管理的7个效率指数变量的变量类型改为“数值(N)”,度量标准改为“度量(S)”,以备接下来的分析。四、实验结果与数据处理:表1

2、 组均值的均等性的检验Wilks 的 LambdaFdf1df2Sig.综合效率标准指数.58223.022264.000经济效率标准指数.40646.903264.000结构效率标准指数.9541.560264.218社会效率标准指数.7968.225264.001人员效率标准指数.34261.645264.000发展效率标准指数.30871.850264.000环境效率标准指数.9133.054264.054表1是对各组均值是否相等的检验,由该表可以看出,在0.05的显著性水平上我们不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,即认为除了结构效率标准指数和环境效率标准指

3、数外,其余五个标准指数在三组的均值是有显著差异的。表2 对数行列式group秩对数行列式16-33.41026-33.17736-40.584汇聚的组内6-32.308打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。表3 检验结果箱的 M140.196F近似。2.498df142df21990.001Sig.000对相等总体协方差矩阵的零假设进行检验。以上是对各组协方差矩阵是否相等的BoxM检验,表2反映协方差矩阵的秩和行列式的对数值。由行列式的值可以看出,协方差矩阵不是病态矩阵。表3是对各总体协方差阵是否相等的统计检验,由F值及其显著水平,在0.05的显著性水平下拒绝原假设,认为各总

4、体协方差阵不相等。1)Fisher判别法:图一图二表4 特征值函数特征值方差的 %累积 %正则相关性13.763a75.075.0.88921.257a25.0100.0.746a. 分析中使用了前 2 个典型判别式函数。表5 Wilks 的 Lambda函数检验Wilks 的 Lambda卡方dfSig.dimension01 到 2.093146.04212.0002.44350.0535.000表4反映了判别函数的特征值、解释方差的比例和典型相关系数。第一判别函数解释了75%的方差,第二判别函数解释了25%的方差,它们两个判别函数解释了全部方差。表5是对两个判别函数的显著性检验,由Wil

5、ksLambda检验,认为两个判别函数在0.05的显著性水平上是显著的。表6 标准化的典型判别式函数系数函数12综合效率标准指数-.228-.578经济效率标准指数.566.404结构效率标准指数.097.472社会效率标准指数.378.233人员效率标准指数-.3281.099发展效率标准指数.621.675表7 结构矩阵函数12发展效率标准指数.752*.305经济效率标准指数.611*.222综合效率标准指数.426*.170社会效率标准指数.261*-.001环境效率标准指数a.141*-.129人员效率标准指数-.547.797*结构效率标准指数.070-.156*判别变量和标准化典

6、型判别式函数之间的汇聚组间相关性 按函数内相关性的绝对大小排序的变量。*. 每个变量和任意判别式函数间最大的绝对相关性a. 该变量不在分析中使用。表6为标准化的判别函数,表7为结构矩阵,即判别载荷。由判别权重和判别载荷可以看出发展效率标准指数、经济效率标准指数对判别函数1的贡献较大,而人员效率标准指数对判别函数2的贡献较大。表8 典型判别式函数系数函数12综合效率标准指数-5.216-13.231经济效率标准指数5.1683.688结构效率标准指数.9994.848社会效率标准指数4.8773.011人员效率标准指数-3.31911.138发展效率标准指数7.1457.774(常量)-1.36

7、3-6.424非标准化系数表9 组质心处的函数group函数12dimension01-.210-.73023.9641.2633-2.7251.905在组均值处评估的非标准化典型判别式函数表8为非标准化的判别函数,我们可以根据这个判别函数计算每个观测的判别Z得分。表9反映判别函数在各组的重心。根据结果,判别函数在group=1这一组的重心为(-0.210,-0.730),在group=2这一组的重心为(3.964,1.263),在group=3这一组的重心为(-2.725,1.905)。这样,我们就可以根据每个观测的判别Z得分将观测进行分类。表10 组的先验概率group先验用于分析的案例未

8、加权的已加权的dimension01.3334646.0002.3331010.0003.3331111.000合计1.0006767.000表11 分类结果b,cgroup预测组成员合计123初始计数14600462010010320911未分组的案例63312%1100.0.0.0100.02.0100.0.0100.0318.2.081.8100.0未分组的案例50.025.025.0100.0交叉验证a计数1450146219010320911%197.8.02.2100.0210.090.0.0100.0318.2.081.8100.0a. 仅对分析中的案例进行交叉验证。 在交叉验证

9、中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。b. 已对初始分组案例中的 97.0% 个进行了正确分类。c. 已对交叉验证分组案例中的 94.0% 个进行了正确分类。表10为各组的先验概率,在分类选项中选择的是所有组的先验概率相等。表11为分类矩阵表,这里交叉验证是采用“留一个在外”的原则,即每个城市是通过除了这个城市以外的其他城市推导出来的判别函数来分类的。由该表可以看出,通过判别函数预测,有65个城市是分类正确的,其中,group=1组46个城市全部被判对,group=2组的10个城市也全部被判对,group=3组11个城市中有9个被判对,即有97%的原始城市被判对。在

10、交叉验证中,三组中分别有45、9、9个城市被判对,交叉验证有94%的城市被判对。图三图三为分类结果图,从图中可以看到第2组与第3组可以很清晰地分开,与第1组也能分开,而第3组和第1组存在重合区域,即存在误判。同时,根据对待判城市的判别可以看出:在13个待判城市中,宿州、广安、河地被判到了第3组,佛山、苏州、东营被判到了第2组,咸阳、盘锦、汉中、保定、宝鸡、衡阳被判到了第1组,而以纯由于只有环境效率标准指数的值,其他变量值确实,系统未对其进行判别。2)贝叶斯判别法:图四图五贝叶斯判别法输出的结果与Fisher判别法很大程度上是一致的,这里不再列出。表12 组的先验概率group先验用于分析的案例

11、未加权的已加权的dimension01.6874646.0002.1491010.0003.1641111.000合计1.0006767.000表13 分类函数系数group123综合效率标准指数-89.225-137.370-110.980经济效率标准指数18.31847.23615.041结构效率标准指数112.414126.246122.679社会效率标准指数61.50987.86457.179人员效率标准指数77.41985.768115.125发展效率标准指数57.663102.98060.184(常量)-46.457-74.840-66.632Fisher 的线性判别式函数表12为

12、各族的先验概率,在分组选项中选择的是“根据组大小计算”。表13展示了每组的分类函数,也称费歇线性判别函数,由表中的结果可以说明:group=1这一组的分类函数为:=- 46.457-89.225综合效率标准指数+18.318经济效率标准指数+112.414结构效率标准指数+61.509社会效率标准指数+77.419人员效率标准指数+57.663发展效率标准指数其他两组的分类函数同样可以写出,我们可以根据每个城市在各组的分类函数值然后将城市分类到较大的分类函数值中。表14为贝叶斯判别的分类结果,其交叉验证有95.5%的城市被判对,这一概率比Fisher判别要高。表14 分类结果b,cgroup预

13、测组成员合计123初始计数14600462010010320911未分组的案例63312%1100.0.0.0100.02.0100.0.0100.0318.2.081.8100.0未分组的案例50.025.025.0100.0交叉验证a计数1460046219010320911%1100.0.0.0100.0210.090.0.0100.0318.2.081.8100.0a. 仅对分析中的案例进行交叉验证。 在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的。b. 已对初始分组案例中的 97.0% 个进行了正确分类。c. 已对交叉验证分组案例中的 95.5% 个进行了

14、正确分类。 五、讨论与结论(1)由前面的分析我们知道,协方差矩阵并不相等,考虑采用分组协方差矩阵。在分类中使用协方差矩阵“分组(P)”,其他选择同上,得到分类结果表如下。分类结果agroup预测组成员合计123初始计数144024620100103001111未分组的案例63312%195.7.04.3100.02.0100.0.0100.03.0.0100.0100.0未分组的案例50.025.025.0100.0a. 已对初始分组案例中的 97.0% 个进行了正确分类。可以看出这个结果与采用组内协方差矩阵的预测效果没有明显的差别,而且分类结果图与图三也没有很大的差异,因此,可以采用组内协方

15、差矩阵来进行判别。(2)之前的分析是采用“一起输入自变量”的方法,由表1可知,在0.05的显著性水平上不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,考虑“使用步进式方法”,最终确定进入分析的变量有3个:经济效率标准指数、人员效率标准指数、发展效率标准指数,上表给出了最终的分类结果,可以看出,在原有数据的所有城市中,有95.5%的城市被判对,在交叉验证中有92.5%的城市被判对。没有“一起输入自变量”时的效果好,但是在最终对待判城市的分组问题上,两种方法所得到的结果是一致的,在这里两种方法的选择对我们所需要的结果影响不是很大!分类结果b,cgroup预测组成员合计123初始计数14510462010010320911未分组的案例63312%197.82.2.0100.02.0100.0.0100.0318.2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论