多元统计分析-实验四_第1页
多元统计分析-实验四_第2页
多元统计分析-实验四_第3页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验四判别分析一、实验内容1、实验目的为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,通过对指标及原 始数据进行判别分析并建立判别函数,判定另外4个待判样品属于哪类。2、实验要求找出较为合适的判别方法,判别待判样品属于哪一类。二、实验报告1、问题提出为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,通过判別分析判 立另外4个待判样品属于哪类。2、指标选择选取以下六项指标:XI: 0岁组死亡概率X2: 1岁组死亡概率X3: 10岁组死亡概率X4: 55岁组死亡概率X5: 80岁组死亡概率X6:平均预期寿命3、数据来源表4-1原始数据XI: 0岁组死亡概率X4: 55

2、岁组死亡概率X2: 1岁组死亡概率X5: 80岁组死亡概率X3: 10岁组死亡概率X6:平均预期寿命组别序号XIX2X3X4X5X6134. 167. 441. 127. 8795. 1969. 30第233. 066. 341.086. 7794.0869. 70一336. 269. 241.048. 9797. 3068.80组440. 1713. 451.4313. 88101.2066. 20550. 0623. 032. 8323. 74112. 5263. 30133.246. 241. 1822. 90160. 0165. 40第232. 224.221.0620. 70124.

3、 7068. 70二341. 1510. 082. 3232. 84172. 0665. 85组453. 0425. 744. 0634.87152. 0363. 50538. 0311.206. 0727. 84146. 3266. 80134. 035.410. 075. 2090. 1069. 50第232. 113. 020. 093. 1485. 1570. 80三344. 1215. 121.0815. 15103. 1264. 80组454. 1725. 032. 1125. 15110. 1463. 70528. 072.010. 073. 0281.2268. 30待150.

4、 226. 661.0822. 54170. 6065. 20判234. 647. 331. 117. 7895. 1669. 30样333.426. 221. 1222. 95160. 3168. 30品144. 0215. 361.0716. 45105. 3064. 204、数据处理经观察分析,表中数据没有错误值或是缺失值,因此不需要进行处理。5、操作步骤表4-2序号X1x2x3x4x5x6group134. 167.441. 127. 8795. 1969.31233. 066. 341.086. 7794. 0869.71336. 269. 241. 048. 9797.368.81

5、410. 1713.451. 1313. 88101.266.21550. 0623. 032.8323. 74112. 5263.31633. 246. 241. 1822.9160. 0165.42732. 224.221.0620.7124.768.72841. 1510. 082. 3232. 84172. 0665. 852953. 0425. 741. 0634. 87152. 0363.521038. 0311.26. 0727. 84146. 3266.821131. 035. 110. 075.290. 169.531232. 113. 020. 093. 1185. 157

6、0.831344. 1215. 121.0815. 15103. 1261. 831454. 1725. 032. 1125. 15110. 1463.731528. 072.010. 073. 0281.2268.33150. 226. 661.0822. 54170.665.2234. 647. 331. 117. 7895. 1669.3333. 426. 221. 1222. 95160. 3168.3444.0215. 361.0716. 45105.364.2(1)按照表4-2把数据输入SPSS数据表中。(2)通过单击Analyze-*Classify-*Discriminant展

7、开判别分析对话框(3)选择group这个变虽:为被解释变量,移到Grouping Variable (分组变戢)框中, 打开Define Range,在Minimum后填1,在Maximum后填3,表示分为三组;选择xl、x2、 x3、x4、x5、x6这六个变量为解释变虽:,移到Independents框中。再点选Enter independents together (全部变量进入)单选按钮。(4) 选择要求输出的统讣疑。在主对话框中单击Statistics按钮,展开统计量选择对 话框,选择描述统汁量MeanstUnivariate ANOVAs函数选择Fisher函数和Unstandard

8、ized(非标准化函数)9矩阵选择Within-groups correlation,单击Continue返回主对话框。(5) 在主对话框中单击classify按钮,展开分类选择对话框,选择先验概率(All groups equal,所有组相等或根据组的大小计算概率);子选项(display)中选择每个个体的结果(Casewise results),综合表(Summary Table)和"留一个在夕卜(Leave-one-out classification)的验证原则:协方差矩阵选择Within-groups;作图选择Combined-groups。(6) 单击保存(Save)选项

9、,可以选择保存预测的分类(Predicted group membership)x 判别得分(Discriminant scores)以及所属类别的概率(Probabilities of group membership )o(7) 在主对话框中单击OK,提交运行。得到结果部分如下表4-3至表4-8。表4-3各组均值相等的检验Tests of Equality of Group MeansWilks* LambdaFdfldf2Sig0岁组死亡概率.997.019212.9811岁组死亡概率.990.061212.94110岁组死亡概率.6453. 301212.07255岁组死亡概率.438

10、7. 690212.00780岁组死亡概率17428. 557212.000平均预期寿命.926.478212.631表4-4贝叶斯判别函数的有效性检验Wilks" LambdaTestofFunction(s)Wilks* LambdaChi-squaredfSig.1 through 2.01043. 94812.0009.5914. 9995.416表4-5非标准贝叶斯判别函数的系数Canonical Discriminant Function CoefficientsFunction120岁组死亡槪率-1.950- 8781岁组死亡槪率1.7481. 16910岁组死亡概率-

11、 930- 36555岁组死亡概率.825- 08630岁组死亡概率102 054平均预期寿命1.662.706(Constant)-78. 896-30. 330Unstandardized coefficients表4-6类中心Functions at Group CentroidsgroupFunction121-2.6471.01329.444-.2593-6.797-.754Unstandardizedcan onicaldiscriminant functions evaluated atgroup means表4-7各类的分类函数的系数Classification Functio

12、n Coefficientsgroup1230岁组死亡概率-159. 015-181.479-149. 3701岁组死亡概率168. 068187.715158. 74910岁组死亡概率-98. 413-109. 195-93. 90855岁组死亡概率58.21768. 29654. 94880岁组死亡概率11.70212. 86211. 185平均预期寿命202. 770221.972194.625安徽大学经济学院2010级经济统il(Constant)-5628. 382-6584. 377-5266. 780Fisher* s linear discriminant functions表

13、4-8预测分类结果小结Classification Results1groupPredicted Group MembershipTotal123OriginalCount150052050530055Ungrouped cases1124K1100.000100.020100.0.0100.03.00100.0100.0Ungrouped cases25.025.050.0100.0a. 100.0% of original grouped cases correctly classified6、结果分析(1) 表4-3是各组均值相等的检验结果。可以看出:在5胡勺显著性水平下,接受变量 “0

14、岁组死亡概率”、“1岁组死亡概率”、“10岁组死亡概率”和“平均预期寿命”在三组的均值相等的假设,拒绝变量“55岁组死亡概率”和“80岁组死亡槪率”在三组的均值 相等的假设。由此知道进一步的输出结果分析均是有意义的。(2) 表4-4为贝叶斯判别函数的有效性检验的结果。有最后一列Sig. (1 through 2) =0.000<0.01与Sig. (0.417) >0.05知道第一个判别函数具有统计显著性即第一个判别函数能 够很好地将两类区分开,而第二个判别函数不具有统计显著性。(3) 表4-5给出了未标准化的贝叶斯判别函数的系数。从表中可以得出两个判别函数: yl=-78. 89

15、6 - 1.950x1 + 1. 748x2 - 0. 930x3 + 0. 825x4 + 0. 102x5 + 1. 662x6y2二-30. 330 - 0. 878x1 + 1. 169x2 - 0. 365x3 - 0. 086x4 + 0. 054x5 + 0. 706x6(4) 表4-6反映标准贝叶斯判别函数在各组的重心。根据结果,第一组重心为(-2. 647, 1.013),第二组重心为(9. 444, -0.259),第三组重心为(-6. 797, -0.754)。未标准化 的贝叶斯判别函数中心值在各变量均值处°(5)表4-7用判别函数对观测量分类的结果,显示了费歇

16、线性判别函数的系数。根据 系数表可以总结出各类判别函数如下:第一组:人二-159. 015x1+168. 068x2-98. 413x3+58. 217x4+11. 702x5+202. 77x6-5628. 382第二组:F:=-181. 479x1+187. 715x2-109. 195x3+68. 296x4+12. 862x5+221. 972x6-6584. 377第三组:Ff-149. 370x1+158. 749x2-93. 908x3+54. 948x4+11. 185x5+194. 625x6-5266.78可以根据上述分类函数汁算出每个观测在各组的分类函数值,然后将观测分类

17、到具有最 大分类函数值的类别中。(6)表4-8是预测分类的小结,是一个判别回代小结。可以看岀,通过判别函数预测, 15个观测是分类都是正确的,即已知所属类别的回判准确率为100%.另外4个待判样品有 一个分到第一个,一个分到第二组,两个分到第三组。由此作出已知样品回判结果表,如下 表 4-9。表4-9已知样品回判结果序号原属分类 号判别函数值及归类正误判标志(正=0:误=1)费歇判别贝叶斯判别判别分类号11-2.19691. 374621021-2. 291781. 386441031-2. 781871. 330121041-3. 28940. 627811051-2. 676810. 3463910629. 939230.2194420728. 59391-0. 59376208210. 33167-2. 5397220928. 627391. 77083201029. 72776-0. 1509420113-6.90099-0.40576

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论