统计软件课程设计_第1页
统计软件课程设计_第2页
统计软件课程设计_第3页
统计软件课程设计_第4页
统计软件课程设计_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东北大学秦皇岛分校统计软件课程设计报告鸢尾花亚属类型的判别分析学院数学与统计学院专业数学与应用数学学号5122121姓名殷晓娟指导教师马世美张子选成绩教师评语:指导教师签字:2014年7月6日叶数学与统计学院课程设计报告叶数学与统计学院课程设计报告第#页datadywh;inputx1-x4group$;cards;Iris-setosa3.01.40.2Iris-setosaIccandiscdata=dywhout=canywh1ncan=2distancesimple;classgroup;varx1-x4;run;goptionsftext='宋体';symbol1cv=redv=squareh=2;symbol2cv=bluev=starh=2;symbol3cv=greenv=doth=2;procgplotdata=canywh1;plotcan2*can1=group;run;procprintdata=canywh1;run;procdiscrimdata=canywh1distancelist;classgroup;varcan1can2;run;procdiscrimdata=canywh1pool=testdistancelist;classgroup;varcan1can2;run;quit;2.2判别结果分析2.2.1距离判别法结果分析1.合并样本组内离差阵和合并样本协方差阵PooledWithin-ClassSSCPMatrixVariablex1x2x3x4x136.9133333313.2744444422.802444445.31577778x213.2744444416.003111117.533333334.75155556x322.802444447.5333333324.659111115.91200000x45.315777784.751555565.912000005.87288889PooledWithin-ClassCovarianceMatrix,DF=132Variablex1x2x3x4x10.27964646460.100563973100402710438x20.10056397310.12123569020.05707070710.0359966330x30057070707100447878788x40.04027104380.03599663300.04478787880.044491582产生的合并样本协方差阵用来计算马氏距离。2.三个亚属间的马氏距离SquaredDistancetogroupFromgroupIris-setIris-verIris-virIris-set088.70237175.34029Iris-ver88.70237016.30151Iris-vir175.3402916.301510从表中可以得出setosa和versicolor的马氏距离为88.70237,setosa和virginica的马氏

距离为175.34029,versicolor和virginica的马氏距离为16.30151。3.线性判别函数的建立LinearDiscriminantFunctionforgroupVariableIris-setIris-verIris-virConstant-79.15786-68.87393-99.95391x121.3610914.1654210.97183x222.511536.319003.16207x3-14.654796.6640914.40262x4-17.251565.3755418.46390从表中可得线性判别函数为:Y(X)=-79.15786+21.36109X+22.51153X-14.65479X-17.25156X11234Y(X)=-68.87393+14.16542X+6.31900X+6.66409X+5.37554X21234Y(X)=-99.95391+10.97183X+3.16207X+14.40262X+18.46390X312344.判别归类结果FromClassifiedObsgroupintogroupIris-setIris-verIris-vir136Iris-set*1.00000.00000.0000137Iris-ver*0.00000.99990.0001138Iris-set*1.00000.00000.0000139Iris-vir*0.00000.00020.9998140Iris-vir*0.00000.01130.9887141Iris-vir*0.00000.00600.9940142Iris-set*1.00000.00000.0000143Iris-ver*0.00000.99990.0001144Iris-set*1.00000.00000.0000145Iris-set*1.00000.00000.0000146Iris-ver*0.00001.00000.0000147Iris-ver*0.00001.00000.0000148Iris-vir*0.00000.02580.9742149Iris-vir*0.00000.00001.0000150Iris-set*1.00000.00000.0000回判结果给出来自三个亚属的135个样品中除第66,79和124外都判对了;对15个待判样品的判别结果为:第1,3,7,9,15五个鸢尾花为setosa,第2,8,10,11,12五个鸢尾花为versicolor,第4,5,6,13,14五个鸢尾花为virginica。

222贝叶斯判别法结果分析1.三个亚属两两配对的组间广义平方距离D(ij)=(X-X)'Cov-i(X-X)+In|Cov|GeneralizedSquaredDistancetogroup

FromgroupIris-setIris-verIris-virIris-set-12.7840494.12685149.85847Iris-ver293.61733-10.831474.06230Iris-vir651.435135.79169-8.86466三个总体的协方差阵不等,故D2GMD2CP2.判别归类结果FromClassifiedObsgroupintogroupIris-setIris-verIris-vir136Iris-set*1.00000.00000.0000137Iris-ver*0.00000.99940.0006138Iris-set*1.00000.00000.0000139Iris-vir*0.00000.00001.0000140Iris-vir*0.00000.00040.9996141Iris-vir*0.00000.00220.9978142Iris-set*1.00000.00000.0000143Iris-ver*0.00000.99990.0001144Iris-set*1.00000.00000.0000145Iris-set*1.00000.00000.0000146Iris-ver*0.00000.99950.0005147Iris-ver*0.00001.00000.0000148Iris-vir*0.00000.09650.9035149Iris-vir*0.00000.00001.0000150Iris-set*1.00000.00000.0000回判结果给出来自三个亚属的135个样品中除第66,79和124外都判对了;对15个待判样品的判别结果为:第1,3,7,9,15五个鸢尾花为setosa,第2,8,10,11,12五个鸢尾花为versicolor,第4,5,6,13,14五个鸢尾花为virginica。与距离判别法的判别结果一致。

2.2.3费希尔判别法结果分析1.典型相关及两个典型变量的A-1B的特征值ApproximateSquaredStandardCanonicalErrorCorrelation0.0026500.9693260.0687560.204097AdjustedCanonicalCanonicalCorrelationCorrelation10.9845440.98418920.4517710.440073EigenvaluesofInv(E)*H=CanRsq/(1-CanRsq)Eigenvalue31.60090.2564DifferenceEigenvalue31.60090.2564Difference31.3444Proportion0.99200.0080Cumulative0.99201.0000LikelihoodApproximateRatioFValueNumDFDenDFPr>F10.02441355174.158258<.000110.02441355174.158258<.000120.7959027811.113130<.0001首先从检验两个典型变量的F统计量判别结果可以看出p值都小于显著性水平所以这两个典型变量存在显著性差异,可以用来讨论总体间的判别问题。其次,从表中可以看出第一大特征值1=31.6009的贡献率达到99.20%,所以用地一个判别函数即可进行很好的判断了。2.Gplot生成的图形图个判别函数即可进行很好的判断了。2.Gplot生成的图形图2.1费希尔判别法Gplot生成图由图也可以看出第一个判别函数就已经能很好的将这些点分类了,显然第二个函数的区分度还很不够。3.判别归类结果FromClassifiedObsgroupintogroupIris-setIris-verIris-vir136ris-set*1.00000.00000.0000137Iris-ver*0.00000.99990.0001138Iris-set*1.00000.00000.0000139Iris-vir*0.00000.00020.9998140Iris-vir*0.00000.01130.9887141Iris-vir*0.00000.00600.9940142Iris-set*1.00000.00000.0000143Iris-ver*0.00000.99990.0001144Iris-set*1.00000.00000.0000145Iris-set*1.00000.00000.0000146Iris-ver*0.00001.00000.0000147Iris-ver*0.00001.00000.0000148Iris-vir*0.00000.02580.9742149Iris-vir*0.00000.00001.0000150Iris-set*1.00000.00000.0000回判结果给出来自三个亚属的135个样品中除第66,79和124外都判对了;对15个待判样品的判别结果为:第1,3,7,9,10,15六朵花为setosa,第2,8,11,12四朵鸢尾花为versicolor,第4,5,6,13,14五朵鸢尾花为virginica。与其他两中判别法只有第10个待判样品的判别结果不同,且与上述Gplot图的结果完全一致。综合以上分析,可以肯定样品3,7,9,15属于setosa,2,8,11,12属于versicolor,4,5,6,13,14属于virginica,而样品10可能属于setosa,也可能属于versicolor,应该根据实际情况判断。结论从文中的判别函数的回判符合率可知,依据三种判别分析法建立的三个总体的判别函数具有很好的准确度,这一结果表明能够依据鸢尾花的花萼和花瓣的长度和宽度建立判别函数对其亚属类型进行判定,这为未知鸢尾花的亚属类型判定以及其分类学地位提供了统计学上的理论依据和发展思路。但是鸢尾花的亚属除了这三类,还有其他很多类亚属,并且其亚属在分类学上划分指标远不止花萼和花瓣的长度和宽度这四项,因此本文中所建立的判别方法并不能在全面的准确的判定某一鸢尾花的所属亚属,还需要扩大其亚属总体数目和采用更多典型的性状指标。在鸢尾花不同亚属和性状指标的涵盖面广且具典型性的情况下建立判别方法和实现的判定结果才是最为准确有效。本文中所建立的判别函数仅适用于某一鸢尾花在是否归属setosa,virginica或versicolor亚属的问题上,才能够凭借花萼和花瓣的长度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论