SAS期末论文-聚类分析-判别分析_第1页
SAS期末论文-聚类分析-判别分析_第2页
SAS期末论文-聚类分析-判别分析_第3页
SAS期末论文-聚类分析-判别分析_第4页
SAS期末论文-聚类分析-判别分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计软件》课程

期末论文系(院):理学院专业:数学与应用数学班级:学生姓名:学号:指导教师:耿兴波开课时间:2012-2013学年一学期#SAS垂统TheDISCRIMProcedureLinearDiscrirr11nantFunctionSAS东•凱2l〕l〕4年12月19曰星期日下干11〕时10分18秒28L;已「归「aliz已d:SquaredDista.「i匚:已Fli「i匚:tid「iF9:m:t已norPrubatuIityotMernbershipinEachTypeLltjEELESlt1匚|「1总andF'erc已「itCassitledErroriJouritEstimatesTutau,r:-:HyLi.yy-iH0.3333Fi」nctionVariableLabelABCConstsint芯片圾微动-715.87505-846.47445-562.79760Chips50.3631653.9934044.64945Driver44.2241644.6504736.43071Game游戏性27.9183935.1287627.33565LinearDiscriminantFuric11onturTypeTheDISCRIMProcedureCIassificationSummaryforCalibrationData:MYLIB.MOUSEDISCRIMResubs11tutionSummaryusingLinearDiscriminantFunc11onPr-(iX)=exp(-_5D(X):)/SUMexpt-.5D(>O::iTheDISCRIMProcedureL:Iass11i匚迅11an:SurnniarytorFWw;i」l:wtitutionyunimaryCalibrationData:MYLIB.MOUSEDISCRIMusingLi「i已3「DiscriminantFunc11□「[TypeABCTotal101250.000.0050.00100.00A5005100.000.000.00100.00B03030.00100.000.00100.00C00550.000.00100.00100.00Total6361540.0020.0040.00100.00Priors0.333330.333330.333332004^12月19tl星期b下干10HT10分18秒30TheDISCRIMProcedureL:lassificationSummaryforCalibrationData:MYLIB.MOUSEDISCRIMF:已substitutionyumrnaryusingLi「i已迅「DiscrirninaritLIJJIJUIJSTEPDISC过程命令针对具有一个分类的变量和若干数值型的数据集,STEPDISC过程执行逐步判别分析的操作,从指定的指标变量中筛选出一组变量,以便于判别分析。Procstepdisc常用的语法格式:Procstepdisc<选项列表>;Class<变量>;Var<变量〉;Run;stepdisc常用选项及说明:Data=指定输入数据集,可为一般的类型,也可为其他特殊的类型(CORR、COVARIANCE、CSSCP、SSCP)HETHOD=指定筛选变量的方法,也可是FORWARD、BACKWARD和STEPWISE,默认为STEPWISESLENTRY=指定变量进入模型须达到的显著性水平,默认为0.15SLSTAY=指定模型内部的变量继续留在模型中(不被剔除)须达到的显著性水平,默认为0.15PR2ENTRY=指定变量进入模型须达到的平方偏相关系数值,此值必须小于等于1PR2STAY=指定模型内部的变量继续留在模型中(不被剔除)须达到的平方偏相关系数值,默认为0.15DISCRIM过程命令SAS中的procdiscrim(判别归类过程)可以实现:距离判别法,贝叶斯(Bayes)判别法,Fisher判别法(典型判别)。在procdiscrim中,当各总体为正态总体是,距离判别是Bayes判别的特殊形式。procdiscrim常用语法格式:PROCDISCRIM<options>;CLASSvariable;PRIORSprobabilities;VARvariables;discrim常用选项及说明:data=指定欲分析的数据集testdata=指定待判数据集,其中必须有“var”语句指定的所有判别变量。同时,还可使用“testout=”和“testoutd=”选项指定存储分类结果和组密度估计的数据集。out=指定生成一个数据集,其包含来自“data=”的所有数据、每个观测来自不同组的后验概率及判别结果。outstat=指定生成一个数据集,其包含分析过程中的各个统计量。manova各总体均值差异的显著性检验。对于k各已知总体,若,那么k个总体是不可区分的,判别分析就失去了意义。所以需进行差异显著性检验。method=normal|npar指定参数或非参数判别法。normal参数法为缺省项。参数方法:假定每组都服从多元正态分布,采用广义平方距离的量度得出判别函数或分类准则,其是基于组内协差阵或合并协差阵的。非参数方法:不要求正态分布,其基于组概率密度,采用核方法或k最近邻方法得到非参数估计。缺省条件下,procdiscrim认为个总体皆为正态总体,采用参数判别法。当我们不能确定各总体为正态时,一般应该有非参数判别法。pool=yes|no|test决定计算马氏距离时协差阵的选取。使用马氏距离进行判别时,需要估计总体协差阵;实际判别问题中,一般只知道来自k个总体的样本总体的样本,而不知道各总体均值和协差阵。当时用合并样本协差阵估计总体协差阵。当不全相等时,用组内样本协差阵估计总体协差阵。选项yes为默认,要求用合并样本协差阵PCOV(pooledcovariances);选项no要求用组内协差阵WCOV(withincovariances);选项test要求进行协差阵齐性检验:可以通过“slpool=”选项(默认slpool==0.10)指定显著性水平,若齐性成立相当于选项“yes”,若齐性不成立相当于选项“no”。crosslist对每个训练样本,在output中输出交叉确认判别结果。crosslisterr仅对训练样本中交叉确认的错误观测,在output中输出其交叉确认的结果。crossvalidata指定交叉确认判别。交叉确认的想法是,为了判断对观测i的判别正确与否,用删除第i个观测的数据集算出判别规则,然后用次判别函数来判别第i个观测threshold=p指定Bayes判别时可接受的最小后验概率,如果系新样本归入组别的最大后验概率小于P,则将其归入other组(不能判别),缺省为p=0。r=指定非参数法时核估计的核半径。kernel=uniform|normal|epanechnikov|biweight|triweight指定核函数,缺省值为uniform均匀核密度函数。k=指定非参数法时k最近邻估计的最邻近个数。canonical指定进行典型判别分析(即Fisher判别)。CANDISC过程命令CANDISC过程是专用于典则判别分析的SAS过程。CANDISC过程语句的一般格式:PROCCANDISC<选项列表>CLASS<变量>;VAR<变量>;RUN;CANDISC常用选项及说明:DATA=指定由CLUSTER过程生成的OUTTREE=数据集作为输入的数据集OUT=指定一个输出数据集,其中包含输入数据集的全部的数据和典则变量评分OUTSTAT=指定一个CORR类型的输出数据集,其中包含各个种类的各种统计量NCAN=指定需要计算的典则变量的个数,设置值必须小于VAR变量,此选项若设置为0,结果中仅包含典则相关的信息,典则结构、典则系数、典则变量的均值均不显示PEFIX=指定输出数据集中典则变量名称的前缀,默认为CAN,此选项中隐含包含了对CANONICAL选项的设置结果分析从输出结果可以看出,典型变量Z和Z作为原始变量的组合,集中了原始变量的绝大部分信息,并很好地概括了各组别之间的差异。典型判别是一种很好的降维技术,它用少量的典型变量代替原始变量,把样品分组情况直观地表现了出来。总结判别分析与聚类分析的联系与区别:首先,都要求对样本进行分类,但分析的内容和要求不一样。聚类分析事先并不知道存在什么类别,完全按照反映对象特征的数据把对象进行分类。判别分析是在事先有了某种分类标准之后,判定一个新的研究对象应该归属到哪一类别。其次,思想和方法相同。因为在判别分析中,决定某一样本应属于哪一类时,往往也使用某些聚类分析中的一些思想方法。最后,两者往往结合起来使用,当分类不清楚时,可以先用聚类分析对原有样品进行分类,然后再用判别分析建立判别函数以对新样品进行归类。感谢由于我的知识水平有限、经验的不足,报告的完成很不完美,还望老师见谅。在已经完成的内容中,还存在着许多不尽人意的地方。但是通过这次对SAS软件的运用,我进一步了解了《统计软件》这门课程,加深了对书本知识的理解。另外在这门课的学习过程中,当我碰到不明白的问题时,耿老师总是耐心的讲解,给我以极大的帮助,使我获益匪浅。因此非常感谢老师的教导

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论