




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通第八章第八章 判别分析判别分析l 判别分析简介l 普通判别分析l 典型判别分析l 逐渐判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通一、判别分析简介一、判别分析简介 判别分析是一种运用性很强的统计方法。它通常是根据已有的数据资料,来建立一种判别方法,然后再来判别一个新的样品归属于哪一类。 例如,医院拥有以往就诊的各种病人的资料,包括他们的心率、血压、体温、化验目的等很多数据。如今有一个新的病人来医院就诊,对他也丈量了相关的目的数据,要判别他患有哪一种病,这就属于一个判别归类的问题。又如,在矿产勘探中积累了丰富
2、的地质资料,如今某地域新采到了一个岩石标本,要从它的根本特征判别该地域有无矿产,是贫矿还是富矿,那么也需求进展判别分析。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、普通判别分析二、普通判别分析1、间隔、间隔 判别法判别法 间隔 判别法是经过计算间隔 函数来进展判别,即样品与哪个总体之间的间隔 最近,那么判别它属于哪个总体。如何衡量样品与总体间的这种笼统的间隔 ?我们普通利用马氏间隔 来描画。 SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、普通判别分析二、普通判别分析2、Bayes判别法判别法 前一节引见间隔 判别法非常简便适用,但是也存在一些缺陷。例如
3、,间隔 判别法没有思索到关于总体的先验概率,而且没有思索能够出现错判而带来的损失。Bayes判别法正是为了抑制这些缺陷而提出来的一种判别方法。 Bayes判别法是基于Bayes统计的思想,即假定事先对所研讨的对象有一定的了解,并经过先验概率分布来进展描画,当抽取样本后,用样本来修正先验概率分布,并得到后验概率分布,然后根据后验概率分布进展各种统计推断。 Bayes判别法首先计算给定样品属于各个总体的条件概率,然后比较这些概率值的大小,将样品判归于条件概率最大的总体。 SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通普通判别分析普通判别分析DISCRIM过程过程PROC DISCR
4、IM DATA=数据集名 ; CLASS 分类变量名; VAR 变量名列表; PRIORS 概率值; BY 分组变量名;RUN;SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通普通判别分析普通判别分析DISCRIM过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通普通判别分析普通判别分析DISCRIM过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、普通判别分析二、普通判别分析3、DISCRIM过程过程语句阐明: 1PROC语句用于规定开场运转DISCRIM过程并指定要分析的数据集名。选项有: TESTDATA=数据集名指定需求进展分类
5、的观测组成的数据集。该数据集中定量变量的称号必需和DATA=数据集中的定量变量的称号相匹配。 METHOD=选项规定进展分类的方法。 LIST规定对每个观测显示重新分类的结果。 TESTLIST规定显示TESTDATA=数据集中观测的分类结果。 SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、普通判别分析二、普通判别分析3、DISCRIM过程过程 2CLASS语句用于规定分类变量,可以是数值型变量也可以是字符型变量。分类变量的不同取值那么代表了不同的类别。 3VAR语句用于规定要分析的定量变量。假设不运用此语句,那么默许分析数据集中一切的数值型变量。 4PRIORS语句用于规
6、定各类别的先验概率。 5BY语句规定了分组变量,它使得BY过程对分组内进展处置。在运用BY语句前,应对数据集按照分组变量进展排序。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通三、典型判别分析三、典型判别分析1、Fisher判别法判别法 典型判别分析采用了与主成分分析和典型相关分析类似的降维技术,以找到能最好概括类别区分的变量的线性组合。降维时要求同一类中的区别尽能够小,而不同类间的区别尽能够大。 SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析CANDISC过程过程PROC CANDISC DATA=数据集名 ; CLASS 分类变量名;
7、 VAR 变量名列表; BY 分组变量名;RUN;SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析CANDISC过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析CANDISC过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析DISCRIM过程过程PROC DISCRIM DATA=典型变量数据集; CLASS 分类变量名; VAR 典型变量名;RUN;SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通四、逐渐判别分析四、逐渐判别分析1、根本原理、根本原理
8、逐渐判别分析调查了p维目的即p个变量对总体的区分才干能否显著,对判别分类不起作用的变量那么予以删除,优化了判别的效果。 逐渐判别的根本思想与我们在上一章引见的逐渐回归类似:在建立判别函数时逐个引入变量,每一步选择都一个判别才干最显著的变量进入判别函数,同时对已有的变量也进展检验,将不显著的变量剔除。直到在可选的变量中,既没有变量被选入也没有变量被删除为止。这样在最后得到的判别函数中,一切变量都是显著的。经过运用逐渐判别法,提高了判别样品的才干,也加强了判别函数的稳定性。 SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程PROC STEPDISC DATA=
9、数据集名 ; CLASS 分类变量名; VAR 变量名列表; BY 分组变量;RUN;逐渐判别分析逐渐判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程逐渐判别分析逐渐判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程逐渐判别分析逐渐判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程逐渐判别分析逐渐判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通2、STEPDISC过程过程语句阐明: 1PROC语句用于规定运转STEPDISC过程,并指定要分析的数据集名。选项有: METHOD=选项规定对判别函数中的变量进展选择的方法。 2CLASS语句用于规定分类变量,可以是数值型变量也可以是字符型变量。分类变量的不同取值那么代表了不同的类别。 3VAR语句用于规定要挑选的定量变量。假设不运用此语句,那么默许挑选数据集中一切的数值型变量。 4BY语句规定了分组变量,它使得BY过程对分组内进展处置。在运用BY语句前,应对数据集按照分组变量进展排序。 四、逐渐判别分析四、逐渐判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沙头角中学2025届高三二诊模拟考试化学试卷含解析
- 甘肃省天水市秦安县一中2025届高考化学五模试卷含解析
- 2024年CPMM认真备考试题及答案
- 2025届吉林省长春九台市师范高级中学高三二诊模拟考试化学试卷含解析
- 职业院校教材管理实施细则(试行)
- 2024年CPSM考试模拟练习试题及答案
- 2025年有线电视光学设备(光发射接收机等)项目发展计划
- 浙教版 2021-2022学年度八年级数学上册模拟测试卷
- 深度探讨CPMM知识点的试题及答案
- 滨州七年级英语数学试卷
- 消防应急疏散演练课件
- hsk5-成语学习知识
- GB/T 16799-2018家具用皮革
- 南京市2018小升初简历
- 重症感染与抗生素的选择课件
- 截流式合流制管道系统的特点与使用条件课件
- 应急管理工作检查记录表
- 四年级下册英语课件:Unit 4 There are seven days in a week-Lesson 19人教精通版
- 千分尺公开课教案
- 加油站承重罐区安全风险及管理
- 箱变施工安全文明保证措施
评论
0/150
提交评论