误差分析课件 数据判别分析_第1页
误差分析课件 数据判别分析_第2页
误差分析课件 数据判别分析_第3页
误差分析课件 数据判别分析_第4页
误差分析课件 数据判别分析_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据判别分析 第一部分:原理介绍,判别分析概念及应用,概念 应用,判别分析概念,在自然科学与社会科学等众多领域中,研究对象往往用某种方式已划分为若干类型,当得到一个新的样品,要确定该样品属于已知类型的哪一类,这类问题就属于判别分析.,判别分析的应用,在工业生产中判断产品的等级; 在经济发展中判断一个国家经济发展程度; 医学中根据化验结果判断病人的疾病类型等.,相似性测度,判断样品之间的相似性常采用近邻准则,就是把待分类样品与标准模版进行比较,看和哪个模版匹配程度更好,从而确定待测样品的分类。 计算模式相似性测度有欧式距离、马氏距离、夹角余弦距离、Tanimoto测度等多种距离算法。,近邻准测分

2、类的两种计算方法,1 通过与样品库所有样品特征分别作相似性测度,找出最接近的样品,取该样品所属类别作为待测样品的类别。 2 待测样品与样品库中不同类别的中心或重心作相似性测度,找出最接近类的中心,以该类作为待测样品的类别。,距离算法,样品与样品之间的距离 样品与类之间的距离 类内距离 类与类之间的距离,样品间距离示意图,同类内样品间的距离 不同类内样品间的距离,样品与样品之间的距离,A: B:,样品间的距离计算公式,样品与类之间的距离,W为代表某类样品的集合,其中有n个样品,x为待测样品。,样品与类的距离的计算方法,1 计算待测样品和类中每个样品之间的距离后求平均值。 2 计算类的中心点,以类

3、中所有的样品特征的平均值作为类的中心,然后计算待测样品到中心点的距离。,类内距离,同一个类内任意样品之间距离之和的平均值,类与类之间的距离,最短距离法、最长距离法、重心法、平均距离法,数据判别的方法模版匹配,把未知样品和一个标准模版相比,看它们是否相同或者相似。 两类别 多类别,两类别,有两个标准样品模版为A和B,其特征向量分别为X和Y,任何一个待识别的样品为M,可以用距离判别来判断它属于A或者B,如果M和A的距离近则属于A,否则属于B。这就是最小距离判别法。,多类别,多种类别,每类有N个样品,计算待测样品到各类中心的马氏距离,比较各距离,取最小的距离值,则待测样品就属于该类。,马氏距离,在判

4、别分析中最常用到马氏距离,此方法考虑到了欧式分布中没有考虑到的总体分布的分散性信息。 设x,y是来自均值向量为 、协方差矩阵 的总体G的两个样品,则x,y之间的马氏距离是 而两个总体G1和G2,其均值向量分别为和 ,G1和G2的协方差距阵相等,皆为 ,则总体G1和G2间的马氏距离是,马氏距离的性质,1 2 3,马氏距离判别的合理性,设G1为正态总体 它们的概率密度为:,G2为正态总体,马氏距离判别的合理性,两个总体的协方差矩阵相等,对于新产品X,要判别X属于哪个总体,根据统计学似然比准则,很自然应将X判归在该样品观测处其概率密度较大的那个总体。 即有下列判别准则:,马氏距离判别的合理性,而 的

5、充分必要条件是: 即, (马氏距离)因此,当两个总体G1和G2为正态总体且其协方差矩阵相等时,采用马氏距离判别准则和似然比准则时一致的。,具体讨论两个总体协方差矩阵相等或不等的情况,1当两个总体协方差矩阵相等时,考虑样品X到两总体的马氏平方距离的差:,具体讨论两个总体协方差矩阵相等或不等的情况,记 则,具体讨论两个总体协方差矩阵相等或不等的情况,这样,距离判别准则化为 其中W1和W2都是线性判别函数,在实际问题中,通常以来自总体的训练样本的均值和协方差来估计线性判别函数。,具体讨论两个总体协方差矩阵相等或不等的情况,2 当两个总体协方差矩阵不等的时候,多个总体的距离判别,N个总体均值向量和协方

6、差矩阵已知,计算待测样品X到各总体的马氏距离,比较这N个距离,判断X属于其马氏距离最小的总体,如果最小距离在不止一个总体达到,则可将X判给具有最小距离总体的任何一个。,判别准则的评价,1 误判率回代估计法 2 误判率的交叉确认估计法,误判率回代估计法,设G1和G2为两个总体,容量分别为n1、n2,以全体训练样本作为n1n2个新样品,逐个代入已建立的判别准则中判别其归属。,误判率回代估计法,其中n12是将属于G1的样品误判为属于G2的个数,n21是将属于G2的样品误判为属于G1的个数,总的误判个数是n12n21,而总体n1n2,误判率回代估计为,误判率的交叉确认估计法,误判率的交叉估计确认估计是

7、每次剔除训练样本中的一个样品,利用其余容量为n1+n2-1的训练样本建立相应的判别准则,再用所建立的判别准则对剔除的那个样品作判别。对训练样本中的每个样品作上述分析,以其误判的比例作为误判概率的估计。,误判率的交叉确认估计法步骤,从总体G1的容量为n1的训练样本开始,依次剔除其中一个样品,用剩余的容量为n11的训练样本和总体G2的容量为n2的训练样本建立相应的判别函数。 用建立的判别函数对剔除的那个样品作判别 重复以上步骤,直到G1的训练样本中的n1的样品依次被剔除,记录其误判的样品个数 对G2重复以上步骤,确定误判率。,两种误判率确认方法的比较,误判率的交叉确认估计法,所得到的估计称为误判率

8、的交叉确认估计,此方法较回代法更合理,但计算量较大。 误判率的回代估计法作出的误判率是建立判别函数的数据反过来用作评价准则的数据得到,因此由此得出的估计往往比真实误判率小,当训练样本较大的时候,此法可以作为真实误判率的一种近似估计。,其他分类判别准则,基于概率统计的贝叶斯分类准则 判别函数分类设计(线性、非线性、支持向量机) 神经网络分类 决策树分类 粗糙集分类,数据判别分析,第二部分 实例分析 距离判别分析法在岩体质量等级分类中的应用 主讲人:吴佳欢,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,研究意义 工程岩体质量反映了岩体结构固有的物理力学特性,为工程稳定分析、岩体的合理

9、利用以及正确选择各类岩体力学参数等提供了可靠的依据。,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,对象特征 在岩石力学与工程系统中,许多情况下由于系统具有,1.复杂性 2.模糊性 3.高度非线性,数据分布形式和变量之间的关系是难以准确获知的,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,发展趋势 1. 单因素定性分级 2. 由于应用和分析侧重点不同,相应地采用不同的评价指标和分级标准 3. 采用静态和动态等多种评价方法从不同侧面进行岩体质量的综合评价 4. 岩体质量评价与岩体稳定性分析的有机结合,多因素定性分级,多因素定量综合模式,数据判别实例分析 距离判别分析法

10、在岩体质量等级分类中的应用,发展概况 1.早期方法(统计方法、回归方法等) 2.RMR分类 3.马氏距离判别分析法,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,马氏距离判别分析法,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,马氏距离判别分析法 = =,注释:S,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,岩体质量等级判定的距离判别分析模型 1.判别参数的确定 岩体质量等级的影响因素 (1)岩石性质 (2)岩体结构 (3)储存环境,以单轴抗压强度(X1) 岩体声波纵波速度(X2) 体积节理数(X3) 节理面粗糙度系数(X4) 节理面风化变异系数(X

11、5) 透水性系数(X6),数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,岩体质量等级判定的距离判别分析模型 2.距离判别分析模型的建立 距离判别分析模型示意图,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,岩体质量等级判定的距离判别分析模型 2.距离判别分析模型的建立,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,岩体质量等级判定的距离判别分析模型 3.判别结果的检验,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,岩体质量等级判定的距离判别分析模型 4.结论 采用距离判别分析法能够解决传统分类方法中考虑的因素不够、实用性窄以及使用起来有局限性等缺陷。该模型在判别分类中具有较强的判别能力,为解决岩体质量等级判定和分类提供了一条新的途径。,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,谢谢大家!,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,发展概况 早期方法的不足: 这些方法需要已知数据分布形式和对变量之间关系的假定,分级效果的好坏很大程度上取决于对模型的认识,人为因素很大。 返回,数据判别实例分析 距离判别分析法在岩体质量等级分类中的应用,发展概况 RMR分类: R1:岩石抗压强度 R2:岩石质量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论