Bayes分类器第七章课件_第1页
Bayes分类器第七章课件_第2页
Bayes分类器第七章课件_第3页
Bayes分类器第七章课件_第4页
Bayes分类器第七章课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于概率统计的bayes分类器一种经典分类器第七章第1页,共27页。贝叶斯的贡献 1763年,贝叶斯首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于现代概率论和数理统计都有很重要的作用。 贝叶斯的另一著作机会的学说概论发表于1758年,贝叶斯所采用的许多术语被沿用至今。他对统计推理的主要贡献是使用了逆概率这个概念,并把它作为一种普遍的推理方法提出来。贝叶斯定理原本是概率论中的一个定理,这一定理可用一个数学公式来表达,这个公式就是著名的贝叶斯公式。 第2页,共27页。贝叶斯决策理论Bayes分类器基本概念一、两类问题例如:细胞识别问题 1正常细胞,2异常细胞某地区,经大量统计获先

2、验概率P(1),P(2)。若取该地区某人细胞x属何种细胞 ,只能由 先验概率决定。第3页,共27页。对x再观察:有细胞光密度特征 ,有类条件概率密度: P(x/ ) =1,2,。如图所示利用贝叶斯公式 :通过 对细胞的再观察,就可以把先验概率转化为后验概率,利用后验概率可对未知细胞x进行识别 。贝叶斯决策理论第4页,共27页。通过 对细胞的再观察,就可以把先验概率转化为后验概率,利用后验概率可对未知细胞x进行识别 。第5页,共27页。设N个样本分为两类1,2。每个样本抽出n个特征, x =(x1, x2, x3, xn)T 1、判别函数:若已知先验概率P(1),P(2),类条件概率密度P(x/

3、 1), P(x/ 2)。 则可得贝叶斯判别函数四种形式 :第6页,共27页。2、决策规则:第7页,共27页。 3、决策面方程: x为一维时,决策面为一点,x为二维时决策面为曲线,x为三维时,决策面为曲面,x大于三维时决策面为超曲面。例:某地区细胞识别; P(1)=0.9, P(2)=0.1 未知细胞x,先从类条件概率密度分布曲线上查到:解:该细胞属于正常细胞还是异常细胞,先计算后验概率:P(x/ 1)=0.2, P(x/ 2)=0.4第8页,共27页。g(x)阈值单元 4、分类器设计:判别计算特征向量决策第9页,共27页。1.判别函数:M类有M个判别函数g1(x), g2(x), gm(x)

4、。每个判别函数有上面的四种形式。 2.决策规则:另一种形式:二、多类情况:=(1,2,m),x=(x1,x2,xn)第10页,共27页。二、多类情况:=(1,2,m),x=(x1,x2,xn) 3、决策面方程:4、分类器设计:g1(x)Maxg(x)g2(x)gn(x)特征向量判别计算最大值选择器决策第11页,共27页。正态分布决策理论 一、正态分布判别函数 1、为什么采用正态分布: a、正态分布在物理上是合理的、广泛的。 b、正态分布数学上简单,N(, ) 只有均值和方差两个参数。 2、单变量正态分布: 第12页,共27页。第13页,共27页。3、(多变量)多维正态分布 (1)函数形式:第1

5、4页,共27页。第15页,共27页。判别函数类条件概率密度用正态来表示:第16页,共27页。例、有训练集资料矩阵如下表所示,现已知,N=9、N1=5、N2=4、n=2、M=2,试问,X=(0,0)T应属于哪一类?解:假定二类协方差 矩阵不等(12) 则均值:训练样本号k1 2 3 4 5 1 2 3 4 特征 x1特征 x21 1 0 -1 -1 0 1 0 -1 0 1 1 1 0-1 -2 -2 -2类别1 2第17页,共27页。第18页,共27页。第19页,共27页。关于分类器的错误率分析1、一般错误率分析:第20页,共27页。由此:错误率为为图中两个划线部分之和。BAYES公式表明每个

6、样本所属类别都使 最大,实际上使X错判的可能性达到最小。第21页,共27页。最小风险Bayes分类器假定要判断某人是正常(1)还是肺病患者(2),于是在判断中可能出现以下情况:第一类,判对(正常正常) 11 ;第二类,判错(正常肺病) 21 ; 第三类,判对(肺病肺病) 22;第四类,判错(肺病正常) 12 。在判断时,除了能做出“是” i类或“不是” i类的动作以外,还可以做出“拒识”的动作。为了更好地研究最小风险分类器,我们先说明几个概念:第22页,共27页。行动i:表示把模式x判决为i类的一次动作。损耗函数ii=(i/i)表示模式X本来属于i类而错判为i所受损失。因为这是正确判决,故损失

7、最小。损耗函数ij=(i/j)表示模式X本来属于j类错判为i所受损失。因为这是错误判决,故损失最大。风险R(期望损失):对未知x采取一个判决行动(x)所付出的代价(损耗)第23页,共27页。条件风险只反映对某x取值的决策行动i所带来的风险。期望风险则反映在整个特征空间不同的x取值的决策行动所带来的平均风险。最小风险Bayes决策规则:在整个特征空间中定义期望风险:条件风险(也叫条件期望损失):第24页,共27页。第25页,共27页。二类问题: 把x归于1时风险: 把x归于2时风险:第26页,共27页。Bayes分类的算法(假定各类样本服从正态分布)1.输入类数M;特征数n,待分样本数m.2.输入训练样本数N和训练集资料矩阵X(Nn)。并计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论