版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章统计(Bayesian)决策理论Bayesian决策理论是统计模式识别方法的理论基础,大多数人认为也是神经网络分类方法的理论基础。说到底,Bayesian决策方法就是企望在后验概率 P(j/x)(据此确定样本 x的类别)和代价 P(e)(即 风险,做这一决策产生的损失)之间寻找一个平衡点。当然,我们希 望P( j/x)越大越好,P(e)越小越好。2.1基于最小错误率(Minimum-error-rate )的决策最小错误率-Probability of minimum error。我们应将之理解为 犯错误最小的概率,与上一章的分类错误率不是一回事。设有两个类别和七,它们的先验概率(Pri
2、or Probabilities )P()、P( 2)为已知。(1) 根据先验概率决策对样本X而言,我们除知道 P()和Pf 2)之外,其它一无所知令 P( 1)>P( 2),若牛布望做决策时误差为最小,则认为X .川。类似地,若有n个类别,且P';T j I > P(ckk 二 1,2, nk = j(2 - 1)则决策X J ;若Pj= Pkk = 1,2, nj(2 - 2)这时,我们不能作出决策该方法的缺陷之一是 P( j)的准确值一般是不知道的,常用的方法 是估计。设样本总数为 N,第j类样本数为 叫,则NP i P ,j (频数比)。jj N若所有类别的样本数一
3、样多,即P& j)= P(国k),k=1,2,n,这时该方法失效。(2) 根据后验概率(Posteriori Probabilities)决策(2_ 3)设可求得后验概率P(/x),j=1,2, ,n,若P j x P k x k = 1,2,n k - j则可决策x j。我们知道,Bayesian公式为(2一4)这里,p(x)为x的概率密度,p(X/j)为x属于j的类条件概率密度。 将(2-4)代入(2-3),得k = 1,2, n k(2-5)j1,2, n k = j (2-6)式(2-6)可改写成必 jJP(® k> Pjk=12(2 - 7)于是,依据后验概率
4、大小可得到如下决策规则(2 - 8)1,2, ,n k- jThenx j我们称l(x)为似然函数(Likelihood function这时分类阈值二=1,特别地,若 PC j)=P( k),即先验概率相等,式(2-8)所示的决策规则化为Ifk = 1,2, ,nThe n(2 - 9)Ifk = 1,2- , n k = jThenx j(2 - 10)这就是说,在先验概率相等的条件下,我们可以仅根据类条件概 率密度的大小来确定样本x的类别。图 2.1 为 p(x/ j)=N(O, 1), p(x/ k)=0.6N(1, 1)+0.4N(-1,2)的类条件概率密度分布曲线,图 2.2为这两
5、个类的似然比分布曲线xp( x/豹)P()P(X/Bj)P( j)X属于k但被错 分为国j的区域p(x/ -k)PC k)X属于 'j但被错 分为 k的区域0 RiR2图2.3求最小错误概率的示意图(3) 最小错误概率图2.3为求最小错误概率的示意图。最小错误概率就是图中阴影 部分的面积。若样本x属于“,但分类器将其错分为j,由此引起的分类误差的概率为R2(/Pkj e巳 P k P x k dx(2-11)同样地,若样本x属于,j,但分类器将其错分为k,由此引起的分类误差的概率为在只有冷、k两个类别的情况下,样本x被错分的概率为P e 匚 Pjk e Pkj ekdxR2R1k(2-
6、13)由于R2R1 P+ 0d" fR2 Pld x(2-14)R1P-Q0j dxR2Pdx 二 jR2R1 Pjdx(2 - 15)将(2-14)和(2-15)代入(2-13),P e 二 Pjk e Pkj ekjpR1二 P k 1 亠PR2P i 1 -R1dxjk dxR2 Pdxk(2 - 16)P e 二 Pjk e Pkj e二 P k P jP kR1_: P+ 0dxkR2 PdxkR2 (-P(° j 纭 P、/jdx(2-17)但 P( j)+P( k)=1,所以R1.-:p<+ 0二 P(c)dxkR2 PdxPR2 j R1(2T8)我们
7、称P(c)为正确分类的概率。于是,(2 - 19)P e = V P(c)式(2-19)意味着使分类错误的概率为最小等价于使分类正确的概率 为最大。值得注意的是,最小错误概率的推导实际上是根据后验概率得到 的,即(2-13)的完整写法是P e 二 Pjk e Pkj eR2=f PR1R1p(x)dxPcO+o° f oP( X)dXR2Pp(x )dxR2P®k认凭R1p( x )dx +P( x)P j p x. jj p(x)dxR2p( x)P .R1 P jp( x)dxP( x)(2 - 20)(2 - 20)(2 - 21)对于只有j和,k两个类别的情况,基于
8、最小错误率的决策边界有F列几种表达形式。(1) 直接由后验概率相等所决定,即側:p,x = pk: x 二阴:Px Pk x = 0(2) 由后验概率取自然对数相等所决定,即吋 InPj x= In Pkx =吋 InPx- In Pkx =0将Bayes公式两边取自然对数,我们有n :lnP j p X j lnP k p X kjp xp XTikj: In P jpxj- In Pkpx k=In pxj-In p xkIn Pj- In P k 1=In pxj-In p xk9-0 (2 - 22)这里,9二In P j - In P k被称为分类阈值。上述结论很容易推广到多类情况。基于最小错误概率的决策方法存在以下缺陷。(1)先验概率P( j)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度个人养老金投资管理合同4篇
- 2025版专业舞蹈鞋订购与租赁合同3篇
- 2025版木质墙板供货与安装服务合同4篇
- 2025年度城市轨道交通建设项目工程总承包合同4篇
- 2025版土地储备土地使用权流转合同3篇
- 五金行业电子商务应用考核试卷
- 安徽省黄山市高三第一次质量检测语文试卷(含答案)
- 2025版升级版土方工程劳务承包合同范本2篇
- 2025版危险化学品运输安全责任合同3篇
- 二零二五版海运出口运输代理合同货物跟踪查询协议3篇
- 无人化农场项目可行性研究报告
- 《如何存款最合算》课件
- 社区团支部工作计划
- 拖欠工程款上访信范文
- 2024届上海市金山区高三下学期二模英语试题(原卷版)
- 《wifi协议文库》课件
- 2025年新高考语文复习 文言文速读技巧 考情分析及备考策略
- 2024年海口市选调生考试(行政职业能力测验)综合能力测试题及答案1套
- 一年级下册数学口算题卡打印
- 2024年中科院心理咨询师新教材各单元考试题库大全-下(多选题部分)
- 真人cs基于信号发射的激光武器设计
评论
0/150
提交评论