




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Chapter 2 Bayesian Decision Theory 贝叶斯决策论.要点: 重点掌握贝叶斯决策论、最小误差率分类规那么、分类器与判别函数、正态密度、正态分布的判别函数 了解贝叶斯决策论(离散性特征). 在不知道更多信息的情况下,每次出现鲈鱼的先验概率为 ,而鲑鱼的先验概率为 ,其中先验概率反映了在鱼没有出现之前,我们拥有能够出现鱼的类别的先验知识。 例如:对于鲑鱼与鲈鱼的2类问题,假设用表示类别形状,那么当 时是鲈鱼,当 时是鲑鱼。由于每次出现的类别不确定,可以假设是一个用概率来描画的随机变量。 2.1 引 言 贝叶斯决策是统计方式识别的根本方法, 采用概率的方式来描画,它的前
2、提是:(1). 各类别的总体概率分布是知的.(2). 要决策分类的类别数是一定的. 利用类条件概率密度: 及 描画了两种鱼类外观上光泽度的差别。 其中,x为光泽度目的。 类条件概率密度为类别形状为时的x的概率密度函数 仅根据先验信息的断定准那么 假设 ,那么事件 成立; 反之,那么 成立。 错误的概率是它们之中较小的那个. 但通常不这样做!. 注 : 假定的类条件概率密度函数图,显示了方式处于类别 时察看某个特定特征值 x 的概率密度.假设 x 代表了鱼的长度,那么这两条曲线可描画两种鱼的长度区别.概率函数已归一化,因此每条曲线下的面积为1.贝叶斯公式: 处于类别 并具有特征值 x的方式的结合
3、概率密度可写成两种方式: 其中 称为形状的后验概率.混合概率密度函数:于是,可以导出贝叶斯公式: 1.在先验概率 及图2-1给出的后验概率图.此情况下,假定一个方式具有特征值 , 那么它属于 类的概率约为0.08, 属于 的概率约为0.92.在每个x 处的后验概率之和为1.0. 基于后验概率的决策准那么 (x 表示察看值) 假设 类别断定 假设 类别断定 决策后所导致的错误率 假设断定 假设断定. 最小化错误概率条件下的贝叶斯决策规那么 为了追求最小的错误率,采取如下断定准那么: 假设 ,那么断定类别为 ; 反之,判为 。 可以证明,依从这样的准那么可以获得最小错误率: 我们称该准那么为“贝叶
4、斯决策准那么。 平均错误率:. 根据贝叶斯公式,由于p(x)为标量,那么可以采用等价断定准那么: 假设 ,那么断定类别为 ; 反之,判为 。. 2.2 贝叶斯决策论-延续性特征允许利用多于一个的特征允许多于两种类别形状的情形允许有其它行为而不仅是断定类别。引入损失函数替代误差概率。 概 述.令1, 2, c表示一系列类别形状。令1, 2, a表示一系列能够采取的行动或决策。令 (i | j)表示当实践形状为 j 时,采取i 的行为会带来的风险。那么,特征x与行动i 相关联的损失为:因此, 称为条件风险。 调查损失函数对断定准那么的影响 借助 可以提供一个总风险的优化过程,即遇到特征x,我们可以
5、选择最小化风险的行为来使预期的损失到达最小。 假设对于特征x,决策的行为是 ,那么总风险可表示为:.为了最小化总风险,对一切 计算条件风险选择行为i ,使得 最小化。最小化后的总风险值称为贝叶斯风险,记为 ,它是可获得的最优结果。(12). 两类分类问题行为1对应类别判决1, 2那么对应2 。为了简化符号,令那么可得两种行为的损失函数. 决策 按照贝叶斯决策规那么,为了使得条件风险最小, 假设那么判为 相反,那么判为 结合贝叶斯公式,用先验概率与条件密度来表示 后验概率,等价规那么为 假设 那么判为 否那么,判决为 用后验概率来表示,等价规那么为 假设 那么判为 否那么,判决为通常: ?. 决
6、策等价规那么为 假设 那么判为 ; 否那么,判决为留意公式(18)的右边是与x无关的常数,因此可以视为左边的似然比超越某个阈值,那么判为18.左图阐明,假设引入一个0-1损失或分类损失,那么判别边境将由阈值 决议;而假设损失函数将方式 判为 的惩罚大于反过来情况,将得到较大的阈值 使得R1变小. 当损失函数简化到所谓的“对称损失或“0-1损失 函数 这个损失函数将0损失赋给一个正确的判决,而将一 个单位损失赋给任何一种错误判决,因此一切误判都是 等价的。与这个损失函数对应的风险就是平均误差概率。 2.3 最小误差率分类.对于 , 假设 ,那么断定类别为 ;反之,判为 。因此, 最小化风险, 就
7、是最大化后验概率 , 即最小误差率的分类准那么。.2.3.1 极小极大化准那么先验概率未知情形 有时我们需求设计在整个先验概率范围内都能很好操作的 分类器。一种合理的设计方法就是使先验概率取任何一种 值时所引起的总风险的最坏情况尽能够小,也就是说最小 化最大能够的风险。 我们以R1表示分类器判为1时的特征空间的区域,同样的 有R2和 2,总风险的方式可表示为 判为1判为2.结合公式 与可以得到等式阐明一旦判别边境确定后,总风险与 成线形关系。假设能找到一个边境使比例为0,那么风险将与先验概率独立。这就是极小极大化求解。风险作业:计算.2.3.2 Neyman-Pearson准那么 最小化某个约
8、束的风险资源有限的情形。 对某个给定的i,最小化在约束条件 的总风险。 例如:将鲈鱼误判为鲑鱼的误差率不得超越1%。. 2.4 分类器与判别函数2.4.1 多类情况有许多方式来表述方式分类器,用的最多的是一种判别函数 假设对于一切的 都有那么分类器将这个特征向量x判给.上图为包含d个输入c个判别函数的系统。确定哪个判别函数值最大,并相应地对输入作分类。. 不同情况下的分类器的表示方式 普通风险的情况下为 最小误差概率情况下 其它一些较常见的方式. 虽然判别函数可写成各种不同的方式,但是判决规那么是一样的。 每种判决规那么都是将特征空间划分c个判决区域, 假设对于一切的 ,有 那么x属于 。 要
9、求我 们将x分给 。此区域由判决边境来分割,其判决边境即判决 空间中使判决函数值最大的曲面。如图.在这个二维的两类问题的分类器中,概率密度为高斯分布。判别边境由两个双曲面构成,因此判决区域R2并非是简单连通的。椭圆轮廓线标志出1/e乘以概率密度的峰值。.那么假设 ,那么将x判给 ,否那么给 。2.4.2 两类情况二分分类器-dichotomizer对于二分分类器,可以定义一个简单判别函数 最小误差概率情况下或:. 2.5 正态密度 单变量密度函数单变量正态分布容易计算其期望值与方差.单变量正态分布大约有95%的区域在 范围内,如图此分布的峰值为. 正态分布与熵之间的关系熵的定义单位为奈特; 假
10、设换为 ,单位为比特。熵是一个非负的量用来描画一种分布中随机选取的样本点的不确定性。可以证明正态分布在一切具有给定均值和方差的分布中具有最大熵。并且,如中心极限定理所述,大量的小的,独立的随机分布的总和等效为高斯分布。. 多元密度函数多元正态密度其中x是一个d维列向量, 是d维均值向量, 是 的协方差矩阵, 和 分别是其行列式的值和逆。方式上有:. 协方差矩阵 通常是对称的且半正定。我们将严厉限定 是正定的。对角线元素 是相应的 方差; 非对角线元素 是 和 的协方差。假设 和 统计独立,那么 。假设一切的非对 角线元素为0,那么p(x)变成了x中各元素的单变量正态密度函数的 内积。 服从正态
11、分布的随机变量的线性组合,不论这些随机变量是独立 还是非独立的,也是一个正态分布。(这是个非常有用的结论特别地,假设 ,A是一d*k的矩阵且 是一k维向量,那么. 白化(Whitening) 变换 F: 其列向量是 S的正交特征向量. L: 与特征值对应的对角矩阵.白化(Whitening) 变换. 2.6 正态分布的判别函数最小误差概率分类可经过判别函数获得假设知那么其中:.情况1: 这种情况发生在各特征统计独立,且每个特征具有一样的 方差时。此时的协方差阵是对角阵,仅仅是 与单位阵I 的乘积。几何上它与样本落于相等大小的超球体聚类中的 情况相对应,第i类的聚类以均值向量 为中心。 省略掉其
12、它无关紧要的附加常量,可得到简单的判决函数.展开后我们得到省略附加常量,等价于线性判决函数其中且称 为第 i个方向的阈值或者偏置。. 运用线性判别函数的分类器称为“线性机器。这类分类器有许多有趣的实际性质,其中一些将在第5章中详细讨论。此处只需留意到一个线性机器的断定面是一些超平面,它们是由两类问题中可获得最大后验概率的线性方程 来确定。 在以上的例子中,该方程可写为其中且此方程定义了一个经过 x0 且与向量 w 正交的超平面。由于 ,将 Ri 与 Rj 分开的超平面与两中心点的连线垂直。假设 那么上式右边第二项为零,因此超平面垂直平分两中心点的连线。如图.假设两种分布的协方差矩阵相等且与单位
13、阵成比例,那么它们呈d维球状分布,其判决边境是一个d-1维归一化超平面,垂直于两个中心的连线。在这些一维,二维及三维的例子中,是假设在 的情况下来显示 和判决边境的。. 假设一切c类的先验概率 相等,那么 项就成了另一可省略 的附加常量。此种情况下,最优判决规那么可简单陈说如下: 为将某特征向量 x 归类,经过丈量每一个 x 到 c 个均值向量中的 每一个欧氏间隔,并将 x 归为离它最近的那一类中。这样一个分类 器被称为 “最小间隔分类器。假设每个均值向量被看成是其所属模 式类的一个理想原型或模板,那么本质上是一个模板匹配技术。.如图:随着先验概率的改动,判决边境也随之改动;对于差别较大的离散
14、先验概率而言,判决边境不会落于这些一维, 二维 及三维球状高斯分步的中心点之间。.情况2 : 第二类简单的情况是一切类的协方差阵都相等,但各自的均值向量 是恣意的。几何上,这种情况对应于样本落在一样大小和一样外形 的超椭球体聚类中,第 i类的聚类中心在向量 附近。此时的判决 函数可从 简化为 将二次型展开后,可再次得到线性判决函数其中.由于判决函数是线性的,判决边境同样是超平面其中且假设先验概率相等,其判决面与均值连线相交于中点;假设不等,最优边境超平面将远离能够性较大的均值。如图.相等但非对称的高斯分布概率密度由二维平面和三维椭球面表示及判决区域。判决超平面未必和均值连线垂直正交。.情况3
15、:在普通的多元正态分布的情况下,每一类的协方差是不同,其判决函数显然也是二次型其中在两类问题中,其对应的判决面是超二次曲面。.恣意高斯分布导致普通超二次曲面的贝叶斯判决边境。反之,给定恣意超二次曲面,就能求出两个高斯分布,其贝叶斯判别边境就是该超二次曲面。它们的方差由常概率密度的围线表示.P42 例1.P42 例3. 2.9 贝叶斯决策论 -离散特征 到目前为止所讨论的特征向量 x 可以为 d 维欧氏空间中的恣意一点。但 是,在许多实践运用中,x中的元素能够是二进制,三进制或者更高的离散整数值,以致于 x 可以被以为是m个离散值 中的一个。在这种情况下, 变得奇特化,积分方式 转变为求和方式其
16、它方面与延续的情况根本一样,这里不一一赘述。概率密度函数 换成 概率分布函数.思索两类问题,其中特征向量的元素为二值的,并且条件独立。令 ,其中 能够为0或1,且2.9.1 独立的二值特征且假设条件独立,可将x元素的概率写为 ,即且那么似然比为.由公式 得判决函数假设 判别为 ;否那么为留意判决函数对 是线性的,可改写为其中且. g(x)可以看作是x的各分量的加权组合。 留意权重Wi 的意义。 特征独立的条件产生线性分类器,而假设特征不独立将产生复杂的分类器。.Example: 三维二值特征的贝叶斯决策.Example: 三维二值特征的贝叶斯决策. 2.7 误差概率和误差积分 二分分类器: 思
17、索以非最优方式将空间分成两个区域Ri 与 Rj , 那么误差概率为:上式的值与判决点的取值有关. 多类情况正确分类的概率贝叶斯分类器经过选择对一切x使得被积函数最大化的区域使正确分类的概率最大化。没有其他分类方法能产生更小的分类概率。.2.8 正态密度的错误上界在高斯函数的情况下, 整个误差率计算过程相当复杂。特别是高维情形。判决区域能够不延续。在两类情况下,普通错误积分公式可近似的给出一个误差率的上界。.Chernoff 界习题36,作业!其中:.Chernoff Bound 0.66Bhattacharyya Bound 0.5.Bhattacharyya Bound.Example: 在高斯分布下的错误率的界.Example:在高斯分布下的错误率的界Bhattacharyya 界 k(1/2) = 4.06 P(error) x*|x in w2)一次虚警: P(xx*|x in w1)一次漏检: P(xx*|x in w2)一次正确回绝: P(xx*|x1).丧失特征举例:2.10 丧失特征和噪声特征 丧失特征 思索训练集数据未受损,测试集数据受损情形。.丧失特征情形下的决策:其中:是判别函数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 员工请假及销假记录表
- 木地板购销质量保证合同
- 互联网信息内容服务合作合同
- 企业改制专项法律服务委托合同
- 人体细胞获得氧气的过程 课件-2024-2025学年北师大版生物七年级下册
- 感应门禁购销合同
- 物业保洁管理合同
- 《古代战争文学赏析:初中历史教学教案》
- 线上医疗服务平台合作协议
- 建筑装饰材料与施工工艺知识点梳理
- DZ∕T 0273-2015 地质资料汇交规范(正式版)
- 中国传统文化经典解读-《菜根谭》智慧树知到期末考试答案章节答案2024年陕西工商职业学院
- 2024年江苏国信仪征 高邮热电有限责任公司招聘笔试参考题库含答案解析
- 小班社会《认识家用电器》课件
- JTG C10-2007 公路勘测规范
- 2024年广州市高三一模高考英语试卷试题答案详解(含作文范文)
- 小学英语绘本-小鸡
- GB 19644-2024食品安全国家标准乳粉和调制乳粉
- 中学数学教学典型课例研究
- 道德与法治统编版六年级下册全册大单元任务群教学设计四个单元
- 阅读让我们更聪明
评论
0/150
提交评论