第2章 贝叶斯决策_第1页
第2章 贝叶斯决策_第2页
第2章 贝叶斯决策_第3页
第2章 贝叶斯决策_第4页
第2章 贝叶斯决策_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选pptBayesian Decision Theory刘芳,戚玉涛刘芳,戚玉涛qi_qi_精选ppt贝叶斯决策理论贝叶斯决策理论v引言引言v贝叶斯决策常用的准则贝叶斯决策常用的准则v分类器,判别函数,决策面分类器,判别函数,决策面v正态分布的判别函数正态分布的判别函数vBayesianBayesian置信网置信网精选ppt引言引言v机器自动识别分类,能不能避免错分类,做到百分机器自动识别分类,能不能避免错分类,做到百分之百正确?怎样才能减少错误?之百正确?怎样才能减少错误?v错分类往往难以避免,因此就要考虑减小因错分类错分类往往难以避免,因此就要考虑减小因错分类造成的危害损失,那么有没有可

2、能对危害大的错误造成的危害损失,那么有没有可能对危害大的错误严格控制?严格控制?v什么是先验概率、类概率密度函数和后验概率?它什么是先验概率、类概率密度函数和后验概率?它们的定义和相互关系如何们的定义和相互关系如何?贝叶斯公式正是体现三贝叶斯公式正是体现三者关系的式子。者关系的式子。精选ppt引言v贝叶斯决策理论贝叶斯决策理论贝叶斯统计决策理论是处理模式分类问题的基本理贝叶斯统计决策理论是处理模式分类问题的基本理论之一,对模式分析和分类器(论之一,对模式分析和分类器(Classifier)的设计)的设计起指导作用。起指导作用。v贝叶斯决策的两个要求贝叶斯决策的两个要求各个类别的总体概率分布各个

3、类别的总体概率分布 (先验概率和类条件概先验概率和类条件概率密度率密度) 是已知的是已知的 要决策分类的类别数是一定的要决策分类的类别数是一定的精选ppt引言:12,Tddx xxRxx为为d维维特征向量特征向量。12,ic 精选ppt引言v评价决策有多种标准,对于同一个问题,采用不同评价决策有多种标准,对于同一个问题,采用不同的标准会得到不同意义下的标准会得到不同意义下“最优最优”的决策。的决策。v贝叶斯决策常用的准则:贝叶斯决策常用的准则: 最小错误率准则最小错误率准则 最小风险准则最小风险准则 Neyman-Pearson准则准则 最小最大决策准则最小最大决策准则精选ppt贝叶斯决策理论

4、贝叶斯决策理论v引言引言v贝叶斯决策常用的准则贝叶斯决策常用的准则v分类器,判别函数,决策面分类器,判别函数,决策面v正态分布的判别函数正态分布的判别函数vBayesianBayesian置信网置信网精选pptBayes决策准则决策准则v最小错误率准则最小错误率准则v最小风险准则最小风险准则vNeyman-Pearson准则准则v最小最大决策准则最小最大决策准则精选ppt最小错误率准则精选ppt最小错误率准则v先验概率:先验概率:v类条件概率:类条件概率:v后验概率:后验概率:v贝叶斯公式贝叶斯公式iPiPxiPx iiiPPPPxxx i 1ciiPPPxx其中:其中:精选ppt最小错误率准

5、则 例:例:精选ppt最小错误率准则v数学表示:数学表示: :表示类别这一随机变量表示类别这一随机变量1:表示患病表示患病2:表示不患病表示不患病 X:表示白细胞浓度这一随机变量表示白细胞浓度这一随机变量 x: 表示白细胞浓度值表示白细胞浓度值精选ppt最小错误率准则11220.5%99.5%PPPP 精选ppt最小错误率准则122000,10007000,3000PNPNxx1Px2Px精选ppt最小错误率准则最小错误率准则v最小错误率准则最小错误率准则以先验概率、类条以先验概率、类条件概率密度、特征件概率密度、特征值(向量)为输入值(向量)为输入以后验概率作为类以后验概率作为类别判断的依据

6、别判断的依据贝叶斯公式保证了贝叶斯公式保证了错误率最小错误率最小精选ppt最小错误率准则v最小错误率的贝叶斯决策最小错误率的贝叶斯决策规则为:规则为: 1Px2Pxx1=x2 ?精选ppt最小错误率准则v最小错误率准则的平均错误率:最小错误率准则的平均错误率:x2=x3x2和和x3 都是都是 p(x, 1)= p(x, 2) 的根的根,因此,因此是两类分界是两类分界精选ppt最小错误率准则v最小错误率准则的平均错误率:最小错误率准则的平均错误率:x2=x3,则则 精选ppt最小错误率准则v平均错误率是否最小?平均错误率是否最小?精选ppt最小错误率准则v似然比公式似然比公式1122p xPp

7、xP1212p xppp x12PPxx iiiPPPPxxx则:则:等价于:等价于:似然比公式似然比公式精选ppt最小错误率准则v特例特例1:精选ppt最小错误率准则v特例特例2:精选ppt最小错误率准则v形式逻辑(经典确定性推理)形式逻辑(经典确定性推理)以鲈鱼和鲑鱼分类为例:以鲈鱼和鲑鱼分类为例:假言:如果鱼的长度假言:如果鱼的长度 大于大于45cm,则该鱼为,则该鱼为 鲈鱼鲈鱼 ,否则该鱼为鲑鱼,否则该鱼为鲑鱼前提:现在某条鱼前提:现在某条鱼 结论:该鱼为鲑鱼结论:该鱼为鲑鱼v概率推理(不确定性推理)概率推理(不确定性推理)x38cmx 2 1 2 iPx 精选ppt最小错误率准则v例

8、子:例子:给定给定 ,类条件概率密度如图。,类条件概率密度如图。现有一条鱼现有一条鱼 x=38cm, 若采用最小错误率决策,该鱼应该为哪一类?若采用最小错误率决策,该鱼应该为哪一类? 1212P yP y111380.16 0.5380.8380.16 0.50.04 0.5p xyP yP yxp x2380.2P yx1y故判决:故判决:精选pptBayes决策准则决策准则v最小错误率准则最小错误率准则v最小风险准则最小风险准则vNeyman-Pearson准则准则v最小最大决策准则最小最大决策准则精选ppt最小风险准则v最小风险贝叶斯决策:最小风险贝叶斯决策:考虑各种错误造成损失不考虑各

9、种错误造成损失不同而提出的一种决策规则。同而提出的一种决策规则。v条件风险:条件风险:精选ppt最小风险准则v期望风险:期望风险:对于对于x的不同观察值,采取决策的不同观察值,采取决策i时,时,其条件风险大小是不同的。所以究竟采取哪一种决其条件风险大小是不同的。所以究竟采取哪一种决策将随策将随x的取值而定。这样,决策的取值而定。这样,决策可以看成随机向可以看成随机向量量x的函数,记为的函数,记为(x)。可以定义期望风险。可以定义期望风险Rexp为:为:v期望风险反映对整个空间上所有期望风险反映对整个空间上所有x的取值采取相应的的取值采取相应的决策决策(x)所带来的所带来的平均风险平均风险。 e

10、xpRRpdx xxx精选ppt最小风险准则v两分类问题的例子:两分类问题的例子:精选pptv似然比公式似然比公式精选ppt最小风险准则v不同的损失函数决定了不同的似然比判决阈不同的损失函数决定了不同的似然比判决阈值值: a:0-1损失损失 b:1221每一类的判决域每一类的判决域可能是不连续的可能是不连续的!精选ppt最小风险准则v最小风险贝叶斯决策的步骤:最小风险贝叶斯决策的步骤:1)根据先验概率和类条件概率计算出后验概率;)根据先验概率和类条件概率计算出后验概率;2)利用后验概率和损失矩阵计算采取每种决策)利用后验概率和损失矩阵计算采取每种决策的条件风险;的条件风险;3)比较各个条件风险

11、的值,条件风险最小的决)比较各个条件风险的值,条件风险最小的决策即为最小风险贝叶斯决策策即为最小风险贝叶斯决策精选ppt最小风险准则精选ppt最小风险准则v对于贝叶斯最小风险决策,如果损失函数为对于贝叶斯最小风险决策,如果损失函数为“0-1损失损失”,即取如下的形式:,即取如下的形式: 那么,条件风险为:那么,条件风险为: 此时,贝叶斯最小风险决策与最小错误率决策等此时,贝叶斯最小风险决策与最小错误率决策等价。价。0,; ,1,1,ijfor ijwi jcfor ij 11ciijjjijj iRPPP xxxx精选pptBayes决策准则决策准则v最小错误率准则最小错误率准则v最小风险准则

12、最小风险准则vNeyman-Pearson准则准则v最小最大决策准则最小最大决策准则精选pptNeyman-Pearson准则准则v最小错误率准则最小错误率准则: 后验概率最大化,理论上错误率最小后验概率最大化,理论上错误率最小v最小风险准则:最小风险准则: 风险函数最小化,理论上总风险最小风险函数最小化,理论上总风险最小v在先验概率和损失未知的情况下如何决策?在先验概率和损失未知的情况下如何决策?精选pptNeyman-Pearson准则准则v问题:先验概率和损失未知问题:先验概率和损失未知通常情况下,无法确定损失。通常情况下,无法确定损失。先验概率未知,是一个确定的值先验概率未知,是一个确

13、定的值某一种错误较另一种错误更为重要。某一种错误较另一种错误更为重要。v基本思想:基本思想:要求一类错误率控制在很小,在满足此条件的前要求一类错误率控制在很小,在满足此条件的前提下再使另一类错误率尽可能小。提下再使另一类错误率尽可能小。用用lagrange乘子法求条件极值乘子法求条件极值精选pptNeyman-Pearson准则准则v对两分类问题,错误率可以写为:对两分类问题,错误率可以写为:v由于由于P(1) 和和P(2)对具体问题往往是确定的对具体问题往往是确定的(但是未知),一般称(但是未知),一般称P1(e)和和P2(e)为两类错为两类错误率。误率。 P1(e)和和P2(e)的值决定了

14、的值决定了P(e)的值。的值。 12121221221122112211,|RRRRP ep xR xp xR xp xpdxp xpdxp xdx pp xdx ppe pp e p精选pptNeyman-Pearson准则准则精选pptNeyman-Pearson准则准则v为了求为了求L的极值点,将的极值点,将 L 分别对分别对 t 和和求偏导:求偏导:v注意:这里分析注意:这里分析的是两类错误率,的是两类错误率,与先验概率无关!与先验概率无关!v决策准则决策准则 ?精选ppt精选pptNeyman-Pearson准则准则v最小错误率准则的等价形式最小错误率准则的等价形式vNeyman-P

15、earson准则准则 两者都以似然比为基础,在未知先验概率时使用两者都以似然比为基础,在未知先验概率时使用Neyman-Pearson准则。准则。精选pptBayes决策准则决策准则v最小错误率准则最小错误率准则v最小风险准则最小风险准则vNeyman-Pearson准则准则v最小最大决策准则最小最大决策准则精选ppt最小最大决策准则最小最大决策准则vNeyman-Pearson准则准则假定先验概率是一个确定的值假定先验概率是一个确定的值,此时判定结果会受到先验概率的影响。此时判定结果会受到先验概率的影响。v实际中,类先验概率实际中,类先验概率 P P( ( i i) ) 往往不能精确知道或往

16、往不能精确知道或在分析过程中是变动的,从而导致判决域不是最佳在分析过程中是变动的,从而导致判决域不是最佳的。所以应考虑如何解决的。所以应考虑如何解决在在 P P( ( i i) ) 不确知或变动不确知或变动的情况下使期望风险变大的问题的情况下使期望风险变大的问题。v最小最大决策准则:最小最大决策准则:在最差的条件下争取最好的结在最差的条件下争取最好的结果,果,使最大风险最小!使最大风险最小!精选ppt最小最大决策准则最小最大决策准则v分析期望风险分析期望风险 R 与先验概率与先验概率 P(1) 的关系:的关系: 对于两类问题,设一种分类识别决策将特征对于两类问题,设一种分类识别决策将特征空间空

17、间R划分为两个子空间划分为两个子空间 R1 和和 R2 ,记,记ij为将属于为将属于 i 类的模式判为类的模式判为j 类的损失函数,各种判决的期类的损失函数,各种判决的期望风险为:望风险为:12111122211222RRRpxpxpxdxpxpxpxdx精选ppt最小最大决策准则最小最大决策准则将将)(1)(12PP和和121iiRRpxdxpxdx带入上式:带入上式: 1212111122211222111122211222RRRRRpxpxp x dxpxpxp x dxpx p xpx p xdxpx p xpx p xdx精选ppt最小最大决策准则最小最大决策准则v期望风险可写成:期

18、望风险可写成: 12122122221112221111122221RRRRp xdxpp xdxp xdxapbv一旦一旦 R1 和和 R2 确定,确定,a和和b为常数为常数v一旦一旦 R1 和和 R2 确定,确定, R 与与 P(1) 成线性关系成线性关系v选择使选择使 b=0 的的R1 和和 R2 ,期望风险与,期望风险与P(1) 无关!无关!精选ppt最小最大决策准则最小最大决策准则PA(1)1 p(1)ACDR*BR*B0DCR1 ,R2不变不变R1 ,R2改变改变PB(1)b=0此时最大此时最大风险最小风险最小,D = ab=0 时的时的p(1)精选ppt最小最大决策准则最小最大决

19、策准则v求 b=0 时的时的 p(1) 等价于在R随着p(1)的变化曲线上求:10Rp时的时的p(1)。v在在 b=0 时的时的 决策条件下,期望风险与决策条件下,期望风险与p( 1) 无关,无关,值为值为a,此时,此时,R的最大值最小。这种决策准则称为的最大值最小。这种决策准则称为最小最大决策准则最小最大决策准则。精选ppt最小最大决策准则最小最大决策准则v由于:由于:v当采用当采用0-1损失函数时,损失函数时,b=0可推导出:可推导出: 2111222111112222RRbp xdxp xdx2112RRp xdxp xdx此时,最小最大损失判决所导出的最佳分界面应使此时,最小最大损失判

20、决所导出的最佳分界面应使两类错误概率相等!两类错误概率相等!精选ppt贝叶斯决策理论贝叶斯决策理论v引言引言v贝叶斯决策常用的准则贝叶斯决策常用的准则v分类器,判别函数,决策面分类器,判别函数,决策面v正态分布的判别函数正态分布的判别函数vBayesianBayesian置信网置信网精选ppt分类器,判别函数,决策面分类器,判别函数,决策面v分类器最常用的表述方式为判别函数:分类器最常用的表述方式为判别函数: v基于判别函数的判决基于判别函数的判决 ,1igxic 每个类别对应一个判别函数。每个类别对应一个判别函数。如果:如果: ,ijgxgxi j则模式为则模式为j精选ppt分类器,判别函数

21、,决策面分类器,判别函数,决策面判别函数判别函数Discriminant functions精选ppt分类器,判别函数,决策面分类器,判别函数,决策面v基于最小误差概率的贝叶斯分类器基于最小误差概率的贝叶斯分类器v基于最小总风险的贝叶斯分类器基于最小总风险的贝叶斯分类器 iigxRx iigxpx iiigxp xp loglogiiigxp xp精选ppt分类器,判别函数,决策面分类器,判别函数,决策面v表达同样的判决规则可能采用不同的判别函表达同样的判决规则可能采用不同的判别函数,只要满足数,只要满足 如下条件:如下条件: 用用f(gi(x)替换替换gi(x),其中,其中f(*)为单调递增

22、函数为单调递增函数 例如:例如:v gi(x) k gi(x) , k为正常数为正常数v gi(x) gi(x)+k , k为任意常数为任意常数v gi(x) log (gi(x)精选ppt分类器,判别函数,决策面分类器,判别函数,决策面v特殊的,对于两分类问题,也可以只用一个特殊的,对于两分类问题,也可以只用一个判别函数判别函数 令:令:v判决规则判决规则v例如:例如: 12g xgxgx如果:如果: 0g x 则模式为则模式为1否则为否则为2 12g xpxpx 1122loglogp xpg xpp x精选ppt分类器,判别函数,决策面分类器,判别函数,决策面v判决区域判决区域: 判决区

23、域判决区域 Ri 是特征空间中的一个子空间,判决规则是特征空间中的一个子空间,判决规则将所有落入将所有落入 Ri 的样本的样本x分类为类别分类为类别i。v决策面(决策面(Decision Surface):):判决边界是特征空间中划分判决区域的(超)平判决边界是特征空间中划分判决区域的(超)平面面在判决边界上,通常有两类或多类的判别函数值在判决边界上,通常有两类或多类的判别函数值相等相等精选ppt分类器,判别函数,决策面分类器,判别函数,决策面v判别函数和决策面:判别函数和决策面:精选ppt分类器,判别函数,决策面分类器,判别函数,决策面分类器分类器设计就设计就是设计是设计判别函判别函数,求数

24、,求出判定出判定面方程面方程g(x)!精选ppt贝叶斯决策理论贝叶斯决策理论v引言引言v贝叶斯决策常用的准则贝叶斯决策常用的准则v分类器,判别函数,决策面分类器,判别函数,决策面v正态分布的判别函数正态分布的判别函数vBayesianBayesian置信网置信网精选ppt正态分布的统计决策正态分布的统计决策v为什么研究正态分布?为什么研究正态分布?物理上的合理性:较符合很多实际情况,观测值物理上的合理性:较符合很多实际情况,观测值通常是很多种因素共同作用的结果,根据通常是很多种因素共同作用的结果,根据中心中心极限定理极限定理,服从正态分布。,服从正态分布。数学上比较简单:参数个数少数学上比较简

25、单:参数个数少v单变量正态分布单变量正态分布v多元正态分布多元正态分布精选ppt正态分布的统计决策正态分布的统计决策v单变量正态分布密度函数(高斯分布):单变量正态分布密度函数(高斯分布):精选ppt正态分布的统计决策正态分布的统计决策v多元正态分布函数多元正态分布函数 11/2/211exp22Tdpxxx 12TdEx, ,2Tijd dExx ijiijjEEExxxx期望期望(均值向量均值向量)协方差矩阵协方差矩阵(对称非负定对称非负定)12Tdxxxx, , ,精选ppt多元正态分布的性质多元正态分布的性质v参数个数:参数个数:d+d(d+1)/2 均值向量:均值向量:d个参数个参数

26、 协方差矩阵:对称的协方差矩阵:对称的d维矩阵,维矩阵, d(d+1)/2个参数个参数v等密度点的轨迹为一超椭球面等密度点的轨迹为一超椭球面 11/2/211exp22Tdpxxx要使密度要使密度p(x)值不变,需指数项为常数,即:值不变,需指数项为常数,即:1Txx常数超椭球面超椭球面精选ppt多元正态分布的性质多元正态分布的性质v马氏距离马氏距离(Mahanlanobis Distance)(Mahanlanobis Distance):2111()()()()0nnTijiijjijXXpxx与与 欧式距离:欧式距离:() ()Txx不同,马氏距离考虑数据的统计分布,在模式识别不同,马氏

27、距离考虑数据的统计分布,在模式识别中有广泛的用处。中有广泛的用处。精选ppt多元正态分布的性质多元正态分布的性质v正态分布的随机变量,不相关等价于独立正态分布的随机变量,不相关等价于独立v边缘分布仍是正态分布边缘分布仍是正态分布精选ppt多元正态分布的性质多元正态分布的性质v线性变换仍是正态分布线性变换仍是正态分布v线性组合仍是正态分布(线性变换的特例)线性组合仍是正态分布(线性变换的特例)一维正态一维正态随机变量随机变量精选ppt多元正态分布的性质多元正态分布的性质精选ppt正态分布的判别函数正态分布的判别函数v贝叶斯判别函数可以写成对数形式:贝叶斯判别函数可以写成对数形式: lnlniii

28、gpPxx 111ln2lnln222TiiiiiidgP xxxv类条件概率密度函数为正态分布时:类条件概率密度函数为正态分布时: 11/2/2i11exp22Tiidpxxx精选ppt正态分布的判别函数正态分布的判别函数v情况一:情况一:各类协方差阵相等,且各特征各类协方差阵相等,且各特征独立独立,方,方差相等差相等v情况二:情况二:各类协方差阵相等各类协方差阵相等v情况三:情况三:各类协方差阵不相等各类协方差阵不相等 任意的任意的1c 21c I精选ppt情况一:情况一:21c I 111ln2lnln222TiiiiiidgP xxx121iI将将代入代入 221lnconst2iii

29、gP xx得到决策函数得到决策函数展开决策函数展开决策函数 222111ln22TTTiiiiigP xx xx其中,二次项其中,二次项Tx x对所有的对所有的 i 是相等的是相等的精选ppt正交正交因此,等价的判决函数为:因此,等价的判决函数为: 102211ln2TTTiiiiiiigPww xxx121Tiiw021ln2TiiiiwP 其中:其中: ijggxx决策面决策面可以写成:可以写成:00Twxxijw2021ln2iijijjijppx其中:其中:过过 与与0 xw的超平面的超平面精选pptijpp当当012ijx,但是,如果但是,如果ijpp当当,向先验概率小的方向偏移。向

30、先验概率小的方向偏移。0 x位于两中心的中点;位于两中心的中点;22ij相对于平方距离相对于平方距离较小,那么判决边界的位置相较小,那么判决边界的位置相对于确切的先验概率值并不敏感。对于确切的先验概率值并不敏感。在此情况下,最优判决的规则为:在此情况下,最优判决的规则为: 为将某特征向量为将某特征向量x归类,通过测量每一归类,通过测量每一x到到c个均值向量中个均值向量中心的每一个欧氏距离,并将心的每一个欧氏距离,并将x归为离它最近的那一类。这样的归为离它最近的那一类。这样的分类器称为分类器称为“最小距离分类器最小距离分类器”。精选ppt情况一:最小距离分类器情况一:最小距离分类器ijpp最小距

31、离分类器最小距离分类器判决边界是判决边界是d-1维超平面,垂直于两类中心的连线维超平面,垂直于两类中心的连线精选ppt情况一:最小距离分类器情况一:最小距离分类器v上述结果表示在二维特征空间里,如下图所示:上述结果表示在二维特征空间里,如下图所示:可以推广到多类的情况,可以推广到多类的情况,注意这种分类方法没有不确定的区注意这种分类方法没有不确定的区域。域。 向先验概率向先验概率210 x2112()()PP0 x两类判决面两类判决面与与垂直,垂直,的中点的中点时时其交点为其交点为为为时时0 x较小类型的均值点偏移。较小类型的均值点偏移。12()()PP精选ppt各类的协方差矩阵相等,在几何上

32、,相当于各类样本各类的协方差矩阵相等,在几何上,相当于各类样本集中在以该类均值集中在以该类均值为中心的同样大小和形状的超椭为中心的同样大小和形状的超椭球内。球内。i1c 情况二:情况二:111( )()()ln2ln |ln()222Tiiiiiidg xxxP 决策函数决策函数不变,与不变,与 i 无关:无关:11( )()()ln()2Tiiiiig xxxP 精选ppt一个特例:一个特例:当当时,各样本先验概率相等。时,各样本先验概率相等。)()(21)(1iiTiixxxg)()(12iiTixx2i)()()(12iiTiixxxg其中:其中:为为x到均值点到均值点的的“马氏距离马氏

33、距离” (Mahalanobis)的平方。)的平方。22对于样本对于样本x 只要计算出只要计算出,把,把x归于归于最小的类别。最小的类别。 进一步简化:进一步简化: ()iPP精选ppt一般地,决策函数一般地,决策函数 11ln2TiiiigP xxx展开决策函数展开决策函数 11111ln22TTTiiiiigP xxxx1Txx对所有的对所有的 i 是相等的,则是相等的,则 11101ln2TTTiiiiiiigPwwxxx11 iiw 101ln2TiiiiwP 其中:其中:精选ppt正交正交 ijggxx决策面决策面可以写成:可以写成:00Twxx1ijw 其中:其中:过过 与与0 x

34、w的超平面的超平面0111ln2iijijTjijijPPx由于由于w并非沿着并非沿着ij方向,方向,因此分界面并非与均值因此分界面并非与均值间的连线垂直正交。间的连线垂直正交。精选ppt当各类先验概率不相等当各类先验概率不相等时,不在时,不在的中的中点上,而是偏向先验概点上,而是偏向先验概率较小的均值点。率较小的均值点。v上述结果表示在二维特征空间里,如下图所示:上述结果表示在二维特征空间里,如下图所示:)(210jix当各类先验概率相等时,当各类先验概率相等时,判决面与的交点判决面与的交点ji0 xji精选pptijpp时时决策面向先验概决策面向先验概率小的方向偏移率小的方向偏移精选ppt

35、情况三:情况三:任意的任意的ji111( )()()ln2ln |ln()222Tiiiiiidg xxxP 111( )()()ln |ln()22Tiiiiiig xxxP 210( )TTiiiig xx w xw xw去掉与去掉与i无关的项:无关的项:可以写为:可以写为:1212iiw 11 iiiw 1011lnln()22TiiiiiiwP 其中二次项,一次项系数和常数项分别为:其中二次项,一次项系数和常数项分别为:由于:由于:精选ppt( )( )0ijg xgx221100()()0TTijijijxwwxwwxwwii()iP对应的决策面为超二次曲面。对应的决策面为超二次曲面

36、。第第 i 类和第类和第 j 类的决策面为:类的决策面为:随着随着的不同,超二次曲面可以的不同,超二次曲面可以为:为:超球面、超椭球面、超抛物面、超双曲面,或超平超球面、超椭球面、超抛物面、超双曲面,或超平面等。面等。即:即:精选ppt甚至在方差不相等的一维高斯分布情况下,其判决区甚至在方差不相等的一维高斯分布情况下,其判决区域也可以不连通!域也可以不连通!精选ppt情况三:情况三:各类协方差不同,决策面为为超二次曲面。各类协方差不同,决策面为为超二次曲面。v上述结果表示在二维特征空间里,如下图所示:上述结果表示在二维特征空间里,如下图所示:精选ppt精选ppt正态分布的判别函数正态分布的判别

37、函数v例:两类正态分布样本:例:两类正态分布样本:1131/20,602 111,:N222,:N求决策面方程求决策面方程10.5P22320,202 20.5P精选ppt 122222gxlnTxx 111111gxlnTxx12 令令 12gxgx1111112222lnlnTTxxxx320331/2032ln2601/26201/22TT xxxx22221212121221/2126361/21/23213/22ln2xxxxxxxx精选ppt2211.833/163xx求决策面方程为:求决策面方程为:12和和中点中点偏下偏下精选ppt贝叶斯决策理论贝叶斯决策理论v引言引言v贝叶斯决

38、策常用的准则贝叶斯决策常用的准则v分类器,判别函数,决策面分类器,判别函数,决策面v正态分布的判别函数正态分布的判别函数vBayesianBayesian置信网置信网精选pptBayesian置信网置信网v有些情况下,随机变量的分布无法得到概率密度表有些情况下,随机变量的分布无法得到概率密度表达式,但是知道该随机变量和另外一个随机变量的达式,但是知道该随机变量和另外一个随机变量的关系。关系。vBayesianBayesian置信网(置信网( Bayesian Belief NetBayesian Belief Net)利用特征之间的相互影响(因果关系)来进行决策利用特征之间的相互影响(因果关系

39、)来进行决策用图的形式(有向无环图)表示表示因果依赖关系用图的形式(有向无环图)表示表示因果依赖关系更适合离散变量更适合离散变量又称为因果网(又称为因果网(causal network)置信网()置信网( Belief Net) 精选pptBayesian置信网置信网v实例的属性存在如下关系实例的属性存在如下关系 一些属性之间是一些属性之间是条件独立条件独立的的 一些属性之间存在一些属性之间存在条件依赖条件依赖(因果关系)(因果关系)vBayesianBayesian置信网可以看作是置信网可以看作是一种图关系的学习器一种图关系的学习器一种表达因果关系的联合概率分布一种表达因果关系的联合概率分布

40、精选pptBayesian置信网置信网vBayesian Belief Net结构:结构:有向无环图有向无环图顶点:顶点:特征变量特征变量边:边:起点变量对终点变量起点变量对终点变量的影响(条件概率)的影响(条件概率)例子:例子:如右图如右图精选ppt条件独立条件独立v纵向条件独立的定义:纵向条件独立的定义:纵向条件独立(如右图):给定纵向条件独立(如右图):给定 b ,变量变量 a 与变量与变量 c 条件独立。条件独立。总结:总结:如果如果 a 到到 c 之间存在通路,给之间存在通路,给定定 a c 上比上比c更近的变量更近的变量 b ,则,则 a 与与 c 在给定在给定 b 条件下独立。条

41、件下独立。,PPc b ac b PPc ac与独立有区别与独立有区别精选ppt条件独立条件独立v横向条件独立的定义:横向条件独立的定义:横向条件独立(如右图):给定横向条件独立(如右图):给定 a ,变量,变量 b 与变量与变量 c 条件独立。条件独立。总结:总结:如果如果 b 到到 c 之间不存在通路,给定之间不存在通路,给定 c 的所有直接变量的所有直接变量 a ,则,则 b 与与 c 在给定在给定 a 条件下独立。条件下独立。与独立有区别与独立有区别 ,PPPb cbc ,PPPb c ab ac a,PPc a bc a,PPb a cb a精选ppt联合概率的计算联合概率的计算v联

42、合概率的计算:联合概率的计算: , ,PPPPPPPPPa b cab c aab ac a bab ac b , ,PPPPPPPPPa b cab c aab ac a bab ac a精选ppt联合概率的计算联合概率的计算v联合概率的计算:联合概率的计算: , , ,PPPPPPPPPPPPPPPPPPa,b,c,dab c,d aab ac,d a bab ac a bd a b cab ac ad a b cab ac ad b c精选ppt联合概率的计算联合概率的计算v更复杂的例子更复杂的例子 , , , , , ,PPPPPPPPa b c d e f gabd bc a de

43、cf eg e f精选ppt联合概率的计算联合概率的计算v原子概率原子概率 , , ,PPPPPc s r wcs cr cw s r,PTTTTcsrw称为一个称为一个原子概率原子概率精选ppt,PTFFTcsrw,0.5 0.9 0.2 00PTFFTPT PFTPFTPTFFcsrwcscrcwsr例子例子求:求:精选ppt,PTFFFcsrw,0.5 0.9 0.2 10.09PTFFFPT PFTPFTPFFF csrwcscrcwsr例子例子求:求:精选ppt,PTTTTcsrw,0.5 0.1 0.8 1.00.04PTTTTPT PTTPTTPTTTcsrwcscrcwsr例子

44、例子求:求:精选ppt,PTTcw,0.040.0090.32400.373PTTPTTTTPTTFTPTFTTPTFFTcwcsrwcsrwcsrwcsrw例子例子求:求:精选ppt条件概率的计算条件概率的计算v条件概率计算:条件概率计算: ,PPPa bb aa, , , , , , , , , , ,PPPa b c d e f ge f g a b c da b c d精选pptPTTwc,0.3730.50.746PTTPTTPTwccwc例子例子求:求:精选pptBayesian置信网置信网vBayesian置信网的决策置信网的决策确定性证据决策确定性证据决策( 朴素朴素Bayesian BN决策决策)不完整确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论