贝叶斯决策理论课件讲义和关于风险概念的进一步讨论_第1页
贝叶斯决策理论课件讲义和关于风险概念的进一步讨论_第2页
贝叶斯决策理论课件讲义和关于风险概念的进一步讨论_第3页
贝叶斯决策理论课件讲义和关于风险概念的进一步讨论_第4页
贝叶斯决策理论课件讲义和关于风险概念的进一步讨论_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章贝叶斯决策理论2.1引言2.2几种常用的决策规则2.2.1基于最小错误率的贝叶斯决策2.2.2基于最小风险的贝叶斯决策2.2.3限定一类错误率,使另一类错误率最小2.2.4最小最大决策2.2.5分类器、判别函数及决策面2.3正态分布时的统计决策2.1引言模式识别的目的就是要确定某一个给定的模式样本属于哪一类可以通过对被识别对象的多次观察和测量,构成特征向量,并将其作为某一个判决规则的输入,按此规则来对样本进行分类作为统计判别问题的模式分类在获取模式的观测值时,有些事物具有确定的因果关系,即在一定的条件下,它必然会发生或必然不发生例如识别一块模板是不是直角三角形,只要凭“三条直线边闭合连线和一个直角”这个特征,测量它是否有三条直线边的闭合连线并有一个直角,就完全可以确定它是不是直角三角形这种现象是确定性的现象但在现实世界中,由许多客观现象的发生,就每一次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性只有在大量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性特征值不是一个确定的向量,而是一个随机向量此时,只能利用模式集的统计特性来分类,以使分类器发生错误的概率最小作为统计判别问题的模式分类统计识别的基本方法——贝叶斯决策应用贝叶斯决策的前提条件已知各类别总体的概率分布已知决策分类的类别数在已知相关概率(类别先验概率和类条件概率分布)的情况下,特征空间中一个观察量的类别归属问题2.2几种常用的决策规则主要学习最小错误率Bayes错误和最小风险决策;了解在更复杂情况下的几种决策规则讨论决策规则用于模式识别的几个问题2.2.1基于最小错误率的贝叶斯决策从尽量减少错误的角度出发,利用贝叶斯公式得出使错误最小的分类原则以癌细胞识别的例子引出贝叶斯决策贝叶斯决策的出发点癌细胞识别,两类别问题——细胞正常与异常若仅利用先验概率进行分类统计的角度得出的两类细胞的出现概率无法实现正常与异常细胞的分类目的先验概率提供的信息太少,要结合样本观测信息,为此需要利用类条件概率贝叶斯公式p各类样本的分布情况贝叶斯决策的几种表达形式两类模式集分类问题对一大批人进行癌症普查,患癌者以ω1类代表,正常人以ω2类代表设被试验的人中患有癌症的概率为0.005,即P(ω1)=0.005,当然P(ω2)=1-0.005=0.995现任意抽取一人,要判断他是否患有癌症。显然,因为P(ω2)>P(ω1),只能说是正常的可能性大。如要进行判断,只能通过化验来实现应用实例设有一种诊断癌症的试验,其结果为“阳性”和“阴性”两种反应若用这种试验来对一个病人进行诊断,提供的化验结果以模式x代表,这里x为一维特征,且只有x=“阳”和x=“阴”两种结果寻找样本观测量

假设根据临床记录,发现这种方法有以下统计结果患有癌症的人试验反应为阳性的概率=0.95,即p(x=阳|ω1)=0.95患有癌症的人试验反应为阴性的概率=0.05,即p(x=阴|ω1)=0.05正常人试验反应为阳性的概率=0.01,即p(x=阳|ω2)=0.01正常人试验反应为阴性的概率=0.99,即p(x=阴|ω2)=0.99观测量的类条件概率应用贝叶斯决策问题若被化验的人具有阳性反应,他患癌症的概率为多少,即求P(ω1|

x=阳)=?这里P(ω1)是根据以往的统计资料得到的,为患癌症的先验概率。现在经过化验,要求出P(ω1|

x=阳),即经过化验后为阳性反应的人中患癌症的概率,称为后验概率[计算]0.323最小错误率的证明以一维情况为例证明贝叶斯决策确实对应最小错误率统计意义上的错误率,即平均错误率,用P(e)表示最小错误率的证明错误率图示以t为界确实使错误率最小,因为P(e/x)始终取最小这个图在哪见过?与图像分割中最优阈值对应的错误分割结果类似,最优阈值同样是基于最小错误概率图像分割蕴含了与模式识别类似的思想,即判定给定像素属于目标还是背景多类问题的贝叶斯决策2.2.2基于最小风险的贝叶斯决策问题的提出:风险的概念风险与损失紧密相连,如病情诊断、商品销售等问题日常生活中的风险选择,所谓是否去冒险最小风险贝叶斯决策考虑各种错误造成损失不同而提出的一种决策规则“宁可错杀一千,也不放走一个”以决策论的观点决策空间:所以可能决策组成的集合每个决策都将带来一定的损失,可表示为决策和自然状态的函数一般决策表相关的数学表示条件期望损失引入损失的概念,制定决策不能仅考虑最小错误率,而是要考虑采取的决策相应的损失是否最小损失的数学表示,跟决策相关——条件期望损失,条件风险对于特定的x采取决策αi

的期望损失期望风险最小风险贝叶斯决策最小风险贝叶斯决策步骤对两类问题对两类问题最小风险贝叶斯决策示例最小风险贝叶斯决策示例上一节的例子检验呈阳性者患病概率是0.323若按最小错误率决策:正常ω2采用最小风险决策,需要用到损失函数损失的评估是个关键问题宁可虚惊一百不可漏诊一人最小风险贝叶斯决策的讨论除了知道最小错误贝叶斯决策也需要的先验概率和类条件概率外,损失函数的确定往往也是一个难题与最小错误贝叶斯决策的关系差别在于是否考虑风险,即错误损失最小风险决策可看作加权形式的最小错误决策,加权值即损失函数取特定形式时二者可能等价,如损失函数取0-1形式定义损失函数2.2.3限定一类错误率,使另一类错误率最小条件极值问题利用拉格朗日乘子法将条件极值转化为无条件极值条件极值问题似然比——决策规则比较最终结果的似然比表示形式最小错误率Bayes决策的表示形式最小风险Bayes决策的表示形式似然的含义似然——likelihood表明在其他条件都相等的情况下,使得较大的更有可能是真实的类别2.2.4最小最大决策以两类情况下的最小风险Bayes决策为例进行讨论总风险公式假定决策域已经确定,我们以表示分类器判为时的特征空间中的区域,同样有和,于是总风险用条件风险的形式表示为一旦和确定,风险就是先验概率的线性函数,可表示为由于)(1wP在0和1之间取值,所以期望风险有baRa+££由上式可见,当类条件概率密度、损失函数ij、类域Ri

取定后,R是P(1)的线性函数。考虑P(1)的各种可能取值情况,为此在区间(0,1)中取若干个不同的P(1)值,并分别按最小损失准则确定相应的最佳决策类域R1、R2,然后计算出其相应的最小平均损失R*,从而可得最小平均损失R*与先验概率P(1)的关系曲线。最小最大决策图示最小风险R*与先验概率的关系曲线先验概率取固定值的最小风险先验概率为的最小风险分类结果对应各种先验概率的风险变化为何为切线?尽管对应的最小风险相对其他先验概率最大,但不管先验概率如何变化,此种分类风险恒定,从而使所有可能的最大风险最小化小结:各种情况下的方法选择在某些实际问题中,可能存在以下几种情况:⑴

不知道各类的先验概率)(iPw⑵

难于确定误判的代价ijl⑶

某一种错误较另一种错误更为重要针对⑴,可以采用最小最大损失准则或简单令各类先验概率相等针对⑶,N-P准则针对⑵,如果允许的话,可以避开使用损失函数而采用最小误判概率准则2.2.5分类器、判别函数及决策面应用前述Bayes决策规则,设计分类器对观察量实施分类用于表达决策规则的某些函数称为判别函数;是直接用来对模式样本进行分类的准则函数对于c类问题,按照决策规则把d维特征空间分成c个决策域,划分决策域的边界面称为决策面多类问题——最小错误率决策规则多类问题——判别函数多类问题——决策面多类问题——分类器两类情况——决策规则两类问题——判别函数两类问题——决策面两类问题——分类器例题:教材23页,套公式2.3正态分布时的统计决策贝叶斯分类器的结构可由条件概率密度和先验概率来决定最受青睐的密度函数——正态分布,也称高斯分布合理性:中心极限定理表明,在相当一般的条件下,当独立随机变量的个数增加时,其和的分布趋于正态分布简易性2.3.1正态分布的定义及性质单变量正态分布由两个参数完全确定,即均值和方差正态分布概率密度函数在整个定义域上积分为1服从正态分布的样本聚集在均值附近,其散布程度与标准差(方差)有关多元正态分布均值向量协方差矩阵多元正态分布的概率密度函数定义协方差矩阵的计算计算公式,计算协方差矩阵。已知协方差矩阵的性质对称非负定阵元素正负?元素含义:对角线和非对角线协方差:用来度量变量之间“协同变异”大小的总体参数,即二者相互影响大小的参数;绝对值越大,相互影响越大对角阵情形;去相关多元正态分布的性质均值向量和协方差矩阵共同决定分布均值向量有d个分量协方差矩阵独立元素个数为d(d+1)/2多元正态分布由d+d(d+1)/2个参数完全决定,常表示为多元正态分布的性质等密度点的轨迹是超椭球面多元正态分布的性质马氏距离:

到的Mahalanobis距离等密度点轨迹是到均值向量的马氏距离为常数的超椭球面样本离散度由决定;同单变量正态分布类似,方差影响样本分布的疏密程度椭圆主轴的确定为简单处理,将椭球中心移至原点来求椭球长短轴设在超椭球上,到超椭球中心的距离为,求主轴长度即是求其条件极值,构造Lagrange函数对的椭圆第i个主轴的长度与Σ的第i个特征值的平方根成正比,方向由对应特征向量的方向决定多元正态分布的性质不相关性等价于独立性边缘分布和条件分布的正态性线形变换的正态不变性通过变换,能使本来相关的随机变量在新的坐标系中独立;便于处理多元正态分布的性质多元正态分布的性质线形组合的正态不变性线性变换的特例2.3.2多元正态下的最小错误率决策下面根据上式对以下三种情况进行讨论。…决策面方程(1),即每类的协方差矩阵都相等,而且类内各特征间相互独立,具有相等的方差Ⅰ如果先验概率不等,那么平方距离(欧氏距离)必须通过方差进行归一化,并通过增加进行修正。Ⅱ如果先验概率相等称其为最小距离分类器。可看作线性分类器对其,我们用一个二维二类模式例子,设先验概率相等,从几何上表示其关系(不相等的情况请参照教材P32)(2),即各类的协方差矩阵都相等如果先验概率相等,只要计算到各类的均值点的马氏距离平方,然后把归于距离平方最小的类别。对以上两类情况进行化简决策面方程只要协方差矩阵相等,先验概率相等,就对应最小距离分类器,包括欧式距离和马氏距离对其,我们用一个二维二类模式例子,设先验概率相等,从几何上表示其关系(2)各类的协方差矩阵不相等二维模式,12的几种情况R1R2(a)圆,2类的方差小R1R2(b)椭圆,2类的方差小R1R2(c)抛物线,

2类的方差小R1R2(d)双曲线(e)直线,两类的分布关于一直线是对称R1R2例:模式分布如图所示,两类均值向量和协方差矩阵可用下式估计。(0,1,1)(1,1,1)(1,0,0)(1,0,1)(0,0,1)(0,0,0)12x2x1x321两类均作为正态分布,并假设先验概率相等,求故判别函数和决策面。(0,1,1)(1,1,1)(1,0,0)(1,0,1)(0,0,1)(0,0,0)12x2x1x321两类均作为正态分布,并假设,故判别函数为

第十四章关于风险概念的进一步讨论齐寅峰公司财务学经济科学出版社本章我们将指出上述风险的定义中的问题,提出风险的各种不同的定义方法,研究投资者对待风险的态度,进一步讨论回报率与风险的关系。这些讨论,对于把握难以捉摸的风险概念是至关重要的。齐寅峰公司财务学经济科学出版社第一节风险定义的问题一、“E-σ”分析失效的情形二、风险的其他定义齐寅峰公司财务学经济科学出版社一、“E-σ”分析失效的情形传统的投资组合分析中,每一备选方案都用两个数据来衡量:回报率的期望值E和回报率的均方差σ,并且假定投资者都偏好于大的期望回报率和小的均方差。

每个投资者都偏好于大的回报率期望值是一种理性的选择假设,任何情况下都不会发生怀疑。齐寅峰公司财务学经济科学出版社一、“E-σ”分析失效的情形(续)但是说投资者都是避免风险的,却值得怀疑。如果风险是指日常用语是指坏事而非好事,这倒也没错。但事实上用均方差定义风险,它表示回报率与期望值偏差的平方的期望值的方根,因此只是表明回报率的离散程度,而这种偏离可正可负。若是正偏离,即回报离高于其期望值,并不是坏事而是好事。只有负偏离,即回报率低于其期望值才是不好的事。在这种风险定义下,无法证明投资者都

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论