正态分布中的Bayes决策_第1页
正态分布中的Bayes决策_第2页
正态分布中的Bayes决策_第3页
正态分布中的Bayes决策_第4页
正态分布中的Bayes决策_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.3正态分布时的统计决策Bayes决策的三个前提:类别数确定各类的先验概率P(ωi)已知各类的条件概率密度函数p(x|ωi)已知Bayes决策中,类条件概率密度的选择要求:模型合理性计算可行性最常用概率密度模型:正态分布观测值通常是很多种因素共同作用的结果,根据中心极限定理,它们(近似)服从正态分布。计算、分析最为简单的模型。

一、正态分布判别函数

1、为什么采用正态分布:

a、正态分布在物理上是合理的、广泛的。

b、正态分布数学上简单,N(μ,σ²)只有均值和方差两个参数。§2-3.1正态分布决策理论32021/5/92、单变量正态分布:42021/5/9从p(x)的图形上可以看出,只要有两个参数m和s2,就可以完全确定其曲线。

若服从正态分布的总体中随机抽取样本x,约有95%的样本落在(m-2s,m+2s)中。样本的分散程度可以用s来表示

,s越大分散程度越大。

52021/5/9

正态分布是指一个随机实数度量值在整个实数域上的分布规律。因此它属于概率密度函数类,不是我们所讨论的先验概率P(ωi),也不是后验概率P(ωi|X),而是p(x|ωi)。62021/5/93、(多变量)多维正态分布为d维均值向量也就是:(1)函数形式:x=(x1,x2,…,xd)T为d维随机向量S是d×d维协方差矩阵,S-1是S的逆矩阵,|S|为S的行列式。协方差矩阵S是对称的,其中有d×(d+1)/2个独立元素。

72021/5/9

由于r(x)可由m和S完全确定,所以实际上r(x)可由d×(d+1)/2+d个独立元素来确定。m、S分别是向量x和矩阵(x-m)(x-m)T的期望。

多元正态分布与单态量正态分布在形式上尽管不同,但有很多相似之处,实际上单变量正态分布只是维数为1的多元分布。82021/5/9

当d=1时,Σ只是一个1×1的矩阵,也就是只有1个元素的矩阵,退化成一个数,|Σ|1/2也就是标准差σ,Σ-1也就是σ-2,而(X-μ)T(X-μ)也变成(X-μ)2,

多元正态分布的概率密度函数中的元就是我们前面说得特征向量的分量数,也就是维数。

92021/5/9具体说:若xi是x的第i个分量,mi是m的第i个分量,sij2是S的第i、j个元素。其中r(xi)为边缘分布,

102021/5/9协方差矩阵:

是一个对称矩阵,只考虑S为正定矩阵的情况,也就是:

|S|所有的子式都大于0112021/5/9

同单变量正态分布一样,多元正态分布r(x)可以由m和S完全确定,常记为N(m,S)。122021/5/9(2)多元正态分布的性质参数μ和Σ完全决定分布等概率密度轨迹为超椭球面不相关性等价于独立性边缘分布和条件分布的正态性线性变换的正态性线性组合的正态性132021/5/9①.参数m和S对分布的决定性

对于d维随机向量x,它的均值向量m也是d维的,协方差矩阵是对称的,其中有d×(d+1)/2个独立元素。

r(x)可由m和S完全确定,实际上r(x)可由d×(d+1)/2+d个独立元素决定。常记为:

r(x)~N(m,S)142021/5/9②.等密度点的轨迹为一超椭球面

由r(x)的定义公式可知,右边指数项为常数时,密度r(x)的值不变,所以等密度点满足:

二维情况下,上式的解是一个椭圆轨迹,其长短轴方向由Σ协方差矩阵的特征向量决定,三维时是一个椭球面,超过三维则是超椭球面,主轴方向由协方差矩阵S的特征向量决定,各主轴的长度则与相应的特征值成正比。152021/5/9

从下图可以看出,从正态分布总体中抽取的样本大部分落在由m

和S所确定的一个区域里,这个区域的中心由均值向量m决定,区域的大小由协方差矩阵决定。162021/5/9在数理统计中,令:式中g称为x到m的马氏距离(Mahalanobis)距离。

所以等密度点轨迹是x到m的马氏距离g为常数的超椭球面。

172021/5/9③.不相关性等价于独立性

概率论中,一般来说,两个随机变量xi和xj之间不相关,并不意味着它们一定独立。

如果xi和xj之间不相关,则xixj的数学期望有:如果xi和xj相互独立,则有:182021/5/9

如果xi和xj相互独立,则它们之间一定不相关,反之则不成立。

但是对服从正态分布的两个分量xi和xj,若xi和xj互不相关,则它们之间一定独立。证明:见书P27

根据独立性的定义:正态分布随机向量的各分量间互不相关性与相互独立等价。

独立性是比不相关更强的条件。不相关反映了xi和xj的总体性质。

192021/5/9④.边缘分布与条件分布的正态性从(3)证明得出的结论r(x)表达式,如果x用xj表示,有:

也就是说,边缘分布r(x1)服从均值为m,方差为s112的正态分布:同理,202021/5/9二元正态分布协方差矩阵∑及其逆矩阵∑-1为下面以二元正态分布为例进行证明212021/5/9根据边缘分布定义222021/5/9=1

另外,条件分布,给定x1的条件下x2的分布:证明条件分布仍然是正态分布(作业题)232021/5/9⑤.线性变换的正态性

对于多元随机向量的线性变换,仍为多元正态分布的随机向量。

就是:x服从正态分布r(x)~N(m,S),对x作线性变换y=Ax,其中A为线性变换矩阵,且|A|≠0,则y服从正态分布:r(x)~N(Am,ASAT)证明:x经过变换为y,设变换矩阵A为非奇异矩阵,y=Ax即x=A-1y242021/5/9即Ex=m,Ey=n根据雅克比行列式的定义,有|J|=|A|x的均值向量为m,y的均值向量为n所以y的概密函数与x的概密函数之间的关系为:所以:n

=Am

即m

=A-1n252021/5/9由于:|A|=|AT|=|AA|1/2(对称正定)由上面的结论可以得到:262021/5/9即:

性质5说明了用非奇异阵A对x作线性变换后,原来的正态分布正好变成另一个参数不同的正态分布。

由于∑是对称阵,根据高等代数知识总可以找到某个A,使得变换后y的协方差矩阵A∑AT为对称阵,

这就意味着y的各个分量之间是相互独立的,也就是总可以找到一组坐标系,使各随机变量在新的坐标系下是独立的。272021/5/9⑥.线性组合的正态性

若x为多元正态随机向量,则线性组合y=aTx是一维的正态随机变量:其中,a与x同维。证明

利用性质(5)做线性变换y=ATx,得282021/5/9

由性质(5),y是服从均值向量ATm,协方差阵AT∑A的多元统计分布,

由性质(4),

y的边缘分布的正态性,可以得出y=aTx服从正态分布,

其概率密度函数为:其中A=[a,A1]为非奇异阵,A1为d×(d-1)为矩阵,y=[y,Y1]T292021/5/92.3.2正态分布中的Bayes分类方法

前面,我们已经把基于Bayes公式的几种分类判决规则抽象为相应的判决函数和决策面方程。这几种方法中Bayes最小错误率判决规则是一种最基本的方法。

如果取0-1损失函数,最小风险判决规则和最大似然比判决规则均与最小错误判决规则等价。

302021/5/9

下面以最小错误判决规则为例来研究Bayes分类方法在正态分布中的应用。

由最小错误率判决规则抽象出来的判决函数如下:

如果类概率密度是正态分布的,312021/5/9则r(x|wi)~N(mi,Si)。

取对数,得判别函数为322021/5/9下面对几种特殊情况进行讨论。情况一:

该情况下,每类的协方差矩阵相等,而且类的各特征间相互独立(由上节的性质③得知),具有相等的方差s2。332021/5/9因此:(1)先验概率P(wi)与P(wj)不相等342021/5/9其中:将上两式代入gi(x):为x到类wi的均值向量mi的“欧氏距离”的平方。与类别无关,可以忽略,因此gi(x)可简化为:352021/5/9进一步简化得。xTx与i无关,可以忽略:362021/5/9是一个线性函数。因此可以进一步写成372021/5/9(2)P(wi)=P,所有各类概率相等

决策规则:对某个x计算

为线性函数,其决策面由线性方程决策面是一个超平面。382021/5/9满足的x的轨迹是wi

与wj

类间的决策面当P(wi)=P(wj)时,超平面通过mi

与mj连线中点并与连线正交392021/5/9两个同心圆是两类概率分布等密度点轨迹,两个圆心就是两类的均值点。两类的区分线l与m1-m2垂直,其交点为x0

若P(w1)≠P(w2)时,x0向先验概率较小的那个类型的均值点偏移。

x0一般不是m1-m2的中点,但当P(w1)=P(w2)时,x0为m1-m2的中点。

402021/5/9情况二:Σi=

Σ相等,即各类协方差相等

从几何上看,相当于各类样本集中于以该类均值点为中心的同样大小和形状的超椭球面内。412021/5/9

对于未知的x,如果把x与各类均值相减,即相当于Mahalanobis距离的平方。这时把x归于最近一类。称为最小距离分类器。与类别无关,可以忽略,422021/5/9gi(x)为线性函数,故决策面是一个超平面。432021/5/9如果决策域R1和R2相邻,则决策面方程应满:如果各类的先验概率相等,则442021/5/9下面针对ω1,ω2二类情况进行讨论452021/5/9情况三:Σί为任意,各类协方差矩阵不等这时判别函数为x的二次型。462021/5/9如果决策域,R1和R2相邻,则决策面方程应满足472021/5/9482021/5/9492021/5/92.4关于分类器的错误率问题

在分类过程中,任何一种决策规则都有其相应的错误率,当采用指定的决策规则来对类条件概率密度及先验概率均为已知的问题进行分类时,它的错误率是固定的。错误率反映了分类问题固有的复杂性的程度。对同一种问题设计出的多种不同的分类方案,通常总是以错误率大小作为比较方案好坏的标准。因此,在本书中错误率是非常重要的参数。502021/5/92.4.0两类决策的错误率为下式

从上式可以看出当x为多维向量的时候,进行积分运算的工作量比较大。

因此对于实际问题,对错误率的研究一般从下面三点出发:1、按理论公式研究。2、计算错误率上界3、实验估计512021/5/92.4.1在一些特殊情况下错误率的理论计算第一种情况---正态分布且等协方差矩阵S1=S2=S3下面回顾一下最小错误率贝叶斯决策的负对数似然比函数很显然,h(x)为随机变量,记它的分布函数为P(h|wi)522021/5/9这样贝叶斯决策的最小错误率形式

在实际情况下,我们只考虑正态分布,因此h(x)可以写成如下形式:532021/5/9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论