




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选优质文档-倾情为你奉上实验二 贝叶斯最小错误率分类器设计一、实验目的1. 了解模式识别中的统计决策原理2. 熟悉并会根据给出的相关数据设计贝叶斯最小错误率分类器。3. 熟悉并会使用matlab进行相关程序的编写二、实验原理分类器的设计首先是为了满足对数据进行分门别类,是模式识别中一项非常基本和重要的任务,并有着极其广泛的应用。其定义是利用预定的已分类数据集构造出一个分类函数或分类模型(也称作分类器),并利用该模型把未分类数据映射到某一给定类别中的过程。分类器的构造方法很多,主要包括规则归纳、决策树、贝叶斯、神经网络、粗糙集、以及支持向量机(SVM)等方法。其中贝叶斯分类方法建立在贝叶斯统计
2、学的基础之上,能够有效地处理不完整数据,并且具有模型可解释、精度高等优点,而被认为是最优分类模型之一。本实验就是基于贝叶斯方法的分类器构造,其中构造的准则是最小错误率。下面,我们对最小错误率的分类器设计做一个简单的回顾。假设是一个二类的分类问题,有两类。若把物体分到类中,那么所犯的错误有两种情况,一种是物体本属于类,分类正确,错误率为0;另一种情况是,物体本属于类,分类错误,错误率就为。因此,要使得错误率最小的话,就应该最大。而第一种情况,也可以归属于。因此,基于贝叶斯最小错误率的二类分类决策规则可以表述为如下表达式。同理,推广到多类分类,比如说有N类时,贝叶斯最小错误率分类决策规则可以做出如
3、下表述:从上述表达式,我们可以看出,贝叶斯最小错误率分类器设计的决策规则就相当于后验概率最大的决策规则。三、实验内容与要求1. 实验数据任务:将细胞识别进行正常和异常的两类分类已知数据:假定某个局部区域细胞识别中正常()和非正常()两类,其中先验概率分别为正常状态:P()=0.9;异常状态:P()=0.1。两类的类条件概率分布为参数是(-2,0.25)和(2,4)的正态分布。现有一系列待观察的细胞,其观察值为表1所示。 序号12345678观察值3.9847-3.55491.2401-0.9780-0.7932-2.8531-2.7605-3.7287类别序号910111213141516观察
4、值-3.5414-2.2692-3.4549-3.0752-3.9934 2.8792-0.9780 0.7932类别序号1718192021222324观察值1.18823.0682-1.5799 1.4885 0.7431-0.4221-1.1186 4.2532 类别2. 实验要求 (1)用Matlab完成分类器的设计,要求程序相应语句有说明文字,最好有子程序的调用过程。 (2)根据例子画出后验概率的分布曲线,并给出分类的结果填入表1中。 选作:假若决策准则为贝叶斯最小风险,且决策表如下所示:最小风险贝叶斯决策表:状态决策106210请重新设计程序,画出相应的后验概率的分布曲线和分类结果
5、,并比较两个结果。实验原理及内容: 在已知P(wi),P(X|wi) ,i=1,c 及给出待识别的X的情况下,根据贝叶斯公式计算出后验概率:假设是一个二类的分类问题,有两类。若把物体分到类中,那么所犯的错误有两种情况,一种是物体本属于类,分类正确,错误率为0;另一种情况是,物体本属于类,分类错误,错误率就为。因此,要使得错误率最小的话,就应该最大。而第一种情况,也可以归属于。因此,基于贝叶斯最小错误率的二类分类决策规则可以表述为如下表达式。将X归类于后验概率最小的那一类。 序号12345678观察值3.9847-3.55491.2401-0.9780-0.7932-2.8531-2.7605-
6、3.7287类别W1W1W1W1W1W1W1W1序号910111213141516观察值-3.5414-2.2692-3.4549-3.0752-3.9934 2.8792-0.9780 0.7932类别W1W1W1W1W1W2W1W2序号1718192021222324观察值1.18823.0682-1.5799 1.4885 0.7431-0.4221-1.1186 4.2532 类别W2W2W1W1W1W2W1W2实验程序:x= -3.9847 -3.5549 -1.2401 -0.9780 -0.7932 -2.8531 -2.7605 -3.7287 -3.5414 -2.2692
7、-3.4549 -3.0752 -3.9934 2.8792 -0.9780 0.7932 1.1882 3.0682 -1.5799 -1.4885 -0.7431 -0.4221 -1.1186 4.2532 pw1=0.9 ; pw2=0.1 e1=-2; a1=0.5 e2=2;a2=2 m=numel(x) %得到待测细胞个数 pw1_x=zeros(1,m) %存放对w1的后验概率矩阵 pw2_x=zeros(1,m) %存放对w2的后验概率矩阵 results=zeros(1,m) %存放比较结果矩阵 for i = 1:m %计算在w1下的后验概率 pw1_x(i)=(pw1*
8、normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2) %计算在w2下的后验概率 pw2_x(i)=(pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2) end for i = 1:m if pw1_x(i)>pw2_x(i) %比较两类后验概率 result(i)=0 %正常细胞 else result(i)=1 %异常细胞 end end a=-5:0.05:5 %取样本点以画图n=numel(a) pw1_p
9、lot=zeros(1,n) pw2_plot=zeros(1,n) for j=1:n pw1_plot(j)=(pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2) %计算每个样本点对w1的后验概率以画图pw2_plot(j)=(pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2) end figure(1) hold on plot(a,pw1_plot,'k-',a,pw2_plot,
10、39;r-.') for k=1:m if result(k)=0 plot(x(k),-0.1,'b*') %正常细胞用*表示 else plot(x(k),-0.1,'rp') %异常细胞用五角星表示 end; end;legend('正常细胞后验概率曲线','异常细胞后验概率曲线','正常细胞','异常细胞') xlabel('样本细胞的观察值') ylabel('后验概率') title('后验概率分布曲线') grid on return ;实验结果与分析曲线分析如下后验概率曲线与判决结果在一张图上:后验概率曲线如图所示,带*的曲线为判决成异常细胞的后验概率曲线;另一条平滑的曲线为判为正常细胞的后验概率曲线。根据最小错误概率准则,判决结果见曲线下方,其中“*”代表判决为正常细胞,“五角星”代表异常细胞各细胞分类结果: 各细胞分类结果: 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 0 0 0 1 0 1 0为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 藤编工艺在生态旅游纪念品开发考核试卷
- 通讯设备租赁市场服务创新考核试卷
- 公路工程气候因素分析试题及答案
- 城市绿化管理管理制度
- 厨房面点卫生管理制度
- 安全监控系统管理制度
- 医院常用设备管理制度
- 工厂复工仓库管理制度
- 处理器架构比较试题及答案
- 大学保安门卫管理制度
- 马拉松赛事运营服务方案
- 跨学科学习:一种基于学科的设计、实施与评价
- 2020年江西省上饶市万年县中小学、幼儿园教师进城考试真题库及答案
- 小区燃气管道施工方案施工方法
- JTT664-2006 公路工程土工合成材料 防水材料
- 教学能力比赛学情分析图(源图可编辑)
- 幼儿园2024-2025学年保教工作计划
- 燕舞集团招聘试题
- 小学心理健康教育《积极心态(1)》优质课教案、教学设计
- 甬统表(工程表格全套)
- 软件架构与系统稳定性
评论
0/150
提交评论