版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
...wd......wd......wd...信息与通信工程学院://模式识别实验报告://班级:姓名:学号:日期:2011年12月实验一、Bayes分类器设计一、实验目的:1.对模式识别有一个初步的理解2.能够根据自己的设计对贝叶斯决策理论算法有一个深刻地认识3.理解二类分类器的设计原理二、实验条件:matlab软件三、实验原理:最小风险贝叶斯决策可按以下步骤进展:1)在,,i=1,…,c及给出待识别的的情况下,根据贝叶斯公式计算出后验概率:j=1,…,x2)利用计算出的后验概率及决策表,按下面的公式计算出采取,i=1,…,a的条件风险,i=1,2,…,a3)对(2)中得到的a个条件风险值,i=1,…,a进展比拟,找出使其条件风险最小的决策,即则就是最小风险贝叶斯决策。四、实验内容假定某个局部区域细胞识别中正常〔〕和非正常〔〕两类先验概率分别为正常状态:P〔〕=0.9;异常状态:P〔〕=0.1。现有一系列待观察的细胞,其观察值为:-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.4885-0.7431-0.4221-1.11864.2532先验概率是的曲线如以以下图:类条件概率分布正态分布分别为〔-2,0.25〕〔2,4〕试对观察的结果进展分类。五、实验步骤:1.用matlab完成分类器的设计,说明文字程序相应语句,子程序有调用过程。2.根据例子画出后验概率的分布曲线以及分类的结果示意图。3.最小风险贝叶斯决策,决策表如下:状态决策α106α210重新设计程序,完成基于最小风险的贝叶斯分类器,画出相应的后验概率的分布曲线和分类结果,并比拟两个结果。六、实验代码1.最小错误率贝叶斯决策(m1.m)x=[-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.48850.7431-0.4221-1.11864.2532]pw1=0.9;pw2=0.1;e1=-2;a1=0.5;e2=2;a2=2;m=numel(x); %得到待测细胞个数pw1_x=zeros(1,m); %存放对w1的后验概率矩阵pw2_x=zeros(1,m); %存放对w2的后验概率矩阵results=zeros(1,m); %存放比拟结果矩阵fori=1:m%计算在w1下的后验概率pw1_x(i)=(pw1*normpdf(x(i),e1,a1))/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2));%计算在w2下的后验概率pw2_x(i)=(pw2*normpdf(x(i),e2,a2))/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2));endfori=1:mifpw1_x(i)>pw2_x(i)%比拟两类后验概率result(i)=0;%正常细胞elseresult(i)=1; %异常细胞endenda=[-5:0.05:5]; %取样本点以画图n=numel(a);pw1_plot=zeros(1,n);pw2_plot=zeros(1,n);forj=1:npw1_plot(j)=(pw1*normpdf(a(j),e1,a1))/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2));%计算每个样本点对w1的后验概率以画图pw2_plot(j)=(pw2*normpdf(a(j),e2,a2))/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2));endfigure(1);holdonplot(a,pw1_plot,'co',a,pw2_plot,'r-.');fork=1:mifresult(k)==0plot(x(k),-0.1,'cp');%正常细胞用五角星表示elseplot(x(k),-0.1,'r*');%异常细胞用*表示end;end;legend('正常细胞后验概率曲线','异常细胞后验概率曲线','正常细胞','异常细胞');xlabel('样本细胞的观察值');ylabel('后验概率');title('后验概率分布曲线');gridonreturn%实验内容仿真:x=[-3.9847,-3.5549,-1.2401,-0.9780,-0.7932,-2.8531,-2.7605,-3.7287,-3.5414,-2.2692,-3.4549,-3.075,-3.9934,2.8792,-0.9780,0.7932,1.1882,3.0682,-1.5799,-1.4885,-0.7431,-0.4221,-1.1186,4.2532]disp(x);pw1=0.9;pw2=0.1;[result]=bayes(x,pw1,pw2);2.最小风险贝叶斯决策(m2.m)x=[-3.9847-3.5549-1.2401-0.9780-0.7932-2.8531-2.7605-3.7287-3.5414-2.2692-3.4549-3.0752-3.99342.8792-0.97800.79321.18823.0682-1.5799-1.48850.7431-0.4221-1.11864.2532]pw1=0.9;pw2=0.1;m=numel(x); %得到待测细胞个数R1_x=zeros(1,m); %存放把样本X判为正常细胞所造成的整体损失R2_x=zeros(1,m); %存放把样本X判为异常细胞所造成的整体损失result=zeros(1,m); %存放比拟结果e1=-2;a1=0.5;e2=2;a2=2;%类条件概率分布px_w1:〔-2,0.25〕px_w2〔2,4〕r11=0;r12=2;r21=4;r22=0;%风险决策表fori=1:m%计算两类风险值R1_x(i)=r11*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))+r21*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2));R2_x(i)=r12*pw1*normpdf(x(i),e1,a1)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2))+r22*pw2*normpdf(x(i),e2,a2)/(pw1*normpdf(x(i),e1,a1)+pw2*normpdf(x(i),e2,a2));endfori=1:mifR2_x(i)>R1_x(i)%第二类比第一类风险大result(i)=0;%判为正常细胞〔损失较小〕,用0表示elseresult(i)=1;%判为异常细胞,用1表示endenda=[-5:0.05:5];%取样本点以画图n=numel(a);R1_plot=zeros(1,n);R2_plot=zeros(1,n);forj=1:nR1_plot(j)=r11*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))+r21*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))R2_plot(j)=r12*pw1*normpdf(a(j),e1,a1)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))+r22*pw2*normpdf(a(j),e2,a2)/(pw1*normpdf(a(j),e1,a1)+pw2*normpdf(a(j),e2,a2))%计算各样本点的风险以画图endfigure(1);holdonplot(a,R1_plot,'co',a,R2_plot,'r-.');fork=1:mifresult(k)==0plot(x(k),-0.1,'cp');%正常细胞用五角星表示elseplot(x(k),-0.1,'r*');%异常细胞用*表示end;end;legend('正常细胞','异常细胞','Location','Best');xlabel('细胞分类结果');ylabel('条件风险');title('风险判决曲线');gridonreturn%实验内容仿真:x=[-3.9847,-3.5549,-1.2401,-0.9780,-0.7932,-2.8531,-2.7605,-3.7287,-3.5414,-2.2692,-3.4549,-3.075,-3.9934,2.8792,-0.9780,0.7932,1.1882,3.0682,-1.5799,-1.4885,-0.7431,-0.4221,-1.1186,4.2532]disp(x);pw1=0.9;pw2=0.1;[result]=bayes(x,pw1,pw2);七、实验结果1.最小错误率贝叶斯决策后验概率曲线与判决显示在上图中后验概率曲线:带红色虚线曲线是判决为异常细胞的后验概率曲线青色实线曲线是为判为正常细胞的后验概率曲线根据最小错误概率准则,判决结果显示在曲线下方:五角星代表判决为正常细胞,*号代表异常细胞各细胞分类结果〔0为判成正常细胞,1为判成异常细胞〕:0000000000000101110001012.最小风险贝叶斯决策风险判决曲线如上图所示:带红色虚线曲线是异常细胞的条件风险曲线;青色圆圈曲线是正常细胞的条件风险曲线根据贝叶斯最小风险判决准则,判决结果显示在曲线下方:五角星代表判决为正常细胞,*号代表异常细胞各细胞分类结果〔0为判成正常细胞,1为判成异常细胞〕:100000000000110111000101八、实验分析由最小错误率的贝叶斯判决和基于最小风险的贝叶斯判决得出的图形中的分类结果可看出,样本-3.9934、-3.9847在前者中被分为“正常细胞〞,在后者中被分为“异常细胞〞,分类结果完全相反。分析可知在最小风险的贝叶斯判决中,影响结果的因素多了一个“损失〞。在第一张图中,这两个样本点下两类决策的后验概率相差很小,当结合最小风险贝叶斯决策表进展计算时,“损失〞起了主导作用,导致了相反的结果的出现。同时,最小错误率贝叶斯决策就是在0-1损失函数条件下的最小风险贝叶斯决策,即前者是后者的特例。九、实验心得通过本次实验,我对模式识别有了一个初步的理解,开场对模式识别的相关知识从书本上转移到了实践中,并跟据自己的设计对贝叶斯决策理论算法有一个深刻地认识,同时也理解二类分类器的设计原理。同时,之前只学过浅显的Matlab知识,用Matlab实现数值计算的能力又一次得到了训练,对以后的学习和实验都有极大的帮助。实验二、基于Fisher准则线性分类器设计一、实验目的:1.进一步了解分类器的设计概念2.能够根据自己的设计对线性分类器有更深刻地认识3.理解Fisher准则方法确定最正确线性分界面方法的原理及Lagrande乘子求解的原理二、实验条件:matlab软件三、实验原理:线性判别函数的一般形式可表示成
其中根据Fisher选择投影方向W的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,用以评价投影方向W的函数为:
上面的公式是使用Fisher准则求最正确法线向量的解,该式比拟重要。另外,该式这种形式的运算,我们称为线性变换,其中式一个向量,是的逆矩阵,如是d维,和都是d×d维,得到的也是一个d维的向量。
向量就是使Fisher准则函数达极大值的解,也就是按Fisher准则将d维X空间投影到一维Y空间的最正确投影方向,该向量的各分量值是对原d维特征向量求加权和的权值。以上讨论了线性判别函数加权向量W确实定方法,并讨论了使Fisher准则函数极大的d维向量的计算方法,但是判别函数中的另一项尚未确定,一般可采用以下几种方法确定如或者
或当与时可用……当W0确定之后,则可按以下规则分类,
使用Fisher准则方法确定最正确线性分界面的方法是一个著名的方法,尽管提出该方法的时间比拟早,仍见有人使用。四、实验内容:有两类数据和二者的概率=0.6,=0.4。中数据点的坐标对应一一如下:数据:x=0.23311.52070.64990.77571.05241.19740.29080.25180.66820.56220.90230.1333-0.54310.9407-0.21260.0507-0.08100.73150.33451.0650-0.02470.10430.31220.66550.58381.16531.26530.8137-0.33990.51520.7226-0.20150.4070-0.1717-1.0573-0.2099y=2.33852.19461.67301.63651.78442.01552.06812.12132.47971.51181.96921.83401.87042.29481.77142.39391.56481.93292.20272.45681.75231.69912.48831.72592.04662.02262.37571.79872.08282.07981.94492.38012.23732.16141.92352.2604z=0.53380.85141.08310.41641.11760.55360.60710.44390.49280.59011.09271.07561.00720.42720.43530.98690.48411.09921.02990.71271.01240.45760.85441.12750.77050.41291.00850.76760.84180.87840.97510.78400.41581.03150.75330.9548数据点的对应的三维坐标为x2=1.40101.23012.08141.16551.37401.18291.76321.97392.41522.58902.84721.95391.25001.28641.26142.00712.18311.79091.33221.14661.70871.59202.93531.46642.93131.83491.83402.50962.71982.31482.03532.60301.23272.14651.56732.9414y2=1.02980.96110.91541.49010.82000.93991.14051.06780.80501.28891.46011.43340.70911.29421.37440.93871.22661.18330.87980.55920.51500.99830.91200.71261.28331.10291.26800.71401.24461.33921.18080.55031.47081.14350.76791.1288z2=0.62101.36560.54980.67080.89321.43420.95080.73240.57841.49431.09150.76441.21591.30491.14080.93980.61970.66031.39281.40840.69090.84000.53811.37290.77310.73191.34390.81420.95860.73790.75480.73930.67390.86511.36991.1458数据的样本点分布如以以下图:五、实验步骤:1.把数据作为样本,根据Fisher选择投影方向的原则,使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,求出评价投影方向的函数,并在图形表示出来。并在实验报告中表示出来,并求使取极大值的。用matlab完成Fisher线性分类器的设计,程序的语句要求有注释。2.根据上述的结果并判断〔1,1.5,0.6〕(1.2,1.0,0.55),(2.0,0.9,0.68),(1.2,1.5,0.89),〔0.23,2.33,1.43〕,属于哪个类别,并画出数据分类相应的结果图,画出其在上的投影。3.答复如下问题,分析一下的比例因子对于Fisher判别函数没有影响的原因。六、实验代码(m3.m)x1=[0.23311.52070.64990.77571.05241.19740.29080.25180.66820.56220.90230.1333-0.54310.9407-0.21260.0507-0.08100.73150.33451.0650-0.02470.10430.31220.66550.58381.16531.26530.8137-0.33990.51520.7226-0.20150.4070-0.1717-1.0573-0.2099];x2=[2.33852.19461.67301.63651.78442.01552.06812.12132.47971.51181.96921.83401.87042.29481.77142.39391.56481.93292.20272.45681.75231.69912.48831.72592.04662.02262.37571.79872.08282.07981.94492.38012.23732.16141.92352.2604];x3=[0.53380.85141.08310.41641.11760.55360.60710.44390.49280.59011.09271.07561.00720.42720.43530.98690.48411.09921.02990.71271.01240.45760.85441.12750.77050.41291.00850.76760.84180.87840.97510.78400.41581.03150.75330.9548];%将x1、x2、x3变为行向量x1=x1(:);x2=x2(:);x3=x3(:);%计算第一类的样本均值向量m1m1(1)=mean(x1);m1(2)=mean(x2);m1(3)=mean(x3);%计算第一类样本类内离散度矩阵S1S1=zeros(3,3);fori=1:36S1=S1+[-m1(1)+x1(i)-m1(2)+x2(i)-m1(3)+x3(i)]'*[-m1(1)+x1(i)-m1(2)+x2(i)-m1(3)+x3(i)];end%w2的数据点坐标x4=[1.40101.23012.08141.16551.37401.18291.76321.97392.41522.58902.84721.95391.25001.28641.26142.00712.18311.79091.33221.14661.70871.59202.93531.46642.93131.83491.83402.50962.71982.31482.03532.60301.23272.14651.56732.9414];x5=[1.02980.96110.91541.49010.82000.93991.14051.06780.80501.28891.46011.43340.70911.29421.37440.93871.22661.18330.87980.55920.51500.99830.91200.71261.28331.10291.26800.71401.24461.33921.18080.55031.47081.14350.76791.1288];x6=[0.62101.36560.54980.67080.89321.43420.95080.73240.57841.49431.09150.76441.21591.30491.14080.93980.61970.66031.39281.40840.69090.84000.53811.37290.77310.73191.34390.81420.95860.73790.75480.73930.67390.86511.36991.1458];x4=x4(:);x5=x5(:);x6=x6(:);%计算第二类的样本均值向量m2m2(1)=mean(x4);m2(2)=mean(x5);m2(3)=mean(x6);%计算第二类样本类内离散度矩阵S2S2=zeros(3,3);fori=1:36S2=S2+[-m2(1)+x4(i)-m2(2)+x5(i)-m2(3)+x6(i)]'*[-m2(1)+x4(i)-m2(2)+x5(i)-m2(3)+x6(i)];end%总类内离散度矩阵SwSw=zeros(3,3);Sw=S1+S2;%样本类间离散度矩阵SbSb=zeros(3,3);Sb=(m1-m2)'*(m1-m2);%最优解WW=Sw^-1*(m1-m2)'%将W变为单位向量以方便计算投影W=W/sqrt(sum(W.^2));%计算一维Y空间中的各类样本均值M1及M2fori=1:36y(i)=W'*[x1(i)x2(i)x3(i)]';endM1=mean(y);fori=1:36y(i)=W'*[x4(i)x5(i)x6(i)]';endM2=mean(y);%利用当P(w1)与P(w2)时的公式计算W0p1=0.6;p2=0.4;W0=-(M1+M2)/2+(log(p2/p1))/(36+36-2);%计算将样本投影到最正确方向上以后的新坐标X1=[x1*W(1)+x2*W(2)+x3*W(3)]';X2=[x4*W(1)+x5*W(2)+x6*W(3)]';%得到投影长度XX1=[W(1)*X1;W(2)*X1;W(3)*X1];XX2=[W(1)*X2;W(2)*X2;W(3)*X2];%得到新坐标%绘制样本点figure(1);plot3(x1,x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学一年级20以内连加连减口算练习题1080道非常好
- 《现代农业绿色食品》课件
- 《项目融资b》课件
- 《烃的燃烧规律总结》课件
- 如何预防儿童龋齿
- 《胸腔引流导管》课件
- 园林绿化行业客服工作心得
- 电子工程师电子设备设计与调试
- 旅游景点保安工作总结
- 《红细胞与贫血》课件
- 肿瘤科医院感染管理制度
- 产品拆解:飞书多维表格怎么用
- 意识障碍的诊断鉴别诊断及处理
- 客房服务员(四级)考证理论考核试题及答案
- 英语演讲知到章节答案智慧树2023年哈尔滨工程大学
- 商务礼仪培训职业礼仪员工培训PPT
- 围手术期手术部位感染预防与控制措施试题及答案
- 本田品质管理基础课程(课堂PPT)
- 教育科学研究方法(第二版) 单元1 主题6 熟悉本学科著名的办学机构
- JC∕T 2647-2021 预拌混凝土生产企业废水回收利用规范
- 三星公司供应链管理流程综合分析报告
评论
0/150
提交评论