



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实用文案模式识别实验报告装订线题目:Parzen 窗估计与 KN近邻估计学院计算机科学与技术专业 xxxxxxxxxxxxxxxx学号xxxxxxxxxxxx姓名xxxx指导教师xxxx20xx 年 xx 月 xx 日Parzen 窗估计与 KN近邻估计一、实验目的标准文档实用文案本实验的目的是学习Parzen 窗估计和k 最近邻估计方法。在之前的模式识别研究中,我们假设概率密度函数的参数形式已知,即判别函数J(.)的参数是已知的。本节使用非参数化的方法来处理任意形式的概率分布而不必事先考虑概率密度的参数形式。在模式识别中有躲在令人感兴趣的非参数化方法,Parzen 窗估计和k 最近邻估计就是
2、两种经典的估计法。二、实验原理1. 非参数化概率密度的估计对于未知概率密度函数的估计方法, 其核心思想是: 一个向量 x 落在区域 R 中的概率可表示为:其中, P 是概率密度函数p(x) 的平滑版本,因此可以通过计算P 来估计概率密度函数p(x) ,假设 n 个样本 x1,x2, ,xn ,是根据概率密度函数 p(x) 独立同分布的抽取得到, 这样,有 k 个样本落在区域 R 中的概率服从以下分布:其中 k 的期望值为:k 的分布在均值附近有着非常显著的波峰,因此若样本个数n 足够大时,使用k/n 作为概率 P 的一个估计将非常准确。假设p(x) 是连续的,且区域R 足够小,则有:如下图所示
3、, 以上公式产生一个特定值的相对概率,当 n 趋近于无穷大时,曲线的形状逼近一个函数,该函数即是真实的概率。公式中的V 是区域 R所包含的体积。综上所述,可以得到关于概率密度函数p(x) 的估计为:标准文档实用文案在实际中,为了估计x 处的概率密度函数,需要构造包含点x 的区域 R1,R2,Rn。第一个区域使用 1 个样本,第二个区域使用 2 个样本,以此类推。记 Vn 为 Rn 的体积。 kn 为落在区间 Rn 中的样本个数,而 pn (x) 表示为对 p(x) 的第 n 次估计:欲满足 pn(x) 收敛: pn(x) p(x) ,需要满足以下三个条件:有两种经常采用的获得这种区域序列的途径
4、,如下图所示。其中“Parzen窗方法”就是根据某一个确定的体积函数,比如 Vn=1/ n 来逐渐收缩一个给定的初始区间。这就要求随机变量kn 和 kn/n能够保证pn (x)能收敛到p(x) 。第二种“ k- 近邻法”则是先确定kn为 n 的某个函数,如kn= n。这样,体积需要逐渐生长,直到最后能包含进x 的 kn 个相邻点。标准文档实用文案2.Parzen 窗估计法已知测试样本数据 x1,x2, ,xn ,在不利用有关数据分布的先验知识,对数据分布不附加任何假定的前提下,假设 R 是以 x 为中心的超立方体, h 为这个超立方体的边长,对于二维情况,方形中有面积 V=h2,在三维情况中立
5、方体体积 V=h3,如下图所示。根据以下公式,表示x 是否落入超立方体区域中:估计它的概率分布:标准文档实用文案其中 n 为样本数量, h 为选择的窗的长度,(.)为核函数,通常采用矩形窗和高斯窗。3.k 最近邻估计在 Parzen 算法中,窗函数的选择往往是个需要权衡的问题,k- 最近邻算法提供了一种解决方法, 是一种非常经典的非参数估计法。 基本思路是: 已知训练样本数据x1,x2,xn而估计 p(x) ,以点 x 为中心,不断扩大体积Vn,直到区域内包含k 个样本点为止,其中k是关于 n 的某一个特定函数,这些样本被称为点x 的 k 个最近邻点。当涉及到邻点时,通常需要计算观测点间的距离
6、或其他的相似性度量,这些度量能够根据自变量得出。这里我们选用最常见的距离度量方法:欧几里德距离。最简单的情况是当k=1 的情况,这时我们发现观测点就是最近的(最近邻)。一个显著的事实是:这是简单的、直观的、有力的分类方法,尤其当我们的训练集中观测点的数目n很大的时候。可以证明, k 最近邻估计的误分概率不高于当知道每个类的精确概率密度函数时误分概率的两倍。三、实验基本步骤第一部分 ,对表格中的数据,进行 Parzen 窗估计和设计分类器,本实验的窗函数为一个球形的高斯函数,如下:标准文档实用文案1) 编写程序,使用Parzen 窗估计方法对一个任意的测试样本点x进行分类。对分类器的训练则使用表
7、格3中的三维数据。同时,令h =1 ,分类样本点为(0.5,1.0,0.0),(0.31,1.51,-0.50), (-0.3,0.44,-0.1)进行实验。2) 可以改变 h 的值,不同的 h 将导致不同的概率密度曲线,如下图所示。h=0.1 时:h=0.5 时:标准文档实用文案h=1 时:第二部分 的实验目的是学习和掌握非参数估计:k- 近邻概率密度估计方法。对前面表格中的数据进行k- 近邻概率密度估计方法和设计分类器。编写程序,对表格中的3 个类别的三维特征,使用k- 近邻概率密度估计方法。并且对下 列 点 处 的 概 率 密 度 进 行 估 计 : (-0.41,0.82,0.88),
8、 (0.14,0.72,4.1),(-0.81,0.61,-0.38)。标准文档实用文案四、实验代码如下:% Parzen 窗算法% w: c 类训练样本% x:测试样本% h:参数% 输出 p:测试样本 x 落在每个类的概率 function p = Parzen(w,x,h)xt,yt,zt = size(w);p = zeros(1,zt);for i = 1:zthn = h;for j = 1:xthn = hn / sqrt(j);p(i) = p(i) + exp(-(x - w(j,:,i)*(x - w(j,:,i)'/ (2 *power(hn,2) / (hn *
9、 sqrt(2*3.14);endp(i) = p(i) / xt;end% k- 最近邻算法% w: c 类训练样本% x:测试样本% k:参数function p = kNearestNeighbor(w,k,x)% w = w(:,:,1);w(:,:,2);w(:,:,3); xt,yt,zt = size(w);wt = ;%zeros(xt*zt, yt);if nargin=2p = zeros(1,zt);for i = 1:xtfor j = 1:xtdist(j,i) = norm(wt(i,:) - wt(j,:);endt(:,i) = sort(dist(:,i);m
10、(:,i) = find(dist(:,i) <= t(k+1,i); % 找到 k 个最近邻的编号 end标准文档实用文案endif nargin=3for q = 1:ztwt = wt; w(:,:,q);xt,yt = size(wt);endfor i = 1:xtdist(i) = norm(x - wt(i,:);endt = sort(dist); %欧氏距离排序a,b = size(t);m = find(dist <= t(k+1); %找到 k 个最近邻的编号num1 = length(find(m>0 & m<11);num2 = len
11、gth(find(m>10 & m<21);num3 = length(find(m>20 & m<31);if yt = 3plot3(w(:,1,1),w(:,2,1),w(:,3,1), 'r.');hold on;grid on;plot3(w(:,1,2),w(:,2,2),w(:,3,2), 'g.');plot3(w(:,1,3),w(:,2,3),w(:,3,3), 'b.');if (num1 > num2) | (num1 > num3)plot3(x(1,1),x(1,2)
12、,x(1,3), 'ro');disp('点: ',num2str(x),'属于第一类 ');elseif (num2 > num1) | (num2 > num3)plot3(x(1,1),x(1,2),x(1,3), 'go');disp('点: ',num2str(x),'属于第二类 ');elseif (num3 > num1) | (num3 > num2)plot3(x(1,1),x(1,2),x(1,3), 'bo');disp('点:
13、',num2str(x),'属于第三类 ');elsedisp('无法分类 ');endendif yt = 2plot(w(:,1,1),w(:,2,1), 'r.');hold on;grid on;plot(w(:,1,2),w(:,2,2), 'g.');标准文档实用文案plot(w(:,1,3),w(:,2,3), 'b.');if (num1 > num2) | (num1 > num3)plot(x(1,1),x(1,2), 'ro');disp(' 点:
14、',num2str(x),' 属于第一类 '); elseif (num2 > num1) | (num2 > num3)plot(x(1,1),x(1,2), 'go');disp(' 点: ',num2str(x),' 属于第二类 '); elseif (num3 > num1) | (num3 > num2)plot(x(1,1),x(1,2), 'bo');disp(' 点: ',num2str(x),' 属于第三类 '); elsedisp(
15、'无法分类 ');endendendtitle('k-最近邻分类器 ');legend('第一类数据 ',.' 第二类数据 ',.' 第三类数据 ',.' 测试样本点 ');clear;close all;% Parzen 窗估计和 k 最近邻估计%w1(:,:,1) = 0.28 1.31 -6.2; 0.07 0.58 -0.78;1.54 2.01 -1.63; -0.44 1.18 -4.32; -0.81 0.21 5.73; 1.52 3.16 2.77;2.20 2.42 -0.19;
16、0.91 1.94 6.21;0.65 1.93 4.38; -0.26 0.82 -0.96;w1(:,:,2) = 0.011 1.03 -0.21;1.27 1.280.08;0.13 3.120.16;-0.21 1.23 -0.11;-2.18 1.39 -0.19;标准文档实用文案0.34 1.96 -0.16;-1.38 0.940.45;-0.12 0.820.17;-1.44 2.310.14;0.26 1.940.08;w1(:,:,3) = 1.36 2.17 0.14;1.41 1.45 -0.38;1.22 0.99 0.69;2.46 2.19 1.31;0.68
17、0.79 0.87;2.51 3.22 1.35;0.60 2.44 0.92;0.64 0.13 0.97;0.85 0.58 0.99;0.66 0.51 0.88;x(1,:) = 0.5 1 0;x(2,:) = 0.31 1.51 -0.5;x(3,:) = -0.3 0.44 -0.1;% 验证 h 的二维数据 w2(:,:,1) = 0.28 1.31 ;0.07 0.58 ;1.54 2.01 ; -0.44 1.18 ; -0.81 0.21 ; 1.52 3.16 ;2.20 2.42 ;0.91 1.94 ;0.65 1.93 ; -0.26 0.82 ;w2(:,:,2
18、) = 0.011 1.03 ;1.27 1.28 ;0.13 3.12 ;-0.21 1.23 ;-2.18 1.39 ;0.34 1.96 ;-1.38 0.94 ;-0.12 0.82 ;-1.44 2.31 ;0.26 1.94 ;标准文档实用文案w2(:,:,3) = 1.36 2.17 ;1.411.45;1.220.99;2.462.19;0.680.79;2.513.22;0.602.44;0.640.13;0.850.58;0.660.51;y(1,:) = 0.5 1;y(2,:) = 0.31 1.51;y(3,:) = -0.3 0.44;h = .1; % 重要参数p = Parzen(w1,x(1,:)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 植物细胞结构与功能试题及答案
- 年度采购计划的制定与实施策略试题及答案
- 2024年CPMM考试核心内容试题及答案
- 大连高二会考数学试卷
- 2024年CPMM新大纲解读试题及答案
- 仓库防台防汛培训课件
- 2024年CPMM科学复习试题与答案
- 江西省上饶市民校考试联盟2025届高考化学押题试卷含解析
- 2025塔里木职业技术学院辅导员考试题库
- 2025泉州纺织服装职业学院辅导员考试题库
- 增演易筋洗髓内功图说(校对勘误版)
- 中国铁路总公司《铁路技术管理规程》(高速铁路部分)2014年7月
- 清明节主题班会PPT模板
- ART-850A系列数字式厂用变保护测控装置技术说明书
- 红色大气中考百日誓师大会PPT模板
- 2022年全国计算机一级EXCEL操作题
- 上海美创力喷码机简易操作及维护
- 维语宗教事务条例(2015)
- 悬挑式卸料平台作业的风险评价结果
- 红河学院本科生毕业论文模板
- IQC(来料)检测报告模板
评论
0/150
提交评论