模式识别上机试题_第1页
模式识别上机试题_第2页
模式识别上机试题_第3页
模式识别上机试题_第4页
模式识别上机试题_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东科技大学2013-2014学年第一学期《模式识别》考试试卷班级生物医学工程 姓名冯宗盛学号题号一二总得分评卷人审核人得分1.(50分)本题为自由发挥题,要求采用多尺度(多分辨率)要求是不同的参数及其对应的分割结果图像自选两类:合成图像和拍摄图像;至少综合采用以下两种方法(非分别单独使用):边缘(梯度)。区域合并与生长。涉及到区域内部一致性的标准是什么?;利用特征的分布结构、目标的空间上下文和尺度上下文的信息;把(区域一致性、区域内部光滑性、边界最简单)转化为迭代优化能量函数;基于任务的(给定目标,如车牌,交通标识等)人脸识别,程序:clccloseall;clear;I=double(imread('c.jpg'));Faces=[];numFaceFound=0;I=double(I);H=size(I,1);W=size(I,2);R=I(:,:,1);G=I(:,:,2);B=I(:,:,3);%%%%%%%%%%%%%%%%%%亮度补偿%%%%%%%%%%%%%%%YCbCr=rgb2ycbcr(I);Y=YCbCr(:,:,1);%normalizeYminY=min(min(Y));

maxY=max(max(Y));Y=255.0*(Y-minY)./(maxY-minY);YEye=Y;Yavg=sum(sum(Y))/(W*H);T=1;if(Yavg<64)T=1.4;elseif(Yavg>192)T=0.6;endif(T~=1)RI=R.八T;GI=G.八T;elseRI=R;GI=G;endC=zeros(H,W,3);C(:,:,1)=RI;C(:,:,2)=GI;C(:,:,3)=B;figure,imshow(C/255);title('Lightingcompensation');%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%结果:%%%%%%%%%%%%%%%%%%%%%%%EXTRACTSKIN%%%%%%%%%%%%%%%%%%%%%%YCbCr=rgb2ycbcr(C);Cr=YCbCr(:,:,3);S=zeros(H,W);[SkinIndexRow,SkinIndexCol]=find(10<Cr&Cr<45);:凿彩IBAomajasiouup(s%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%I(, 9STOUq^TMUT>[S,)/(NS)MoqsuiTpuspus{(次<ums*QOT)=(G+[:[yg+T:T)NS{(((『+[:匚y^+t:t)s)wins)uins=uins-[^0OTg-M:I=;jojS-H:I=TmJ-(MyH)sojsz=NS%%%%%%%%%%%%%%%%%%%%%%%%%%%%3SI0N3A0W3H%%%%%%%%%%%%%%%%:凿彩up<s%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%-(5涟,)9T4T4I(S)MoqsuiTpus•1=((T)TODxepuiuT>[s'(t)MO^xspuiuT^s)S(MOHxepuiuT>(s) :i=^JOj%%%%%%%%%%%%%%%发现肤色块%%%%%%%%%%%%%%%%%L=bwlabel(SN,8);BB=regionprops(L,'BoundingBox');bboxes=cat(1,BB.BoundingBox);widths=bboxes(:,3);heights=bboxes(:,4);hByW=heights./widths;lenRegions=size(bboxes,1);foundFaces=zeros(1,lenRegions);rgb=label2rgb(L);figure,imshow(rgb);title('facecandidates');%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%结果:%%%%%%%%%%%%%%%%检查脸部标准%%%%%%%%%%%%%%%%%%%%%%%%%%%fori=1:lenRegions%标准1:heighttowidthratio,computedabove.if(hByW(i)>1.75||hByW(i)<0.75)%不是嘴的部分,舍弃 continue;end%实现最小尺寸约束if(heights(i)<20&&widths(i)<20)continue;end%getcurrentregion'sboundingboxCurBB=bboxes(i,:);

XStart=CurBB(1);YStart=CurBB(2);WCur=CurBB(3);HCur=CurBB(4);%cropcurrentregionrangeY=int32(YStart):int32(YStart+HCur-1);rangeX=int32(XStart):int32(XStart+WCur-1);RIC=RI(rangeY,rangeX);GIC=GI(rangeY,rangeX);BC=B(rangeY,rangeX);figure,imshow(RIC/255);结果:title('PossiblefaceRchannel');结果:title('PossiblefaceRchannel');%标准2:existance&localisationofmouthM=zeros(HCur,WCur);theta=acos(0.5.*(2.*RIC-GIC-BC) ./sqrt((RIC-GIC).*(RIC-GIC)(RIC-BC).*(GIC-BC)));theta(isnan(theta))=0;thetaMean=mean2(theta);[MouthIndexRow,MouthIndexCol]=find(theta<thetaMean/4);forj=1:length(MouthIndexRow)M(MouthIndexRow(j),MouthIndexCol(j))=1;end%计算垂直直方图Hist=zeros(1,HCur);forj=1:HCurHist(j)=length(find(M(j,:)==1));endwMax=find(Hist==max(Hist));wMax=wMax(1);%justtakeoneofthem.

if(wMax<WCur/6)%rejectduetonotexistingmouthcontinue;end结果:figure,imshow(M);title(结果:figure,imshow(M);title('Mouthmap');%标准3:existance&localisationofeyeseyeH=HCur-wMax;eyeW=WCur;YC=YEye(YStart:YStart+eyeH-1,XStart:XStart+eyeW-1);E=zeros(eyeH,eyeW);[EyeIndexRow,EyeIndexCol]=find(65<YC&YC<80);forj=1:length(EyeIndexRow)E(EyeIndexRow(j),EyeIndexCol(j))=1;end%checkifeyesareacceptable.EyeExist=find(Hist>0.3*wMax);if(~(length(EyeExist)>0))continue;endfoundFaces(i)=1;numFaceFound=numFaceFound+1;end%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%disp('Numberoffacesfound');numFaceFound;%if(numFaceFound>0)

% disp('Indicesoffacesfound:');% ind=find(foundFaces==1);% CurBB=bboxes(ind,:);% CurBB%else% closeall;%end最终结果,完成人脸识别,即:的过程。最终结果,完成人脸识别,即:的过程。其中运用了边缘处理,区域生长,区域合并等诸多图像处理方法。列举了几个英文的关键词(其中有一些概念较难,不一定要用到)HierarchicalImageSegmentation;Multi-scalemulti-resolution;ContourDetectionandHierarchicalImageSegmentation;regiongrow;edge;gradient;context;Contourlet;snakes;Activecontour;levelset;2.(50分)文献阅读、分析和总结。翻译:摘要:人类和其他灵长类动物目光转向分配处理资源的一个视觉输入子集。理解和模仿人类观察员自由观察自然场景的方式不仅对科学有影响,而且对经济也有影响。因此在广泛的科学和工程学科,它吸引了众多研究人员的注意力。随着日益增长的计算能力机器学习已经成为一种流行工具,用于采集人们探索让他们的目光检查一个视觉场景的数据。本文综述性的讲述了在学习图像显著区的视觉注意的最新进展,并就此讨论了几个关键问题。说明除了要理解那些驱动选择图像中有趣的部分的机制,,预测图片中有趣的地点就像预测人们想看的地方一样,可能会有很多实际的应用程序。计算模型可以应用于各种计算机视觉任务,比如导航援助,机器人控制、监测系统、目标检测和识别,和场景的理解。在其他领域包括广告设计、图像和视频压缩、图像数据库查询和凝视动画,也发现有这样的预测性程序。在过去的十年里,人们提出了大量预测目光分配的计算模型[33,57,54,81,18,13,49,47],其中一些是受神经机制控制的。概括性的讲,显著区的检测方法有如下几种:(1)提取视觉特征:常用的功能内容包括对比[62],优势⑵,双谱分析强度[40],颜色[35],和对称[60],以及更高等水平的面孔和文本[9]。图像处理技术可以应用于增强或改变底层图像特征,而更高级的技术一般都不改变的这些特征。(2)在特定功能维度计算个体特性的量化特点:这一步使用生物学上的滤波器如伽柏或高斯差分滤波器,或使用更复杂的方法。例如,Itti和Baldi[31]假设对时空观的理论信息是从中心到显著区,并使用贝叶斯统计计算其特点。Gao等人[23]还有Mahadevan和Vasconcelos[47]的量化显著区理论是基于判别中心-边缘假说。Raj等人[61]导出了一个熵最小化算法来选择视点。Seo和Milanfar[66]计算显著区使用“self-resem-blance”措施,其中显著区的每个像素都显示自身和周边特征矩阵的特性°Bruce和Tsotsos[4]在独立的对分量进行双重分析(ICA)[28]后,提出一个基于“self-information”的,符合稀疏的皮层细胞的反应视觉输入[17]的模型。Wang等人[82]计算场点熵率的量化特点也是基于ICA分解。Avraham和Lindenbaum[1]使用一个随机模型估计某部分图片是令人感兴趣的概率。Harel等人认为[25],每个活跃区域的专题频道的生成是基于图计算。Carbone和Pirri[6],提出了Bernouli混合模型以获取环境依存性。(3)集成这些图形到生成最终的标量图形称为显著区著区著作中,初步的生理和心理学研究支痔'线性求和”(即以同等权重进行线性集成)[75、52、55、14],“max”[44、39],或“MAP”[78]类型的集成,前者已经普遍采用在计算模型[33、9]。之后,在线性假设下,Itti和Koch[32]基于图像分布提出多种规范化特征图的方法。Hu等人[27]基于空间紧凑型和显著区密度,使用综合特点指标的方法来计算各部分对显著区的贡献。不幸的是,这种传统的结构需要许多设计参数,例如特征的数量和类型,滤波器的形状和尺寸,特征权重的选择和归一化方案,等等。各种假设的建立都是通过建模。多年来,这些参数的选择或假或是点对点的或者是选择模拟生物视觉系统。然而在许多情况下,生物合理性是模棱两可的。虽然在生物视觉系统的理解以及有效的设计合理的仿生系统有很多的探索,但有一个现成的解决方案是采集人们的信息,并从中获取他们在看的场景。通过刻画底层的分布,认识复杂的图案,并做出明智的决策,机器学习具有强大的洞察能力。显著区的理解和视觉注意力的灵感来自于生物数据的学习成果。应用这种方法,ZhaoandKoch[88]表明观察这在观察不同部分的时候注重不同的特点。此外,功能集成是非线性的[89,90]。这就提出了一个关于灵长类动物大脑运用这种非线性集成策略的程度问题。理清这个问题需要深入的研究心理学和神经生理学。机器学习的另一个优点是,它提供了一种用于分析数据的统一框架,并在不同的条件下做比较(例如,具有不同的人群,或者与不同的任务)。例如,在相同的框架下[88],用所有参与的受试者的数据来推断群组特征,而用个别数据来推导出个体特性。机器学习存在的几个问题:a、 获取地面真实信息工作量庞大:像许多有监督学习功能的应用一样,获取地面真实信息必不可少,但却需要付出极大的努力。像LableMe[63],ImageNet[12],andAmazonMechanicTurk就是这样的图像数据库。然而,了解人们往哪儿看,却并不是那么的容易一一当受测者观察物体时,眼动跟踪设备需要记录眼球的位置,这大大限制了数据的收集过程。目前,在眼球造型和目光的检测方面有了最新进展(例如[24、70]),然而没有定制的眼动跟踪硬件,仍无法进行大规模的、精确的眼动跟踪实验。如将在第4节中讲到的,数以百计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论