版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、武汉工程大学 计算机科学与工程学院综合设计报告设计名称: 图像处理与机器视觉综合设计 设计题目:基于贝叶斯判别的数字图像识别的实现与分析 学生学号: 专业班级: 学生姓名: 学生成绩: 指导教师(职称): 课题工作时间: 2015.5.10 至 2015.5.26 说明:1、报告中的第一、二、三项由指导教师在综合设计开始前填写并发给每个学生;四、五两项(中英文摘要)由学生在完成综合设计后填写。2、学生成绩由指导教师根据学生的设计情况给出各项分值及总评成绩。3、指导教师评语一栏由指导教师就学生在整个设计期间的平时表现、设计完成情况、报告的质量及答辩情况,给出客观、全面的评价。4、所有学生必须参加
2、综合设计的答辩环节,凡不参加答辩者,其成绩一律按不及格处理。答辩小组成员应由2人及以上教师组成。5、报告正文字数一般应不少于5000字,也可由指导教师根据本门综合设计的情况另行规定。6、平时表现成绩低于6分的学生,其综合设计成绩按不及格处理。7、此表格式为武汉工程大学计算机科学与工程学院提供的基本格式(适用于学院各类综合设计),各教研室可根据本门综合设计的特点及内容做适当的调整,并上报学院批准。成绩评定表学生姓名: 学号: 班级: 类别合计分值各项分值评分标准实际得分合计得分备注平时表现1010按时参加综合设计,无旷课、迟到、早退、违反实验室纪律等情况。完成情况3020按设计任务书的要求完成了
3、全部任务,能完整演示其设计内容,符合要求。10能对其设计内容进行详细、完整的介绍,并能就指导教师提出的问题进行正确的回答。报告质量3510报告文字通顺,内容翔实,论述充分、完整,立论正确,结构严谨合理;报告字数符合相关要求,工整规范,整齐划一。5课题背景介绍清楚,综述分析充分。5设计方案合理、可行,论证严谨,逻辑性强,具有说服力。5符号统一;图表完备、符合规范要求。5能对整个设计过程进行全面的总结,得出有价值的结论或结果。5参考文献数量在3篇以上,格式符合要求,在正文中正确引用。答辩情况2510在规定时间内能就所设计的内容进行阐述,言简意明,重点突出,论点正确,条理清晰。15在规定时间内能准确
4、、完整、流利地回答教师所提出的问题。总评成绩: 分 补充说明: 指导教师: (签字)日 期: 2011 年 12 月 6 日答辩记录表学生姓名: 学号: 班级: 答辩地点: 答辩内容记录:答辩成绩合计分值各项分值评分标准实际得分合计得分备注2510在规定时间内能就所设计的内容进行阐述,言简意明,重点突出,论点正确,条理清晰。15在规定时间内能准确、完整、流利地回答教师所提出的问题。答辩小组成员(签字): 2015 年 5 月 26 日指导教师评语指导教师: (签字)日 期: 年 月 日一、综合设计目的、条件、任务和内容要求:目的:本综合设计是实践教学环节中的重要项目,在于检验学生对智能科学与技
5、术专业知识的掌握程度,提高学生综合使用所学知识的开发有效率的智能系统的能力。条件:PC机,VC+ 6开发环境,Matlab开发环境.内容要求:总体要求:数字识别是模式识别中的一个重要分支,在多个领域中有着非常广泛的应用,数字的识别有多种方法,本设计主要目的是要求学生使用贝叶斯判别完成对数字的识别,建立对随机模式分类方法的初步认识,并重点研究贝叶斯分类方法在数字识别领域中的具体应用.设计报告的内容要求:1、第一章应包含以下内容:有关数字识别各种算法的综述与比较,如,在某某章论述我们设计的方法。2、在第二章给出整体设计方案,应包含:1)基于贝叶斯判别数字识别的算法伪代码。2)设计中的数据结构及其含
6、义;3)设计中的函数原型;4)各函数之间的交互关系;5)系统中的模块划分、这些模块间的关系;6)这个整体设计方案的优点与缺点。3、在第三章给出详细设计方案,应包含:1)基于贝叶斯判别数字识别的实现代码,并有合理的注释。2)数据结构的具体实现方法及采用该方法的原因;3)设计方案中主要函数的实现方法及采用该方法的原因;4)函数之间交互关系的实现方法及采用该方法的原因;5)本详细设计方案的优点和缺点。4、在第四章给出结果与分析。应包含:基于贝叶斯判别数字识别算法对给出数字图像识别的正确率及运算效率。5、第五章对本次设计过程进行总结,应包含:1)对基于贝叶斯判别数字识别设计内容的理解;2)对完成设计任
7、务中难点的处理过程与体会;3)对智能系统效率提升方法的理解。4)其他的体会与经验。6、中英文摘要和报告内容语言通畅、逻辑结构清晰,不含语法错误,报告文字应符合“成绩评定表中”对设计报告文字质量的基本要求。 指导教师签字: 年 月 日二、进度安排:第11-13周完成设计任务,第13周的周二进行答辩。具体如下:11周完成理论认知和算法设计阶段,12周完成贝叶斯判别算法,13周联机调试完成最终的综合设计任务。三、应收集资料及主要参考文献:应收集的资料:贝叶斯判别的基本思想、主要概念贝叶斯判别的发展过程;贝叶斯判别及其求解算法的国内外研究现状(包括理论研究和应用项目)。主要参考文献:1 王沫然 编著.
8、 Matlab与科学计算(第2版)M.北京:电子工业出版社,20032 李金宗 编著. 模式识别 M. 北京:高等教育出版社, 1994.3 冈萨雷斯 编著. 数字图像处理(第2版)M. 北京:电子工业出版社, 2003.四、综合设计(课程设计)摘要(中文):数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展,人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。关键词:自动;模式识别;应用前景五、综合设计(课程设计)A
9、bstract(英文): The digital recognition researches how to treat with and recognize pattern automatically through computer with math arithmetic. Along with the development of computer technology, human need more advanced digital recognition technology. Especially for large numbers of printed data and ma
10、nuscript, the automatic recognition and input of Chinese characters becomes a stringent task, therefore the digital recognition will have a broad application prospect on literature retrieval, office automation, postal service system, bank bill processing.Keywords:automatically;digital recognition;ap
11、plication prospect武汉工程大学计算机科学与工程学院 综合设计报告目 录目 录I摘 要IIAbstractII第一章 绪论11.1课题研究的意义11.2国内外究动态目前水平11.3手写体数字识别简介21.4识别的技术难点2第二章 贝叶斯方法应用于手写体数字识别32.1贝叶斯由来32.2贝叶斯公式32.3贝叶斯公式Bayes决策理论42.4贝叶斯应用于的手写体数字理论部分72.4.1 特征描述72.4.2最小错误分类器进行判别分类9第三章 数字识别的设计流程及功能的实现113.1 系统整体功能模块设计113.2 手写数字识别系统的基本原理113.2.1 图像的预处理113.2.2
12、 图像的特征提取123.2.3 特征库的建立123.2.4 图像数字的识别13第四章 设计结果及分析144.1 数字的特征提取144.2 数字的识别15总 结18致 谢19参考文献20附录21摘 要数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展,人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。关键词:自动;模式识别;应用前景AbstractThe digital recognition researches h
13、ow to treat with and recognize pattern automatically through computer with math arithmetic. Along with the development of computer technology, human need more advanced digital recognition technology. Especially for large numbers of printed data and manuscript, the automatic recognition and input of
14、Chinese characters becomes a stringent task, therefore the digital recognition will have a broad application prospect on literature retrieval, office automation, postal service system, bank bill processing.Keywords:automatically;digital recognition;application prospect- 25 -第一章 绪论1.1课题研究的意义手写体数字识别的研
15、究有很大的实用价值,例如在邮政编码、税务报表、统计报表财务报表、银行票据、海关等需要处理大量字符信息录入的场合,在很大程度上要依赖数据信息的输入。随着人们生活水平的提高,经济活动的发展,通信联系的需求使信函的互换量大幅度增加,我国函件业务量也在不断增长,预计到2010年,一些大城市的中心邮局每天处理量将高达几百万件,业务量的急剧上升使得邮件的分拣自动化成为大势所趋。在邮件的自动分拣中,手写数字识别(OCR)往往与光学条码识别(OBR-Optical Bar Reading),人工辅助识别等手段相结合,完成邮政编码的阅读。目前使用量最大的OVCS分拣机的性能指标:OCR拒分率30%,OCR分拣差
16、错率1.1%。如果能通过手写数字识别技术实现信息的自动录入,将会促进这一事业的进展。手写体数字识别的研究不仅有很大的应用价值,而且有重要的理论价值,由于数字别的类别较小,有助于作深入分析及验证一些新的理论。例如人工神经网络,相当一部分的ANN模型和算法都以手写数字识别作为具体的实验平台。可以说,手写体数字识别的研究将有助于模式识别、机器理解、机器人技术的发展,对今后研究如何更好地进行人机交互,使计算机具有和人一样的能力有很大的理论价值。1.2国内外究动态目前水平 手写体字符的识别在很早以前就开始了。国外从20世纪70年代初研制成“光学字符别机(OCR)”,能够自动识别印刷体的英文文字及阿拉伯数
17、字。20世纪70年代中期出现了能识别手写数字的OCR。在20世纪70年代末和80年代初又出现了能识别手写英文母的OCR。日本于20世纪80年代初研制了印刷体汉字识别样机,这是最早的汉字OCR。我国从20世纪70年代就开始进行了字符(英文字母和数字)识别的研究,20世纪80年代己进入实用阶段,主要用于邮政信函自动分检,人口普查和生产统计报表。手写体数字识别是手写字符识别的一个重要分支,它又分为在线手写体识别和离线写体识别。在线手写体识别通过记录文字图像抬笔、落笔、笔迹上各像素的空间位,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处理过程中,系统以定的规则提取信息特征,再由识别模块将信息
18、特征与识别库的特征进行比较、加以识别,最后转化为计算机所使用的文字代码。在线手写体识别的一个重要的不足就是要求写入者必须在指定的设备上书写。而离线手写体识别则是通过使用任何一种图像采集设备,如CCD、扫描仪、数码相机等将手写者已写好的文字作为图像输入到计算机中,然后由计算机去识别。在过去的数十年中,研究者们提出了许许多多的识别方法。按使用的特征不同,这方法主要可以分为三类:基于结构特征的方法、基于统计特征的方法和人工神经网结构特征通常包括圆、端点、交叉点、笔划、轮廓等,对于一个复杂的模式,采用分解的方法将其划分为若干较简单的子模式乃至基元,通过对基元和子模式识别的综合建立在统计数学,特别是贝叶
19、斯决策理论基础上,通过模式紧密性、距离和相似性度量等感念和假定,形成了统计决策方法的一系列结论。人工神经网络具有学习和联想功能,在字符识别中主要采用基于BP算法的多层感知机及多层卷积神经网络;基于正规化方法构建的径向基函数网络;以及具有“拓扑保持”特性的自组织特征映射(包括学习矢量量化LvQ)等。一般来说,各类特征各有优势。例如,使用统计特征的分类器易于训练,而且对于使用统计特征的分类器,在给定训练集上能够得到相对较高识别率;而结构特征的主要优点之一是能描述字符的结构,在识别过程中能有效的结合几何和结构的知识,因此能够得到可靠性较高的识别结果。神经网络具有自学习、容错性、分类能力强和并行处理等
20、特点。手写体识别目前的研究方向是:特征提取问题,这个方面一是在现有基础上进行组合,另一个是引入新的特征技术;分类器研究,一是多分类器继集成,另一个方向是研究新的分类器。、1.3手写体数字识别简介 手写体数字识别是指利用电子计算机自动辨认手写体阿拉伯数字的一种技术,它属于光学字符识别(OCR)的范畴手写体数字识别又分为联机识别(on-line)和脱机识别(off-line)两种。其中,最为困难的就是脱机手写字符的识别。主要是因为脱机手写体识别过程无法获得字符书写时的一些动态信息。然而,手写体数字识别技术的研究是非常有价值的,它具有广阔的应用前景。手写体数字识别系统性能的评价方法 作为一个识别系统
21、,我们最终要用某些参数来评价其性能的高低,手写数字识别也不例外。评价的指标除了借用一般文字识别里的通常做法外,还要根据数字识别的特点进行修改和补充。对一个手写数字识别系统,可以用两方面的指标表征系统的性能:识别率 A 正确识别样本数/全部样本数*100% (1.1)误识率 S 误识样本/全部样本数 *100% (1.2)两者的关系 A+S=100% (1.3)数字识别的应用中,人们往往很关心的一个指标是“识别精度”,即在所有识别的字符中,正确识别的比例,表示如下:识别精度:P=A/(A+S)*100% (1.4)一个理想的系统应是S尽量小,然而A尽可能大。1.4识别的技术难点手写体数字识别的研
22、究是一项具有相当难度的工作,此项工作的难点主要在于以下几方面:1.阿拉伯数字的字形信息量很小,不同数字写法字形相差不大,使得准确区分某些数字相当困难。2.要识别的数字虽然只有十种,而且笔划简单,但同一数字写法千差万别,不同的人写法也不尽相同,很难完全做到兼顾各种写法的极高识别率的通用性数字识别系统。3.在实际应用中,对数字的单字识别正确率的要求要比文字要苛刻得多。这是因为文字有上下文关系,但数字没有上下文关系,每个单字的识别都至关重要,而且数字识别经常涉及的财会、金融领域,其严格性更是不言而喻的。因此,用户的要求不是单纯的高正确率,更重要的是极低的误识率。4.大批量数据处理对系统速度又有相当的
23、要求,许多理论上很完美但速度过低的方法也是行不通的。综上所述,研究高性能的手写数字识别算法是一个有相当的挑战性的课题,同样的把高效的手写体数字识别算法应用于实际工作之中也是具有重要意义的。第二章 贝叶斯方法应用于手写体数字识别2.1贝叶斯由来贝叶斯(R.T.Bayes,17021761)学派奠基性的工作,是英国学者贝叶斯的一篇具有哲学性的论文关于几率性问题求解的讨论。著名数学家拉普拉斯利用贝叶斯的方法导出了重要的“相继律”,从而引起人们对贝叶斯的方法和理论的重视。尽管利用贝叶斯方法可以推导出很多有意义的结果,但是,由于理论上和实际应用中存在很多问题,在19世纪,贝叶斯理论并未被普遍接受。进入2
24、0世纪,意大利的菲纳特、英国的杰弗莱、古特、萨凡奇、林德莱对贝叶斯学派的形成做出了重要贡献,1958年英国历史最长的统计杂志Biometrika重新全文刊载了贝叶斯的论文。20世纪50年代,罗宾斯(H.Robbins)将经典统计学派的方法和贝叶斯学派的方法进行融合,提出了经验贝叶斯方法(EB方法)。如今,贝叶斯学派的思想方法已渗透到了许多学科。贝叶斯理论在人工智能、机器学习、数据挖掘等方面也有广泛应用。20世纪80年代,贝叶斯网络被用于专家系统的知识表示,90年代可学习的贝叶斯网络被用于数据挖掘和机器学习。涉及因果推理、不确定性知识表达、聚类分析等方面的贝叶斯方法的文章大量涌现。并且出现了专门
25、研究贝叶斯理论的组织和学术刊物ISBA。贝叶斯分类是一种统计学分类方法,可以预测类成员关系的可能性,如给定样本属于一个特定类的概率。目前,贝叶斯分类方法已在文本分类、字母识别、经济预测等领域获得了成功的应用。贝叶斯方法正在以其独特的不确定性知识表达形式、丰富的概率表达能力、综合先验知识的增量学习等特性成为众多数据挖掘方法中最引人注目的焦点之一。2.2贝叶斯公式贝叶斯公式建立起先验概率和后验概率的联系。先验概率是指根据历史资料或主观判断确定的各事件发生的概率,由于没能经过实验证实,属于检验前的概率,所以称为先验概率。先验概率一般分为两类,一是客观先验概率,指利用历史资料计算得到的概率;二是主观先
26、验概率,指在没有历史资料或历史资料不全的情况下,仅仅凭借主观经验判断得到的概率。后验概率是指利用贝叶斯公式,结合调查等方式获取了新的附加信息,对先验概率进行修正后得到的更符合实际的概率。1. 先验概率 先验概率针对M个事件出现的可能性而言,不考虑其他任何条件。例如,由统计资料表明总药品数为N,其中正常的药品数位,异常药品数位,则: (2.1)我们称及为先验概率。显然在一般情况下正常药品占比例大,即。仅按先验概率来决策,就会吧所有药品都划归为正常药品,并没有达到将正常药品与异常药品分开的目的。这表明由先验概率所提供的信息太少。2.贝叶斯公式也称为后验概率公式或逆概率公式,有几种不同的形式。通常采
27、用事件形式或随机变量形式表示。2.1.事件形式设A1, A2, An互不相容,并且有(必然事件),则对于任一事件B,有 (i=1, 2, n) (2.2)2.2随机变量形式设x和为两个随机变量,x是观测向量,是未知参数向量,其联合分布密度是p(x,),p(x|)是x对的条件密度, ()是的先验分布密度,于是对x的条件密度p(|x)为 (2.3)贝叶斯假设指出,在没有任何关于的信息时,可以认为的先验分布是均匀分布。当然,确定先验分布的准则还包括杰弗莱准则、最大熵准则、共轭分布族等。总之,贝叶斯方法的重点在于研究如何合理地使用先验信息。2.3贝叶斯公式Bayes决策理论 在分类的时候难免出现错分类
28、的情况,如何做出合理的判决就是Bayes决策理论所要讨论的问题,其中具有代表性的是最小错误概率的Bayes决策3基于最小错误率的贝叶斯决策: 假定得到一个待识别量的特征X后,每个样品X有n个特征,即,通过样品库,计算先验概率及类别条件概率密度函数,得到呈现状态X时,该样品分属各类别的概率,显然这个概率值可以作为识别对象判属的依据,从后验概率分布图44可见。在X值小时,药品被判为正常比较合理的,判断错误的可能性小。基于最小错误概率的贝叶斯决策就是按后验概率的大小判别的。这个判别又可以根据类别数目,写成不同的集中等价形式。 图(2.1) 1.两类问题 若两类样品属于类中的一类,已知两类的先验概率分
29、别为,。两类的类条件概率密度为,.则任给一X。判别X的类别。由贝叶斯公式可知: (2.4)由全概率公式可知 (2.5)其中M为类别。对于两类问题 (2.6)所以用后验概率来判别为 (2.7) 判别函数还有另外两种形式。(1)似然比形式 (2.8) 其中上面公式中的在统计学中称为似然比,而称为似然比阀值。(2) 对数形式 (2.9)上面三种判别函数是一致的,也可以用后验概率来表示判别函数。2. 多类问题 现在讨论多类问题的情况。判别函数的一般形式如下图:d1d2dMMAX/MINX1X2Xn最值选择器决策 图(2.2)若样本分为M类,各类的先验概率分别为 ,.,各类的类条件概率密度分别为,.,就
30、有M个判别函数。在取得一个观察特征X之后,在特征X的条件下,看哪个类的概率最大,就应该把X归于概率最大的那个类。因此对于任一模式X,可以通过比较各个判别函数来确定X的类别。 (2.10)就是把X代入M个判别函数中,看哪个判别函数最大,就把X归于这一类。 判别函数的对数形式为: (2.11)由于先验概率通常是很容易求出来的,贝叶斯分类器的核心问题就是求出类条件概率密度如果求出了条件概率,则后验概率就可以求出了,判别问题就可以解决了。在大多数情况下,类条件密度可以采用多维变量的正态密度函数来模拟。在工程上的许多问题中,统计数据往往满足正态分布规律,多维变量的正态密度函数为: (2.12) 其中:
31、所以此时的正态分布的贝叶斯分类器判别函数为: (2.13)2.4贝叶斯应用于的手写体数字理论部分2.4.1 特征描述在模式识别技术中,被观测的每个对象称为样品,例如本文中的每个手写数字可以作为一个样品,共写了10个数字,所以就有10个样品(X1,X2,X3,X4,X5,X6,X7,X8,X9,X10),一共有10个不同的类别。对于一个样品来说,必须确定一些与识别有关的因素作为研究的根据,每一个因素称为一个特征。模式就是样品所具有的特征描述。模式的特征集由处于同一个特征空间的特征向量表示,特征向量的每个元素称为特征,该向量也因此称为特征向量。一般用小写字母x, y, z来表示特征。如果一个样品X
32、有n 个特征,则可把X看成一个n维列向量,该向量称为特征向量X,记作:X=T (2.14)抽取图像特征的目的是为了进行分类,识别图像。也就是把图像变成n维空间的一个向量,实际上就是看成n维空间中的一个点,这样有利于从几何上考虑问题,计算上比较方便。 如果一个对象的特征观察值为x1,x2,,xn,它可构成一个n维的特征向量值X,即X=x1,x2,,xnT,式中x1,x2,,xn为特征向量X的各个分量。在模式识别的过程中,要对许多具体对象进行测量,以获得许多观测值,其中有均值、方差、协方差与协方差矩阵。1.均值 N 个样品的均值可表示为: (2.15) 其中是第i 个特征的平均值, (2.16)2
33、.方差 方差用来描述一批数的分散程度,第i 个特征的N个数的方差公式是: (2.17) 3.协方差与协方差矩阵:在N个样品中,第i个特征和第j个特征之间的协方差定义为: (2.18)对于同一批样品来说,很明显有: (2.19) 如果一批样品有n个特征x1,x2,,xn。求出没两个特征的协方差,总共得到n2个值,将这n2个值排列成以下的n维方阵,称为协方差矩阵: ,协方差矩阵是对称矩阵,而且主对角线元素sij就是特征xi的方差si2,i=1,2,3,n。2.4.2最小错误分类器进行判别分类写体数字,提取特征后,应用Bayes分类器进行判别分类。在手写体数字的识别属于多类情况,可以认为每类样品呈正
34、态分布。 1)求出每一类手写体数字样品的均值: (2.20)公式中,代表类的样品个数;n代表特征数目。2) 求每一类的协方差矩阵: (2.21)公式中,l代表样品在类中的序号,其中; (2.22)3) 计算出每一类的协方差矩阵的逆矩阵以及协方差矩阵的行列式4) 求出每一类的先验概率 (2.23)其中:5) 将各个数值代入判别函数: (2.24) 判别函数最大值所对应类别就是手写体数字的类别第三章 数字识别的设计流程及功能的实现3.1 系统整体功能模块设计整体模块如图所示:数字图像的绘制训练特征库二值化处理特征提取数字识别主界面 图(3.1)3.2 手写数字识别系统的基本原理下面分别介绍各部分工
35、作的基本原理:3.2.1 图像的预处理图像的预处理是为了突出手写体数字的特征。在本次设计中主要包括:图像二值化处理。图像的二值化处理就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。二值图像是指整幅图像画面内仅黑、白二值的图像。进行图像二值变换的关键 是要确定合适的阈值,使得字符与背景能够分割开来,二值变换的结果图像必须要具备良好的保形性,不丢掉有用的形状信息,不会产生额外的空缺等等。采用二值图像进行处理,能大大地提高处理效率。二值化的关键在于阈值的选取,阈值的选取方法主要有三类:全局阈值法、局部阈值法、动态阈值法。全局阀值二值化方法是根据图像的直方图或灰度的
36、空间分布确定一个阀值,并根据该阀值实现灰度图像到二值化图像的转化。全局阀值方法的优点在于算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对输入图像量化噪声或不均匀光照等情况抵抗能力差,应用受到极大限制。局部阀值法则是由像素灰度值和像素周围点局部灰度特性来确定像素的阀值的。本文采用全局阈值的方法,实现将图像二值化的功能。如果某个像素的值大于等于阈值,该像素置为白色;否则置为黑色3.2.2 图像的特征提取若直接把预处理后的数据作为输入量,进行分类计算时数据时数据量大,同时由于手写字体的多样化及图像本身和预处理过程中附带的某些干扰的影响,对系统的容错能力要求较高。特征提取的目的就
37、是从分析数字的拓扑结构入手,把它的某些结构特征提取出来,使数字的位移、大小变化、字形畸形等干扰相对较小,也就是把那些反映数字特征的关键信息提供给系统,这样就等于间接地增加了系统的容错能力,而且经过特征提取后数据量也大大减少了,这样就提高了识别的效率。手写数字识别的特征提取极大程度地影响着分类器的设计和性能,以及识别的效果和效率。为了保证所要求的分类识别的正确率和节省资源,希望依据最少的特征达到所要求的分类识别的正确率。在进行手写数字识别的过程中,特征提取应遵循以下原则:1) 特征应能尽量包含字符的有用信息。2) 特征的提取方法应简单而且提取快速。3) 各个特征之间的相关性应尽可能小。4) 特征
38、数量尽可能少。5) 特征应有较好的抗干扰能力。考虑到算法的实时性、快速性和准确性,在此次设计中采用的是一种简单的模板法对待测样本进行特征提取。步骤为:1、搜索数据区域,找出手写体数字的上下左右边界。2、将搜索到的数字区域平分成8*8共64个小区域。3、计算8*8的每一个小区域中白色像素所占比例,即用每一个小区域内的白色像素个数除以该小区域的面积总数(总像素数),即得特征值,第一行的8个比例值是特征的前8特征值,第二行对应着特征的916个,以此类推。3.2.3 特征库的建立在手写数字识别系统中,我们首先要建立一个特征库,我们手写一个数字,并且取得这个数字的特征值,然后再想程序输入这个数字,在程序
39、中将此输入数字与所有特征值相对应,作为模板库的一条记录,初始化模板库之后,就可以对手写数字进行识别,在识别的过程中我们不断的丰富模板库,如果手写数字识别成功则不需要将此数字存储到模板库中,如果识别失败就需要将此数字存储到模板库中,这样我们的模板库将越来越丰富。3.2.4 图像数字的识别 在手写数字图像特征提取结束后,即可进行数字的识别。这也是手写数字识别系统设计的最后一个环节,在本次设计中采用模板匹配法进行手写体数字识别。模板匹配法是图像识别中最具有代表性的方法之一。它是将从待识别的图像提取的若干特征量与模板对应的特征量进行比较,在识别之前须首先知道先验概率和类条件概率密度函数,其中先验概率P
40、(Wi)可以由训练样本集中的各类数字的个数和样本总数之比近似计算;类条件概率密度函数P(X|Wi)可以按照模板匹配等方法进行数字的区域划分再进行进一步计算得到。在得到先验概率和类条件概率密度函数以后,可以运用Bayes公式进行后验概率P(Wi|X)的计算;由于手写数字09共有十类,该公式可以表示如下: (3.1)在这是i为总类别数,分别为0、1、9等。紧接着就可以进行后验概率的比较,其中值最大的所对应的类别即为该手写数字的所属的类别,即:则xWi。第4章 设计结果及分析4.1 数字的特征提取数字特征的提取是为了更好的实现数字的识别,在此是通过提取所绘制数字的像素特征即如前面所介绍的用目标像素个
41、数除以这个小区域内总得像素个数的结果作为此区域的特征值。在此通过在函数GetFeature(I)来实现数字特征的提取功能。具体实现代码为:function data=GetFeature(I)row,col=find(I=0); %返回数字的上下左右的边界I=I(min(row):max(row),min(col):max(col); %截取手写数字图像,使其紧包含数字边界,不包含多余的空白imwrite(I,当前手写数字.bmp,bmp); %保存截取后的手写数字图像row,col=size(I);r=fix(row/5);c=fix(col/5);sum=0;k=1;feature=;fo
42、r i=1:r:5*r %先从行开始计算 for j=1:c:5*c %保持行不变,先计算列 for m=i:i+r-1 for n=j:j+c-1 if I(m,n)=0 sum=sum+1; end end end data(k)=sum/(r*c); %第k个特征分量 sum=0; k=k+1; endenddata=data; %将当前手写数字的特征向量由行向量变为列向量end4.2 数字的识别点击系统界面上的特征识别按钮即可实现手写数字的识别,此系统主要是通过函数来实现手写数字的识别,识别过程即把所绘制数字的特征值与模板库里面的每个特征值进行比较,在得到先验概率和类条件概率密度函数以
43、后,可以运用Bayes公式进行后验概率P(Wi|X)的计算;紧接着就可以进行后验概率的比较,其中值最大的所对应的类别即为该手写数字的所属的类别。Bayes决策的分类代码如下:function Result=BayesTwoValue(data)clc;load template pattern;%求先验概率sum = 0;pw = ; %P(wi)-先验概率for i = 1:10 sum = sum+pattern(1,i).num;endfor i = 1:10 pw(i) = pattern(1,i).num/sum;end%求类条件概率p=;pxw=; %P(x|wi)-类条件概率fo
44、r i = 1:10 for j = 1:25 sum = 0; for k = 1:pattern(1,i).num if pattern(1,i).feature(j,k)0.1 %第i类第k个样品的第j个特征值 sum = sum+1; end end p(j,i) = (sum+1)/(pattern(1,i).num+2); endendfor i = 1:10 sum = 1; for j = 1:25 if data(j)0.1 sum = sum*p(j,i); else sum = sum*(1-p(j,i); end end pxw(i) = sum;end%求后验概率su
45、m = 0;pwx = ; %P(wi|x)-后验概率for i = 1:10 sum = sum+pw(i)*pxw(i);endfor i = 1:10 pwx(i) = pw(i)*pxw(i)/sum;endmaxval,maxpos = max(pwx);Result= maxpos-1;end总 结本文主要介绍了手写体数字识别的基本理论和方法,并实现了用了最小错误的贝叶斯方法识别10个数字。收集、阅读和分析有关模式识别及手写体数字识别的书籍,从中找到一种合理的设计方法。在VC的开发环境中编写实现数字识别的代码,读取库信息,特征提取,贝叶斯方法等,并对各个部分进行了调试。 模式识别是
46、一门综合性、交叉性学科,在理论上它涉及代数学、矩阵论、概率论、图论、模糊数学、最优化理论等等众多学科的知识,在应用上又与其他许多领域的工程技术密切相关,其内涵可以概括为信息处理、分析与决策。在模式识别学科中,并没有一种普遍适应的算法,模式识别的算法要根据具体的识别对象和任务来确定,所以模式识别学科中还有很多创新性的工作。致 谢本设计是在赵彤洲老师的亲切关怀与精心指导下完成的,感谢赵彤洲老师,她在我做设计的过程中,给予我很多的帮助和指导,她循循善诱的教导和不拘一格的思路给予我无尽的启迪。真诚感谢我的室友们,他们在我平常的学习与日常生活中,给了我许多关心与帮助。在此我表示深深的感谢!参考文献1杨淑莹.图像模式识别-VC+技术实现.北京:清华大学出版社.20052徐士良.C常用算法程序集.北京:清华大学出版社.19963黄振华,吴诚一.模式识别原理.杭州:浙江大学出版社.19914沈清,汤霖.模式识别导轮.长沙:国防科技大学出版社.19915边肇祺,张学工.模式识别.北京:清华大学出版社.20006罗耀光,盛立东.模式识别.北京:人民邮
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校工作总结和工作计划(6篇)
- 读书活动的心得体会
- 教学工作心得体会总结8篇
- 新教材高考地理二轮复习综合题专项训练七简易绘图类含答案
- 四川省泸州市江阳区泸州老窖天府中学2024-2025学年七年级上学期期中地理试题(含答案)
- 河南省安阳市林州市湘豫名校联考2024-2025学年高三上学期11月一轮诊断考试 数学(含答案)
- 2015-2024年高考数学总复习:数列小题综合(学生卷)
- 个人信用贷款合同模板
- 户外照明产品购销合同模板
- 2024年公司运输司机聘用合同
- 产品质量法-产品质量法课件
- 水资源管理知识竞赛参考题(100题)
- pressfit设计高级技巧课件
- 四年级上册道德与法治4《少让父母为我操心》教学反思三篇
- 能力陷阱分享模板课件
- 护理工作中的语言沟通课件
- 冲击钻施工工艺及步骤
- 小学二年级数学德育渗透教案范文
- 中药化学考试题及答案
- 环保知识竞赛考试题库200题(含答案)
- 精挑同构试题(教师版)
评论
0/150
提交评论