手写数字特征提取与分析.doc

上传人：简*** IP属地：湖北上传时间：2020-04-14 格式：DOC 页数：46 大小：1.26MB 积分：9.6 举报 版权申诉

已阅读5页，还剩41页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

毕业设计论文题题目目手写数字特征提取与分析专专业业电子信息工程班班级级 084 班姓姓名名梁杰指导教师指导教师周扬讲师所在学院所在学院信息学院完成时间 2012 年 5 月承诺书我谨此郑重承诺本毕业设计论文是本人在指导老师指导下独立撰写完成的凡涉及他人观点和材料均依据著作规范作了注释如有抄袭或其它违反知识产权的情况本人愿接受学校处分承诺人签名年月日手写数字特征提取与分析手写数字特征提取与分析信息科技学院电子信息工程专业梁杰摘摘要要目前模式识别领域在日常生活中的应用已经越来越广泛比如人脸指纹识别字符识别车牌识别所以对数字识别进行学习与研究是非常有必要的本课题为数字字符识别模拟演示系统主要是利用正态分布下的最小错误率 Bayes 方法和最小风险 Bayes 方法来实现手写数字从 0 到 9 的识别该系统首先是实现模拟手写数字然后利用轮廓特征法将 5 5 的模板提取出样品的特征采用模板可以使同一形状不同大小的样品得到归一化的特征提取所以有能力对同一形状不同大小的样品视为同类最后结合 Bayes 决策进行判别使用最小错误率 Bayes 方法在判别过程中能使错误率达到最小即使错分类出现的可能性最小而最小风险 Bayes 方法在判别过程中可以使风险达到最小减少危害大的错分类情况本设计是利用 Matlab 实现的实验证明该系统对于模拟手写的数字基本上能正确识别但是对于手写不规范的数字会存在错判的情况这跟样品库的有限有关关键词关键词模式识别最小错误最小风险特征选择模拟手写 Matlab 实现 Handwritten digital feature extraction and analysis Liang Jie Electronic and information engineering College of Information Science and Technology Abstract At present the field of pattern recognition in everyday life has been more and more widely used such as the face fingerprint recognition character recognition vehicle license plate recognition Therefore the digital identification of learning and research is very necessary The topic for the digital character recognition simulation demo system Mainly using normal distribution under the minimum error rate of Bayes method and Bayes method to achieve the minimum risk handwritten digits from 0 to9 of the identification The system first is to realize the simulation of handwritten numeral then using contour feature will be 5 5 templates extracted sample characteristics using the template in the same shape different sizes of samples to be normalized feature extraction so the ability of the same shape different sizes of samples as similar finally combined with the Bayes decision discriminant Minimum error rate using the Bayes method the discrimination process can make the error rate reaches a minimum even wrong classification and the possibility of the minimum while minimizing risks Bayes method in judging process can make the risk minimum harm reduction in fault classification This design is the use of Matlab to achieve experiments show that the system for the simulation of handwritten digital basically correct identification but for handwriting irregular number may have misjudged case this with the sample library association Key words Pattern recognition minimum error minimum risk feature selection simulated handwriting Matlab 目录 1 绪论 1 1 1 手写数字特征提取与分析的背景与意义 1 1 2 手写数字特征的识别技术简介 1 1 3 现有的手写特征提取的有关算法 2 1 4 手写特征的典型应用 2 1 5 本文研究的内容 3 2 模式识别与 MATLAB 的介绍 4 2 1 模式识别 4 2 1 1 模式识别的基本概念 4 2 1 2 模式识别系统 4 2 1 3 相关值计算 4 2 2MATLAB 5 2 2 1Matlab 软件的介绍 5 2 2 2 Matlab 的主要优缺点 6 2 2 3Matlab 图像类型及转换分析 7 3 手写特征的提取与选择 9 3 1 特征的种类与筛选 9 3 1 1 笔划密度特征 9 3 1 2 傅立叶变换特征 9 3 1 3 轮廓特征 11 3 1 4 投影特征 12 3 1 5 重心及重心矩特征 14 3 1 6 首个黑点位置特征 14 3 1 7 粗网格特征 15 3 2 特征提取方法 15 3 2 1 结构特征提取方法 15 3 2 2 统计特征提取方法 16 3 3 手写特征模式识别方法 17 4 BAYES 分类器在手写特征中应用 19 4 1 BAYES分类器 19 4 2 基于概率的 BAYES决策 20 4 3 基于最小错误率 BAYES的手写数字字符分类 21 4 3 1 样品均值 21 4 3 2 协方差矩阵 22 4 3 3 先验概率 22 4 3 4 协方差矩阵的行列式 22 4 3 5 协方差矩阵的逆矩阵 23 4 3 6 判别函数 24 4 4 基于最小风险的 BAYES分类的实现 24 4 4 1 与最小错误 Bayes 决策的相同之处 24 4 4 2 后验概率 25 4 4 3 损失函数 25 5 分类实验与信息 26 5 1 特征提取方法的软件实现 26 5 2 截图并说明仿真过程 26 5 3 获得实验结果 28 5 4 分类结果分析与评价 29 6 总结 30 致谢 31 参考文献 32 附录 34 附录 1 编程代码 34 附录 2 仿真部分截图 39 1 绪论 1 1 手写数字特征提取与分析的背景与意义手写数字特征提取与分析在学科上属于模式识别和人工智能的范畴在过去的四十年中人们想出了很多办法获取手写字符的关键特征这些手段分两大类全局分析和结构分析对前者我们可以使用模板匹配象素密度矩特征点数学变换等技术这类的特征常常和统计分类方法一起使用对后者多半需要从字符的轮廓或骨架上提取字符形状的基本特征包括圈端点节点弧突起凹陷笔画等等与这些结构特征配合使用的往往是句 1 法的分类方法多年的研究实践表明对于完全没有限制的手写数字几乎可以肯定没有一种简单的方案能达到很高的识别率和识别精度因此最近这方面的努力向着更为成熟复杂综合的方向发展一方面研究工作者努力把新的知识运用到预处理特征提取分类当中如神经网络数学形态学等作者认为在手写数字识别的研究中 Bayes 和多种方法的综合是值得重视的方向手写数字特征提取与分析研究的理论意义 1 阿拉伯数字是唯一的被世界各国通用的符号对手写数字识别的研究基本上与文化背景无关这样就为各国各地区的研究工作者提供了一个施展才智的大舞台在这一领域大家可以探讨比较各种研究方法 2 由于数字识别的类别数较小有助于做深入分析及验证一些新的理论 3 尽管人们对手写数字的识别已从事了很长时间的研究并已取得了很多成果但到目前为止机器的识别本领还无法与人的认知能力相比这仍是一个有难度的开放问题 4 手写数字的识别方法很容易推广到其它一些相关问题棗一个直接的应用是对英文这样的拼音文字的识别事实上很多学者就是把数字和英文字母的识别放 2 在一块儿研究的 1 2 手写数字特征的识别技术简介手写数字特征的识别技术简介如图 1 1 所示由数据获取预处理特征提取分类决策及 Matlab 分类器设计五部分组成一般分为上下两部分上部分完成未知类别的模式分类下般部分属于设计分类器的训练过程利用样品进行训练确定分类器的具体参数完成分类器的 2 设计而分类决策在识别的过程中起作用对待识别样品进行决策分类 3 数据获取预处理特征提取分类决策分类结果训练样本输入误差检验预处理确定判别函数特征提取改进判别函数图 1 1 模式识别的过程 1 3 现有的手写特征提取的有关算法现有的手写特征提取的算法有多种最邻近模版匹配法基于 PCA 的模版匹配法基于类中心的欧式距离法分类法马氏距离分类法夹角余弦距离分类法二值化的夹角余弦距离分类法二值化的 Tanimoto 测度分类法特征空间分类法二值数据的贝叶斯分类法最小错误概率的贝叶斯分类法最小风险的贝叶斯分类法正太性分布函数的统计假设检验法 Fisher 算法 LMSE 算法势函数法基于核的 Fisher 法 BP 神经网络分类法 RBF 神级网络分类法 Hopfield 神经网络分类法自组织神经网络分类法 CPN 神级网络分类法等等还有各种现阶段的新型算法 1 4 手写特征的典型应用手写数字识别有着极为广泛的应用前景这也正是它受到世界各国的研究工作者重视的一个主要原因下面我们将介绍以手写数字识别技术为基础的典型应用 1 手写数字识别在大规模数据统计中的应用在大规模的数据统计如行业年检人口普查等中需要输入大量的数据以前完全要手工输入则需要耗费大量的人力和物力近年来在这类工作中采用 OCR 技术已成为一种趋势因为在这种应用中数据的录入是集中组织的所以往往可以通过专门设计表格和对书写施加限制以便于机器的自动识别目前国内的大多数实用系统都要求用户按指定规范在方格内填写另外这些系统往往采用合适的用户界面对识别结果做全面的检查最终保证结果正确无误可以看出这是一类相对容易的应用对识别核心算法的要求比较低是目前国内很多 3 单位应用开发的热点 2 手写数字识别在财务税务金融领域中的应用财务税务金融是手写数字识别大有可为的又一领域随着我国经济的迅速发展每天等待处理的财务税务报表支票付款单等越来越多如果能把它们用计算机自动处理无疑可以节约大量的时间金钱和劳力与上面提到的统计报表处理相比在这个领域的应用难度更大原因有 1 对识别的精度要求更高 2 处理的表格往往不止一种一个系统应能智能地同时处理若干种表格 3 由于处理贯穿于整个日常工作之中书写应尽量按一般习惯如不对书写者的写法做限定书写时允许写连续的字串而不是在固定的方格内书写这样对识别及预处理的核心算法要求也提高了 3 手写数字识别在邮件分拣中的应用随着人们生活水平的提高经济活动的发展通信联系的需求使信函的互换量大幅度增加我国函件业务量也在不断增长预计到 2000 年一些大城市的中心邮局每天处理量将高达几百万件业务量的急剧上升使得邮件的分拣自动化成为大势所趋在邮件的自动分拣中手写数字识别往往与光学条码识别人工辅助识别等手段相结合完成邮政编码的阅读目前使用 4 量最大的 OVCS 分拣机的性能指标 OCR 拒分率 30 OCR 分拣差错率 1 1 1 5 本文研究的内容本次设计拟解决的主要问题是运用 Matlab 的 Bayes 工具箱函数在系统实现的过程中面临的核心技术也就是图像预处理和数字识别等 2 个模块的 Matlab 程序的实现本系统研究的基本内容主要是从 Bayes 最小错误率和 Bayes 最小风险仿真程序设计两个主要分类入手运用 Bayes 分离器各种学习算法技术来解决现实生活中经常涉及到的印刷体数字字符 0 9 的识别问题第二章主要写了模式识别的基本概念和 Matlab 软件的基本介绍第三章主要写了手写数字的一些特征和手写数字特征的提取方法以及本论文选择什么方法对手写数字进行特征的提取与选择第四章主要介绍了 Bayes 分类器以及 2 种 Bayes 分类器决策方案的计算即最小错误率 Bayes 和最小风险 Bayes 第五章写了 Bayes 分类器的仿真实验及截图说明 4 2 模式识别与 Matlab 的介绍 2 1 模式识别 2 1 1 模式识别的基本概念模式识别 Patten Recognition 就是机器识别或机器自动识别目的在于让机器自动识别事物例如手写数字识别就是将手写的数字分到具体的数字类别中模式识别研究的内容是利用计算机对客观物体进行分类在错误概率最小的条件下使识别的结果尽量与客观物体相符合让机器判别事物的最基本方法就是计算原则上讲是对计算机要分析的事物与标准模板的相似程度进行计算例如要识别一个手写数字就要将它与 0 到 9 的模板进行比较看跟哪个模板最相似或最接近 2 1 2 模式识别系统一个典型的模式识别系统如图 2 1 所示由数据获取预处理特征提取分类决策及分类器设计五部分组成一般分为上下两部分上部分完成未知类别的模式分类下般部分属于设计分类器的训练过程利用样品进行训练确定分类器的具体参数完成分类器的设计而分类决策在识别的过程中起作用对待识别样品进行决策分类数据获取预处理特征提取分类决策分类结果训练样本输入误差检验预处理确定判别函数特征提取改进判别函数图 2 1 模式识别的过程 2 1 3 相关值计算 1 均值 5 N 个样品的均值可以表示为 2 1 T n N j j xxX N X x 1 2 1 1 其中是第 i 个特征的平均值 i x N j iji x N x 1 1 2 方差方差用来描述一批数的分散程度第 i 个特征的 N 个数的方差公式是 2 2 2 1 2 1 1 i N j iji xx N S 方差的平方根称为均方差 2 1 2 1 1 N j iijii xx N S 3 协方差与协方差矩阵在 N 个样品中第 i 个特征和第 j 个特征之间的协方差定义为 2 3 N k jjkiikij xxxx N S 1 1 1 对同一批样品来说 ij s ji s 如果一批样品有 n 个特征求出每两个特征的协方差总共得到 n xxx 21 个值将这个值排练成以下的 n 维方阵称为协方差矩阵 2 n 2 n 2 4 nnnn n n sss sss sss S 21 22221 11211 协方差矩阵是对称矩阵而且主对角线元素就是特征的方差 ii s i x 2 i s ni 2 1 2 2Matlab 2 2 1Matlab 软件的介绍 MATLAB 是 Math works 公司于推出的一套高性能的数值计算和可视化软件其全称是 Matrix Laboratory 亦即矩阵实验室经过多年的逐步发展与不断完善现已成为国际公认的最 6 优秀的科学计算与数学应用软件之一是近几年来在国内外广泛流行的一种可视化科学计算软件它集数值分析矩阵运算信号处理和图形显示于一体构成了一个方便的界面友好的用户环境而且还具有可扩展性特征 Math Works 公司针对不同领域的应用推出了信号处理控制系统神经网络图像处理小波分析鲁棒控制非线性系统控制设计系统辨识优化设计统计分析财政金融样条通信等 30 多个具有专门功能的工具箱这些工具箱是由该领域内的学术水平较高的专家编写的无需用户自己编写所用的专业基础程序可直接对工具箱进行运用同时工具箱内的函数源程序也是开放性的多为 M 文件用户可以查看这些文件的代码并进行更改 MATLAB 支持用户对其函数进行二次开发用户的应用程序也可以作为新的函数添加到相应的工具箱中 5 2 2 2 Matlab 的主要优缺点 1 Matlab 的主要优点 1 界面友好编程效率高 Matlab是一种以矩阵为基本变量单元的可视化程序设计语言它的语法结构简单数据类型单一命令表达方式接近于常用的数学公式这使Matlab用户在短时间内就能快速地掌握其主要内容和基本操作 Matlab不仅可免去大量的经常反复的基本数学运算而且它的编译和执行速度都远远超过了采用C和Fortran语言设计的程序可以说 Matlab在科学计算与工程应用方面的编程效率都远远高于其他高级语言 6 2 功能强大可扩展性强 Matlab语言不但提供了科学计算数据分析与可视化系统仿真等强大的功能而且具有可扩展性特征 Mathworks公司针对不同领域的应用推出了自动控制信号处理图像处理模糊逻辑神经网络小波分析通信最优化数理统计偏微分方程财政金融等30多个具有专门功能的Matlab工具箱各种工具箱中的函数可以互相调用也可以由用户自己更改 Matlab支持用户对其函数进行二次开发用户的应用程序可以作为新的函数添加到相应的工具箱中 3 易学易用性 Matlab不需要用户有高深的数学知识和程序设计能力不需要用户深刻了解算法及编程技巧 4 高效性 Matlab语句功能十分强大一条语句可完成十分复杂的任务它大大加快了工程技术人员从 7 事软件开发的效率据Math works公司声称 Matlab软件中所包含Matlab源代码相当于70万条c 代码正是Matlab语言的这些优势我们选择采用这种语言实现图像处理算法利用MATLAB强大的工具包使算法易于实现 2 Matlab 的主要缺点然而MATLAB自身存在的某些缺点限制了它的应用范围 1 Matlab是一种解释性语言所以它的语言执行效率低这对于实时性要求较高的领域如自动控制信号处理等其实时效率是较差的 2 Matlab程序不能脱离其环境运行因此它不能被用于开发商用软件 3 程序可以被直接看到程序的源代码因而不利于算法和数据的保密 2 2 3Matlab图像类型及转换分析 Matlab中的一幅图像可能包含一个数据矩阵也可能包含一个颜色映射表矩阵它包含4种基本的图像类型索引图像灰度图像 RGB图像和二值图像此外 Matlab还支持由多帧图像组成的图像序列 7 1 索引图像索引图像包括一个数据矩阵A 一个颜色映射矩阵B 其中B是一个包含3列和若干行的数据阵列 B矩阵的每一行分别表示红色绿色和蓝色的颜色值在Matlab中索引图像是从像素值到颜色映射表值的直接映射像素颜色由数据矩阵A作为索引指向矩阵B进行索引例如值1 指向矩阵B中的第一行 2指向第二行依此类推 2 灰度图像 Matlab中一幅灰度图像是一个数据矩阵I 其中I的数据均代表了在一定范围内的颜色灰度值 Matlab把灰度图像存储为一个数据矩阵该数据矩阵中的元素分别代表了图像中的像素矩阵中的元素可以是双精度的浮点数类型 8位或16位无符号的整数类型大多数情况下灰度图像很少和颜色映射表一起保存但是在显示灰度图像时 Matlab仍然在后台使用系统预定义的默认的灰度颜色映射表 8 3 二值图像与灰度图像相同二值图像只需要一个数据矩阵每个像素只取两个灰度值二值图像可以采用uint8和double类型存储工具箱中以二值图像作为返回结果的函数都使用uint8类型 4 RGB图像 8 RGB图像即真彩色图像在Matlab中存储为nXmX3的数据矩阵数组中的元素定义了图像中每一个像素的红绿蓝颜色值需要指出的是 RGB图像不使用Windows颜色映射表像素的颜色保存在像素位置上的红绿蓝的强度值的组合来确定图像文件格式把RGB图像存储为24位的图像红绿蓝分别占8位这样可以有约1000万种颜色即2 16777216 5 图像序列 Matlab 的图像处理工具箱中还支持将多帧图像连接成图像序列图像序列是一个四维的数组图像帧的序号在图像的长宽颜色深度之后构成第四维比如一个包含了 5 幅 400 300 像素的真彩色图像序列其大小为 400 300 3 5 9 3 手写特征的提取与选择 3 1 特征的种类与筛选在抽取过程中针对手写数字的特点抽取了包括傅立叶系数特征笔划密度特征轮廓特征投影特征重心及重心矩特征粗网格特征和首个黑点位置特征共 104 维特征 3 1 1 笔划密度特征笔划密度特征的提取方法是以不同方向扫描数字计算扫描线和笔划相交的次数形成笔划密度特征向量在本文中我对 16X16 的样本在水平方向上每隔 4 行扫描一次提取了 4 个特征值并在垂直方向上也每隔 4 行扫描一次提取 4 个特征值最后共形成 8 个值的特征向量从密度特征的提取方法容易看到笔划密度特征对字形畸变的抗干扰能力较强但抗噪声能力较弱 3 1 2 傅立叶变换特征关于在频域里提取形状特征的问题一般来说区域的别界是一条封闭的曲线如果在此轮廓线上取一动点并且沿曲线逆时针方向移动则从点的坐标的变换是一个周期函数通过规范化以后这个周期函数可以展开成傅立叶级数显然傅立叶级数中的一系列系数于边界曲线的形状有关可以用作形状的描述当增加级数的项数使系数取到足够多的阶次时几乎可以把形状信息完全提取出来并且可以通过这些系数重建原来的几何形状 9 傅立叶变换是在图像处理中应用广泛的一种二维正交变换傅立叶变换后平均值即直流项正比于图像灰度值的平均值低频分量则表明了图像中目标边缘的强度和方向手写体字符一般能用很多线段构成的封闭轮廓来表示通过映射所得到的一些离散量能够充分的反映这些封闭轮廓的变化傅立叶系数能够很好的描述图像边界轮廓其值与相似字形的平移旋转位移和尺寸大小无关在字形表征和识别时这些特征形成明显的数据压缩 10 图像经数字化处理后可以用二维的离散信号 I m 来表示对于二维离散信号 Am n m 0 1 M l r 0 1 二 N 1 其离散傅立叶变换定义为 3 1 2 1 0 1 0 1 u N nv M mv j N n M m enmf NM vF 10 在式中 1 M l t 0 1 N 1 称为空间频率 J 为虚数单位广一 1 逆变换定义为 3 2 2 1 0 1 0 1 m N nv M mv j N n M m evuF NM nf 在式中 mom 1 M l n O l N 10 在图像处理时一般选取图像块为 Nx 的方阵即取 M N 这时二维离散傅立叶变换和逆变换式为 3 3 2 1 0 1 0 1 u N nv M mv j N n N m enmf N vF 3 4 2 1 0 1 0 1 m N nvmv j N n N m evuF N nf 在 2 3 和 2 4 两式中 u v m n 0 l N 1 从物理效果看傅立叶变换是将图像从空间域变换到频率域其逆变换是将图像从频率域转换到空间域换句话说傅立叶变换的物理意义是将图像的灰度分布函数变换为频率分布函数傅立叶逆变换是将图像的频率分布函数变换为灰度分布函数傅立叶变换可以得出信号在各个频率点上的强度 11 傅立叶变换之所以在图像处理中被广泛使用成为图像处理的有力工具就因为它具有良好的性质傅立叶变换具有可分离性式 2 1 的指数可以被分解从而变换可以写成如下形式 3 5 N mu j N n N nv j N m eenmf NN vuF 2 1 0 2 1 0 1 1 根据此式二维离散傅立叶变换分解为水平和垂直两部分运算式 3 5 中方括号中的项表示在图像的行上计算的离散傅立叶变换方括号外面的求和则实现结果数组在列上的离散傅立叶变换这种分解使得可以用一维的快速傅立叶变换来实现二维傅立叶变换具体来说一般采取连续 2 次运用一维离散快速傅立叶变换的方法来实现即先没 m n 的每一个 m 对 n 求变换再乘以 N 得到 F m v 完成第一次变换然后再将得到 F m v af m v 的每一个 v 对 m 求变换即可得 m n 的最终变换 F u v 对字符点阵 16x16 做二维离散傅立叶变换可以得到 256 个傅立叶系数将 F u v 用矩阵表示如下 11 3 6 1 1 0 1 0 0 0 NNFNF NFF F F u v 的大幅值系数集中在低频区域内即矩阵的左上右上左下右下四角的周围我对字符点阵做二维 16X16 点的离散傅立叶变换并从上文中所提到的四个低频区域中选取了 32 个离散傅立叶变换系数作为特征这 32 个特征系数是 F 0 0 F 0 1 F 0 2 F 0 3 F 0 4 F 1 0 F 2 0 F 3 0 F 4 0 F 1 1 F 1 3 F 2 1 F 2 2 F 2 3 F 3 1 F 3 2 F 1 15 F 1 14 F 2 15 F 2 14 F 3 15 F 15 1 F 14 1 F 14 2 F 13 1 F 15 15 F 15 14 F 15 13 F 14 15 F 14 14 F 13 15 F 13 14 然后再将这些特征归一化到 0 1 区间之内 3 1 3 轮廓特征字符的轮廓特征能够很好的反映字符的整体结构和特性提取轮廓特征时先由根据边界信息算法的 A 值操作组成从而提供了字符的轮廓外形从规整化的轮廓中直接可以导出字符的边缘轮廓规整化的字符以 NXN 的点阵表示在这里 N 为 16 记为点阵第 k 行的左右轮廓 k Lp k Rp k 0 N 1 满足 f k 1 且当 j f k j 0 0 k j Rp 0 j 0 j 0 j 1 字符宽度定义为 W k Rp k 一 Lp k 3 7 K 0 N 1 表示指定的行宽度在描述某些字符如 0 6 8 9 时非常用 2 比率定义为比率 N Wmax 3 8 W 二是字符有效宽度 W max W k k 0 N 1 利用比率特征可以有效识别字符 1 对于字符 1 来说比率特征总是大于 2 5 而对于其他字符来说比率特征并非总是大于 2 50 3 字符有效高度 Hamx 定义为 Hmax max H k 3 9 K 属于 O N 1 H k 为第 k 列的字符高度 12 4 宽高比定义为 W H 左右边缘线的一阶有限差分别为 LDif k Lp k 一 Lp k 1 3 10 RDif k Rp k 一 Rp k 1 3 11 由此定义了如下特征字符轮廓线最大值和最小值所在的位置 Lmax k k max Lp k 3 12 Rmax k k max Rp k 3 13 Lmax k k min Lp k 3 14 Rmax k k min Rp k 3 15 字符左右边缘线的正负峰 Lpeak max LDif k 3 16 Rpeak max RDif k 3 17 Lpeak min LDif k 3 18 Rpeak min RDif k 3 19 Lpeak Lpeak Lpeak 3 20 Rpeak Rpeak Rpeak 3 21 这样共有 14 个特征分别是字符有效宽度字符比率字符有效高度字符高宽比字符轮廓线左侧最大值字符轮廓线左侧最小值字符轮廓线右侧最大值字符轮廓线右侧最小值字符边缘线左侧正峰值字符边缘线左侧负峰值字符边缘线右侧正峰值字符边缘线右侧负峰值字符边缘线左侧正负峰值绝对值之和字符边缘线右侧正负峰值绝对值之和 12 3 1 4 投影特征如图 3 1 所示将一个字符点阵划分成四个象限区域共有十二个边线将一个字符点阵中的每一个黑点向最近的四条边线沿水平和垂直方向投影用十二条边线上的投影长度作为投影特征一共有十二个特征 13 图 3 1 投影特征投影算法的基本描述如下对于字符点阵中的每一个点投影到离它最近的四条边线上具体投影方法如图 3 2 所示图 3 2 水平竖直方向上的投影当一点被投影到某一个边线上时激活该边线上的某一个 bit 或者某些 bit 这些被激活的 bit 取值为 1 其他没有被激活的取值为 0 当一个字符所有的点都投影完时计算某一个边线上 1 的个数即为字符在这一个边线上的投影数值之所以选用投影特征作为手写体数字识别的特征一方面是因为投影特征计算简单能够反映字符的内部结构和笔划的分布情况唯一性可区别性好是比较有代表性的特征不同 14 数字之间的 12 个投影特征的各个分量差异比较明显可以考虑作为分类的细特征另一方面神经生理学认为在哺乳动物视觉系统内存在着类似的投影边线人们在进行识别时在不同的水平上引用到这些线索因此引入字符的投影特征也是符合人脑的感知模型 3 1 5 重心及重心矩特征由于不同字符的笔划不同其象素点的分布不同所以造成不同字符的重心位置不同与其有关的一些离散量包含了字符几何特征的信息令 fIm 表示点阵中第 m 行第 n 列象素定义 3 22 1 0n 1 0 1 0n 1 0 m NM m NM m nm nm f m f 3 23 1 0n 1 0 1 0n 1 0 n NM m NM m nm nm f n f 其中 m 1 2 M 1 n 1 2 N 1 m n 就定义为整个字符的重心位置定义重心矩如下 3 24 2 2 1 2 2 1 nnmmL N j N jn M i M im ji 其中 i 1 2 j 1 2 这样可以得到四个重心矩特征中的象素偏离重心位置的整体特征 L j i 1 2 j 1 2 它们分别反映了四个象限本文中的重心及重心矩特征计算了点阵的重心位置以及四个象限重心矩共五个特征包括一个二维特征四个一维特征 3 1 6 首个黑点位置特征按上文中定义的八个方向沿逆时针方向即 0 度方向一 45 度方向一 90 度方向一 135 度方向一 180 度方向一 135 度方向一 90 度方向一 45 度方向统计各个方向上由外至内首个黑点出现的位置共计 8 个二维特征 15 3 1 7 粗网格特征粗网格特征是一组注重字符图像整体的分布特征此种特征对噪声具有极强的抑制能能力一般来说虽然手写数字的书写风格千变万化但是数字笔划的分布是有一定的规律的由于 10 个字符的笔划具有比较固定的总体分布状况从特征选择的质量来讲不同数字的特征向量在特征空间中的分布是比较分散的即特征空间中不同类的类间距离是比较大的本文进行的粗网格特征提取其提取方法的主要思想是把数字点阵分成几个局部小区域并把每个小区域上的点阵密度作为描述特征即统计每个小区域中图像象素所占的百分比作为特征数据针对 16X16 的点阵我将之划分成大小为 4X4 的小区域共计 16 个因此共得出一个十六维的粗网格特征由于粗网格特征反映的是图像的局部统计特征是个百分比相对值而图像局部的形变或噪声对应数字点阵就是局部元素的 0 和 1 的值互换所以如果图像带有局部的形变或噪声与没有形变和噪声的原图像相比计算出来的百分比相对值变化不大也就是说这个相对值对于数字图片局部笔划的形变或孤立噪声点带来的影响不敏感因此以粗网格为特征进行数字识别具有较好的抗噪声能力根据不同点阵和取不同小区域的具体计算方法可参考文献同时根据文献的实验结果以粗网格作为特征提取进行数字识别有很好的识别率 13 3 2 特征提取方法特征提取是整个字符识别系统的关键识别算法是根据选取特征的种类来进行选择的所选取的特征是否稳定是否代表一类字符的特点是系统识别率的高低的关键手写体字符特征提取的方法可分为结构特征和统计特征两种下面分别简述这两种特征提取方法的特点与一般方法 14 3 2 1 结构特征提取方法采用结构特征提取对字符进行结构分析从而达到识别的目的是一种非常直观的方法其思想与人认字的原理有点相象但又有所不同其基本思想是字符可以逐级分解成部件笔划乃至笔段识别时可以自底向上由象素得到笔段由笔段结合成笔划由笔划构成部件由部件组成字符逐级分析字符图象的结构根据各元素的属性数量及其相互关系便可以判定待识字符目前研究较成熟效果比较好的是基于笔划和基于笔段分析的手写体字符识别 15 16 对不同的字符手写样本尽管人书写风格千变万化然而笔划与笔划之间的位置关系以笔划为基元的字符的整体拓扑结构是不变的人认字就是抓住了这些本质不变的特征因此能适应不同的书写风格的文字所以基于笔划来自动识别字符一直是手写体字符识别研究的一类主要研究方法虽然字符的笔划特征受字体字形大小等影响较小是识别字符的良好特征但可惜笔划特征对实际的书写文本来说较难稳定的提取通常用基于笔划段作为特征能较好的解决这一困难采用结构特征提取方法的难点在于笔划或笔段等基元的准确提取虽然提取笔划或笔段的方法己有多种研究但它们都是基于图象处理的方法截然不同于人根据知识和经验而作出的视觉处理单纯建立在图象处理方法上的笔段机器分析只能十分机械地按图象就事论事结果提取到的笔段难免与人的判别不完全一致这种情况在存在连笔断笔模糊等的场合尤为不可避免所以书写畸变对结构特征分析法有十分重要的影响因此寻求稳定可靠的笔段提取方法仍然是当前有待进一步研究的课题 3 2 2 统计特征提取方法从统计模式识别的观点来看字符识别实际上是一个模式分类问题人对自然物体的识别是建立在对该物体进行学习特征分析的基础上的计算机模式识别的过程与人的识别过程有着相识的地方实际上就是一种通过学习或者其它方法形成一个记忆知识库进行模式识别时清晰地表达出一种从物体到记忆知识库的映像从而得到识别结果人在进行物体识别时是利用大脑中通过学习形成的记忆库对识别的物体进行一种黑箱式的映像从记忆库中找出相匹配的类别计算机要把人类识别物体时的这种黑箱式的映像表达出来一般是由两个步骤来完成的第一步以适当的特征来描述物体即由 xi f xi 的映像第二步计算机执行某种运算完成由 f xi c x X 的映像此过程实际上就是传统的统计模式识别进行物体识别时所采用的一般方法具体来说就是特征提取和分类函数的设计的问题而特征提取是问题难点和的关键所在因为如果特征己知就可以利用现有的数学理论来指导设计映像函数 R xi 然而对于特征的选择和提取却没有可遵循的理论来指导我们很难比较一个物体中哪些特征是实质性那些特征是有代表性的那些特征可能是不重要的或与识别无关的这需要大量的实验和理论指导经过人们在这方面的大量研究工作发展了一些统计特征提取方法在本章后面部分我们将讨论几种常用的特征提取方法并提出了本文中使用的特征向量 16 17 3 3 手写特征模式识别方法对数字识别特征提取有多种方法本论文采用的方法是先提取数字的轮廓特征然后对图像进行裁剪之后按黑像素占总像素的比率提取出的特征值轮廓特征主要是指周边轮廓特征即将数字字形加上外接矩形边框然后分别从上下左右四个方向依次扫描数字点阵直至碰到第一个黑象素或对面的边框为止记录下每次扫 9 描所经过的白象素数从而得到对应数字的 4 维特征向量称为数字的周边轮廓特征此特征稳定性较强较易提取维数较低独立性较强完成图像进行裁剪以后把每个数字图形定义成一个 N N 5 5 的模板将每个样品的长度和宽度 N 等分平均有 N N 个等分对每一等分进行像素个数统计除以每一份的面积总数即得特征值具体步骤如下 1 调入样本图片找出图片中数字的上下左右边界对图像进行裁剪处理 2 将数字区域平均分成 5 5 的小区域 3 计算 5 5 的每个小区域中黑像素所占比例第一行的 5 个比例值保存到特征的前 5 个第二行对应着特征的 6 10 如此保存样本的特征值调入样本图像保持特征数据计算每个小区域中黑色素所占比例将处理好的图片划分成5 5的均匀小区域把裁剪出来的图片规范成 150 150的标准图片根据图片轮廓裁剪图片图 3 3 特征提取过程本论文提取每个数字 25 个样本的特征值之后把它们保存在结构体 Mytemplet 里构成了特征库下面以 0 为例看一下求取特征值的方法首先把图像按边缘裁剪放缩后然后分成 5x5 的小区域如下所示然后计算出每个小区域中黑像素所占的比例存储之后即为 0 的一个样本特征值 18 图 3 4 数字 0 的特征提取下面提取出来的就是上面数字 0 每个区域对应的特征值表 3 1 数字 0 的特征值 0 13220 23560 16890 22320 1522 0 33330000 2900 0 27000000 2689 0 29670000 2911 0 09890 23560 17440 23000 1133 得到的特征值再通过 Bayes 决策进行计算最终得到决策结果 19 4 Bayes 分类器在手写特征中应用 4 1 Bayes 分类器贝叶斯 Bayes 分类器的分类原理是通过某对象的先验概率利用贝叶斯公式计算出其后验概率即该对象属于某一类的概率选择具有最大后验概率的类作为该对象所属的类也就是说贝叶斯分类器是最小错误率意义上的优化目前研究较多的贝叶斯分类器主要有四种分别是 Naive Bayes TAN BAN 和 GBN 贝叶斯分类器是用于分类的贝叶斯网络该网络中应包含类结点 C 其中 C 的取值来自于类集合 c1 c2 cm 还包含一组结点 X X1 X2 Xn 表示用于分类的特征对于贝叶斯网络分类器若某一待分类的样本 D 其分类特征值为 x x1 x2 x n 则样本 D 属于类别 ci 的概率 P C ci X1 x1 X2 x 2 Xn x n i 1 2 m 应满足下式 P C ci X x Max P C c1 X x P C c2 X x P C cm X x 而由贝叶斯公式 P C ci X x P X x C ci P C ci P X x 其中 P C ci 可由领域专家的经验得到而 P X x C ci 和 P X x 的计算则较困难 17 最小错误概率贝叶斯分类器把代表模式的特征向量 x 分到 c 个类别 1 2 c 中某一类的最基本方法是计算 x 的条件下该模式属于各类的概率用符号 P 1 x P 2 x P c x 表示比较这些条件概率最大数值所对应的类别 i 就是该模式所属的类例如表示某个待查细胞的特征向量 x 属于正常细胞类的概率是 0 2 属于癌变细胞类的概率是 0 8 就把它归类为癌变细胞上述定义的条件概率也称为后验概率在特征向量为一维的情况下一般有图中的变化关系当 x x 时 P 1 x P 2 x 对于 x x 的区域由于 P 2 x P 1 x 因此 x 属 2 类对于 xP 2 x x 属 1 类 x 就相当于区域的分界点图中的阴影面积就反映了这种方法的错误分类概率对于以任何其他的 x 值作为区域分界点的分类方法都对应一个更大的阴影面积因此贝叶斯分类器是一种最小错误概率的分类器若已知总共有 M 类物体以及各类在这 d 维特征空间的统计分布具体说来是已知各类别的M 2 1 先验概率及类条件概率密度对于被测样品 Bayes 公式可以计算出该样品分属 P XP 个类别的概率叫后验概率看 X 属于哪个类的可能性最大就把 X 归于可能性最大的那个 6 类后验概率作为识别对象归属的依据 Bayes 公式如下 20 4 1 M j j ii PXP PXP XP 1 j i 类别的状态是一个随机变量而某种状态出现的概率是可以估计的 Bayes 公式体现了先验概率类概率密度函数后验概率三者的关系 18 4 2 基于概率的 Bayes 决策当分类器的设计完成后对待测样品进行分类一定能正确分类吗如果有错分类情况发生是在何种情况下出现的错分类的可能性会有多大我们以某制药厂生产的药品检验识别为例以此说明 Bayes 决策所要解决的问题我们以药品为例如图 4 1 正常药品 19 异常药品识别的目的是要依据 X 向量将药品划分为两类对于图 4 1 来说可以用一直线作为分界线这条直线是 X 的线性方程称为线性分类器如果 X 向量被划分到直线右侧则其为正常药品若被划分到直线左侧则其为异常药品可见对于其作出决策是很容易的也不会出现差错 20 A B x2 A x2 o x1 o x1 图 4 1 线性可分示意图图 4 2 线性不可分示意图问题在于出现摸棱两可的情况如图 4 2 所示此时任何决策都存在判错的可能性从图 4 2 中可见在直线 A B 之间属于不同类的样品在特征空间中相互穿插很难用简单的分界线将它们完全分开即所观察到的某一样品的特征向量 X 在 M 类中又有不止一类可能呈现这一 X 值无论直线参数如何设计总会有错分类发生如果以错分类最小为原则分类则图 21

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

手写数字特征提取与分析.doc

文档简介

温馨提示

最新文档

评论

手写数字特征提取与分析.doc

文档简介

温馨提示

最新文档

评论

相关文档