MNIST手写数字识别matlab_图文_第1页
MNIST手写数字识别matlab_图文_第2页
MNIST手写数字识别matlab_图文_第3页
MNIST手写数字识别matlab_图文_第4页
MNIST手写数字识别matlab_图文_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 图 7: 77 粗网格特征每个数字识别 图 9: 截断次数特征每个数字识别 计 6+6 条切割线,得到 12 个一维特征。测试 实验中, 10000 个手写数字识别了 6746 个, 识别率达 67.46% 需要指出的是,这种方法 识别对一般的数字识别能力应该很强,并且 需要的特征值少,但由于手写数字很多都出 现了断笔、毛刺,而且个人书写习惯也不同, 如图 8 右图手写习惯导致截断次数发生误 差,并只应该有一次截断的却有两次截断, 所以在实验中没有达到很好的效果。图 9 给 出了截断次数特征方法每个数字的识别情况。 截断次数特征识别对数字敏感,各个数字间 的识别率相差巨大,比如数字 1 识别

2、率达 到 90% 以上,而数字 2 识别率不到一半,这 是由于截断次数特征决定的。 图 8: 手写 2 和 7 的截断 内黑色像素百分比作为特征值具有稍好的识 别能力。另外图 7 给出了该方法每个数字的 识别率。77 粗网格特征识别较 44 粗网格 特征识别有了很大提高,特别是对 0 、 1 这 两个数字的识别率很高,这有 0 和 1 数字较 为简单与其他数字相似性较小的原因。 4.2.3 截断次数特征识别 截断次数特征是利用数字 0-9 在横向和 纵向被切割时,与切割线有交叉的次数不同, 原理如图 8 左图所示,红线作为切割线在竖 直方向与数字 2 可能有三次相交,也能只一 次,而横向的相交

3、则只有两次或者一次,一 般情况不可能出现三次。利用数字的这些特 性就可以得到相应的特征值进行识别。 实验中使用间隔为 4 的切割线,由于第 一 行、第 一 列 和 最 后 一 行、最 后 一 列 不 含 有黑色像素,所以只在图像内进行截断,共 6 4.3 多特征识别 多特征识别是指结合手写数字多个特征 进行识别,多特征包含了更多的特征值,提 高了手写数字的识别能力。但一方面常常为 了获得较高的识别率,采集了大量的特征值, 这些大量特征值加大了计算量和开销;另一 方面众多特征描述能力参差不齐,如果全部 将其加入特征提取并进行分类,则有可能效 果还不如某些描述能力强特征的组合,出现 “过计算” 、

4、 “过学习”问题;最后值得一提 的是特征数的增多要求训练样本也必须呈指 数增多,形成“维数灾难”问题。 为了解决多特征带来的“过学习”和“维 数灾难”问题,减少多维数,可以对特征进 行特征提取(feature extraction)和特征选择 (feature selection) ,他们都从原始的 F 个位 数中提取出描述能力强的 f 个特征, 8 就给 出了多特征组合并应用网络神经分类器进行 识别。 在实验过程中发现,多特征的组合对识 别效果有很大影响,例如 6 也谈到了多特 征的组合问题, 9 提出了使用动态权值集 成来优化多特征组合。我使用的是每个特征 距离或者特征值距离的线性组合,并

5、控制权 值系数优化组合,即: 最终距离 =k1 特征(值) 1+ + kn 特征(值)n 使用特征距离和特征值距离的区别在于 系数的多少,选取了多个个特征就会有多少 个特征距离1 ,相应选择了多少特征值就可 以有多少个特征值距离,实验中使用的是前 面 77 粗网格特征距离(dist77)和截断次 数特征距离(dist66)进行线性组合得到最终 的判别距离(dist) : 图 10: 系数 k1 与失误率 失 误 率 系数 k 图 11: 系数 k2 与失误率 效果,只有当系数 ki 当取得的 k 值使得识 别率最高时,我们认为这时识别率最高,如 图 10 和图 11 分别在 46 和 240

6、附近取得最 dist=dist77+k1*dist66 优识别率,分别为 85.26% 和 85.04% ,比单 dist=k2*dist77+dist66 个特征识别能力都要高,如图 12 多特征识别 第一个等式得出的 dist77 以黑色像素个 的效果要优于单个 77 粗网格特征识别或者 数作为特征值计算测试样本距离,第二个等 截断次数特征识别能力,但也一定程度上保 式是使用黑色像素百分比计算出来的距离, 持了他们的识别特性。 两者在识别能力上相近。随着他们的线性系 在实验中使用了两个特征 49+12 个特征 数(k1、k2、. . . kn )的取值不同,会得到不 同识别率,如果某些系数

7、 ki 取得较大时,那 值,识别率达到 85.16%。图 13 所示与参考 么识别结果就偏向于对应的单个特征识别的 文献 7 结果相仿,但这样最优系数 ki 的值 也就需要更多的训练得到。如果粗网格特征 1 每个特征距离都是该特征内所有特征值的一个距 和切割线特征能够结合其他特征可以达到更 离,可以是欧式距离,也可以是其他距离,实验中使 用欧式距离 好的识别效果。 7 5 结论 文章从单特征识别和多特征识别共计完 成了三种识别方案,并具有一定的识别率。 从实验中可看出: 代表测试数字个数 代表误识数字个数 首先,合理地选择适当的特征可以减少 特征值数量,简化后期特征提取、降维过程。 其次,部分

8、特征对某些数字的识别具有 较高的准确度,对其他数字识别率较低,比 如截断次数特征对数字 0 、 1 识别率较高, 对 4 、 7 和 6 、 8 这类数就失误率较高。 第三,基于第二点中特征对数字识别具 有选择性,我们可加大这些特征在最终识别 判断中的权重,提高识别率。 第四,多特征识别中每个特征提取出的 特征值对数字识别贡献有大小区分,必须对 特征乘以权重系数平衡特征的影响,以使得 识别率最优,但这个系数的选取也是一个复 杂过程,特别是当特征和特征值较多时,系 数选取更加复杂。 第五,为了达到计算量和识别率的平衡, 多特征实验中选取的系数在特征距离上,而 没有在特征值上2 。 最后文中没有谈

9、到的是对数字二值化的 阈值的选取对实验结果也有较大影响,好的 阈值可以去除部分噪声和部分毛刺,这些噪 声和毛刺对截断次数等这类特征影响大。 实验完成的工作有限,待以后完成的工 作有: 一、实验最多使用了两个特征:粗网格 特征和截断次数特征,共计 61 个特征值,最 好的识别能力为 85.16%,我们可以通过提取 更多的特征和特征值来提高识别率。 二、将降维添加到特征提取过程,通过 实验中共选了 2 个特征、 61 个特征,通过训练得 到两个特征距离的最优系数,而不是训练得到 61 个 最优系数 2 图 12: 多特征识别每个数字识别 图 13: 参考文献 7 结果 8 因子分析或人工剔除描述能

10、力差的特征,减 少特征值个数,减少计算量和时间,提高效 率。 三、把单个数字特征作为预识别,快速 识别出那些具有某些明显数字特征,提高识 别率和识别时间。 四、在多特征识别中,提高那些对某些 数字识别能力强的特征的系数值。比如截断 次数特征对数字 0 、 1 等识别能力强,我们 可以在用截断次数特征判断出为 0 、 1 这些 数字时,提高其距离在所有特征距离中的系 数,优化识别效果。 9 基于动态权值集成的手写数字识别方法, 计算机工程与应用 参考文献 1 手写体数字识别系统中一种新的特征提 取方案,计算机科学 2 手写体数字识别中的特征提取和特征选 择研究(硕士论文) 3 数字、字符识别及其应用研究(博士论 文) 4 手写

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论