人民币纸币冠字号识别

上传人：瀚*** IP属地：湖北上传时间：2023-12-12 格式：DOCX 页数：51 大小：2.85MB 积分：15 举报 版权申诉

已阅读5页，还剩46页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

人民币纸币冠字号识别摘要人民币是我国的唯一合法货币，自人民币发行以来，总共有5套，目前流通于市面的人民币，是上世纪九十年代发行的第五套人民币。近年来，随着中国经济的高速发展，人民币的发行量也越来越大，对于中国的防伪技术也有了越来越大的考验。冠字号作为人民币的“身份证”，在防伪方面有着至关重要的地位，所以，人民币的冠字号识别技术在近年越来越受到关注。利用计算机自动实现人民币的冠字号识别技术，是模式识别应用的一个重要领域。本文提出了一套完整的人民币纸币冠字号识别的算法，主要包括人民币的预处理和冠字号的识别两部分。在人民币预处理中，本文提出了一种基于先验知识和垂直投影的算法对冠字号区域进行定位，有效的节省了后期的运算时间，通过比较选择Otsu法进行二值化处理和5×5中值滤波进行滤波处理，并且采用Hough变换进行倾斜校正，避免影响识别效果，对校正后的冠字号采用垂直投影法进行分割并归一化，为接下来的识别打下基础；在冠字号识别中，本文采用HOG算法提取出字符特征，该算法与SVM的组合运用广泛，在详细介绍模板匹配法、人工神经网络和SVM（支持向量机）三种算法后，采用了一种基于SVM的一对一多分类识别算法，成功识别出冠字号。经过MATLAB计算机仿真实验证明，本文提出的完整的人民币纸币冠字号识别的算法准确率能达到85.25%，具有一定的应用价值。关键词：人民币冠字号，MATLAB，SVM注：本设计（论文）题目来源于教师的国家级（或部级、省级、厅级、市级、校级、企业）科研项目，项目编号为：。AbstractTheRMBistheofficialcurrencyofthePeople'sRepublicofChina.ThemostofthecurrentlycirculatingRMBisthefifthsetwhichissuedin1990s.Inrecentyears,withtherapiddevelopmentofChina'seconomy,thecirculationoftheRMBisgrowingaswell,andtherehasbeenanincreasingchallengeforChina'santi-counterfeitingtechnology.Asthe"identitycard"oftheRMB,theCrownwordnumberhasavitalpositioninanti-counterfeiting.Therefore,theRMBidentificationtechnologyhasbeenpaidmoreattentioninrecentyears.UsingcomputertechnologytoautomaticallyrecognizetheCrownwordnumberofRMBisanimportantfieldofpatternrecognitionapplication.ThispaperproposesacompletealgorithmfortheidentificationoftheCrownwordnumberofRMB,includingthepreprocessingoftheRMBandtheidentificationofthecrownnumber.IntheRMBpreprocessing,thispaperproposesanalgorithmbasedoncommonsenseandverticalprojectiontolocatetheCrownwordnumbersizearea,whicheffectivelysavesthelateroperationtime.Aftercomparing,wechoosetheOtsumethodforbinarizationand5×5medianfilterforfiltering,andtheHoughtransformfortiltcorrectiontoavoidaffectingrecognitionaccuracy.ThecorrectedCrownwordnumberaredividedbytheverticalprojectionmethodandthenbenormalizedtolaythefoundationforthenextrecognition.IntheCrownwordnumberrecognition,thispaperusestheHOGalgorithmtoextractcharacterfeatures,whichiswidelyusedinthecombinationofSVM.Afterintroducingthetemplatematchingmethod,artificialneuralnetworkandSVM(SupportVectorMachine),weuseanone-versus-onemulti-classSVMidentificationalgorithmsuccessfullyidentifiestheCrownwordnumber.TheMATLABcomputersimulationexperimentprovesthatthecorrectionofthecompletealgorithmfortheidentificationoftheCrownwordnumberofRMBcanreach85.25%,whichhascertainapplicationvalue.Keyword:Crownwordnumber,MATLAB,SVM目录8839_WPSOffice_Level11绪论 113898_WPSOffice_Level11.1本课题的研究背景与意义 18593_WPSOffice_Level11.2本课题的研究现状 210730_WPSOffice_Level11.3本课题主要工作 310501_WPSOffice_Level11.4论文的章节安排 416177_WPSOffice_Level12人民币冠字号的定位以及二值化和滤波处理 528262_WPSOffice_Level12.1人民币的冠字号区域定位 58593_WPSOffice_Level22.1.1冠字号在人民币的独有性质 516177_WPSOffice_Level22.1.2基于先验知识和投影的定位算法 618189_WPSOffice_Level12.2冠字号区域的图像二值化 1126704_WPSOffice_Level22.2.1图像分割技术 1119042_WPSOffice_Level22.2.2边缘检测算法 1124335_WPSOffice_Level22.2.3阈值分割算法 136130_WPSOffice_Level12.3冠字号区域的滤波处理 179233_WPSOffice_Level22.3.1噪声的定义 174611_WPSOffice_Level22.3.2数字滤波处理 1811175_WPSOffice_Level12.4本章小结 2122665_WPSOffice_Level13人民币冠字号的倾斜校正以及字符分割和归一化 2226704_WPSOffice_Level13.1冠字号区域的倾斜校正 2219042_WPSOffice_Level13.2冠字号的字符分割 2411198_WPSOffice_Level23.2.1区域连通法 2412408_WPSOffice_Level23.2.2先验知识法 243516_WPSOffice_Level23.2.3基于垂直投影的字符分割法 2412774_WPSOffice_Level13.3冠字号的字符归一化 2619552_WPSOffice_Level13.4本章小结 2723378_WPSOffice_Level14人民币冠字号的字符识别 2824335_WPSOffice_Level14.1冠字号的特征提取 287951_WPSOffice_Level14.2冠字号的字符识别 312947_WPSOffice_Level24.2.1模板匹配识别 319276_WPSOffice_Level24.2.2人工神经网络识别 323311_WPSOffice_Level24.2.3支持向量机识别 349877_WPSOffice_Level14.3基于SVM的冠字号的识别 4032224_WPSOffice_Level14.4本章小结 428473_WPSOffice_Level1结论 439233_WPSOffice_Level1参考文献 4423916_WPSOffice_Level1致谢 46人民币冠字号的定位以及二值化和滤波处理常识告诉我们，冠字号位置固定且占比小，位于整张人民币的左小角，因此我们可以采取先定位出冠字号区域，这样可以减少后期处理的运算时间。为了区分目标和背景，需要对定位好的冠字号区域进行二值化，不仅可以在后面的处理中减少占用空间和运算时间，更好的突出目标增加识别的准确率。由于人民币在流通过程中或多或少的会有污损，而且在采集过程中由于光照、设备电路等原因，会在图像中引入噪声，因此需要对冠字号区域进行滤波处理，否则会影响识别的精度，2.1人民币的冠字号区域定位2.1.1冠字号在人民币的独有性质2005版和2015版的百元人民币是现在市面流通最广的面额最大的人民币[11]，本文主要研究这两个版本的人民币。2005版的人民币上的冠字号固定位于其左下角（横向排列），占比小，冠字号字符的大小和高宽比有一个严格的标准，字符间的间距也有一定的要求。冠字号一共有十位，其中两位是英文大写字母（除了V），剩余的八位为阿拉伯数字，英文大写字母只可能出现在冠字号前四位，颜色为深红色，后六位为黑色。2015新版人民币在2005版人民币的基础上，适当的调整了一些图案，其中位于左下角的冠字号不变，但是在人民币的右侧增加了一列冠字号（纵向排列），颜色为蓝色,如下图所示。图2.12005版百元人民币及其冠字号图2.22015版百元人民币及其冠字号2.1.2基于先验知识和投影的定位算法从人民币的特征分析我们得知，冠字号只占整张人民币的左小角一小部分，若对整张人民币进行图像处理会对算法的要求较高，而且需要剔除许多无用特征，增加运算量，无法满足实时性。所以，对人民币的冠字号定位，可以根据先验知识来研究[12]。由于本文研究的人民币的冠字号只位于左下角位置，所有对于右侧的冠字号，我们并不需要处理。根据先验知识，我们可以将处理的范围限定在人民币宽和高的这个左下角小区域内，有效的剔除了人民币的其他特征，如图2.3所示。图2.3人民币宽和高的左下角区域基于先验知识和投影的定位算法如下：缩小区域假设采集到的人民币高度为H，宽度为W，根据上面所述的先验知识，左小角小区域的高度，宽度,截取原始图像的（H1*2:H，1：W1）即可得到左小角小区域。将图像降维成二值化图像由于获取的原始图像为彩色图像（三维），我们需要将图像降维成灰度图像（二维），再处理成二值化图像，缩短运算时间。数学形态学处理二值化图像数学形态学是图像处理中的一个强有力工具，主要包括腐蚀、膨胀、开操作、闭操作等处理方式。腐蚀的实质是求局部最小值的操作，可用公式2.1表示，其中其中A表示待图像，B表示构造元素。（2.1）在处理图像的方面上来说，通过构造的结构元素与图像矩阵进行卷积，若构造元素完全覆盖图像点的领域则在该点赋值为1，反之不赋值.在二值化图像中，相当于黑色部分增加，白色部分减少，原理如图2.4所示，其中A表示待图像，B表示构造元素。图2.4形态学腐蚀处理原理图与腐蚀处理相反，膨胀操作对二值化图像来说是使白色部分增加，黑色部分减少，用公式2.2表示，其中A表示待图像，B表示构造元素。（2.2）膨胀的原理图如图2.5所示，其中A表示待图像，B表示构造元素。图2.5形态学膨胀处理原理图本文采用的形态学处理是腐蚀和闭操作（相当于先进行膨胀再进行腐蚀处理）。通过上面的确定小区域处理，我们发现由于采集图像时扫描的偏差，容易造成处理整张图片左侧边界或者右侧边界的缺失，导致在确定小区域时大量红色特征引入到图片中，如图2.6(a)所示，在进行形态学处理时带来了干扰。为了除去这些干扰，，构造2×2的矩形结构元素，采用形态学闭操作直接对二值化图像处理，即可消除右边引入的干扰，如图2.6(b)和2.6(c)所示。图2.6(a)有干扰左小图2.6(b)二值化图像图2.6(c)形态学闭操作角区域后的二值化图像由于二值化后背景是白色（像素值为255），冠字号是黑色，在接下来的投影算法中需要行列值像素的累加，所以我们先进行取反操作，使背景变为黑色，冠字号变为白色。为了能够使投影算法的像素累加连续，先对图像进行腐蚀，在通过构造25×25的矩形结构元素闭操作，进行聚类填充。由于冠字号下面的图标对投影结果有影响，再通过去除小像素操作将这些干扰去除，这一系列处理如图2.7(a)、2.7(b)、2.7(c)所示。图2.7(a)取反操作图2.7(b)聚类填充图2.7(c)移除小图标（4）投影算法水平投影和垂直投影是数字处理中的两种算法。设二值化图像为,那么它的水平投影和垂直投影分别由公式2.3和2.4表示，其中x,y为像素点的坐标，为该点的像素值，H1、W1分别为图像的高度和宽度，、分别为各行像素值累加和以及各列像素值累加和。水平投影：（2.3）垂直投影：（2.4）水平投影结果得到的是冠字号的上下边界，记上边界为,下边界为,垂直投影结果得到的是冠字号的左右边界，记左边界为，右边界为,所以得到的冠字号定位区域为（:,:）。图2.7(c)的行、列像素累加值如图2.8所示，从图中可以得出=100，=150，=60，=480。图2.8矩形填充区域的行、列像素灰度值累计（5）边界修正考虑到定位的边界正好是冠字号的边界，切割出的结果可能会造成一些冠字号的不完整，现将冠字号区域进行边界修正。上边界：=；下边界：；左边界：；右边界：。修正后冠字号如图2.9所示图2.9冠字号区域本文结合冠字号的性质，先将整张人民币处理成左下角的一小部分，再使用数字形态学处理去除掉了一些无关信息，最后基于水平和垂直投影法，有效的定位出冠字号区域。本算法耗时短、效果好，具有实时性和准确性。2.2冠字号区域的图像二值化图像分割技术实质就是将图像分成“前景”和“背景”，其中前景是我们想要的特征，通常将其处理成白色（像素为255），而背景是无用特征，通常将其处理成黑色（像素为0），通过图像分割技术我们可以有效的提取出研究的特征，这个处理过程通常也叫做图像二值化[13][14]。2.2.1图像分割技术图像分割技术在当今图像工程的发展过程中的有着重要的地位，应用广泛，为了满足需求，人们致力于研究新的理论来提高图像的质量[15]。近年来，出现了诸如人工神经网络、小波理论、分形理论等理论，这些理论的发展推动了图像分割技术的发展。虽然现在提出的分割算法种类繁多，但是边缘检测、阈值分割等经典算法依然占主流算法。2.2.2边缘检测算法（1）Sobel算子Sobel算子是边缘检测中最基本一阶差分算子，通过引入局部平均算法，可以求得图像对应点的梯度幅值和方向。Sobel算子的模板包括：横向模板，纵向模板，通过这两个3×3的矩阵与图像作卷积运算可近似得到图像的横向、纵向梯度值。用公式2.5和2.6表示，其中、分别表示图像在横向和纵向的边缘检测图像，为图像在该点的像素值。（2.5）（2.6）求出、后，根据公式2.7和2.8即可求出图像的梯度幅值和对应的方向，其中G代表梯度幅值，代表梯度方向。（2.7）（2.8）采用Sobel算子对冠字号区域进行边缘检测，如下图所示。图2.10Sobel算子处理冠字号效果图（2）Roberts算子Roberts算子是边缘检测处理中最简单的一个算子，精度较高，但是噪声对其影响很大。与Sobel算子一样，Roberts算子也采用两个模板，但是结构简单，是2×2的模板，其中横向模板为，纵向模板为,运算横向、纵向的边缘检测图像与公式2.5和2.6类似，这里写成差分的形式，如公式2.9和2.10所示。（2.9）（2.10）其中、分别表示图像在横向和纵向的边缘检测图像，为图像在该点的像素值。求出、后，可根据公式2.11求出梯度的幅值，其中表示该点的幅值。（2.11）采用Roberts算子对冠字号区域进行边缘检测，如下图所示。图2.11Roberts算子处理冠字号效果图LOG（Laplacian-Gauss）算子LOG算子与上述算子不同，它是一个二阶微分算子，形象一点的说，在一阶微分算子中，边缘是图像的极值点，而在二阶微分中，边缘是图像的极值之间的零点。LOG算子实质是一种改进的Laplacian算子，由于Laplacian算子抗干扰能力差，通过引入平滑滤波能够有效去除噪声带来的影响。LOG算子的模板为，扩展模板为。采用LOG算子对冠字号区域进行边缘检测，如下图所示。图2.12LOG算子处理冠字号效果图2.2.3阈值分割算法通常在使用阈值分割算法之前，需要将彩色的RGB图像转换为灰色图像，RGB之间的组合基本覆盖了我们人眼可识别的颜色范围。将RGB彩色图像转为灰度图像的公式如2.12所示。（2.12）其中代表像素点的位置，代表该点的灰度值（0-255），将彩色图像转为灰色图像不仅降低了内存的开销，也加快了运算的速度。通过选取一个恰当的阈值，运用公式2.13将灰度图像转为二值化图像，其中表示二值化点的像素值。（2.13）转换后的图像的像素值只有255（白色）和0（黑色），即实现了前景和背景的区分。根据对阈值T的不同约束，可将T分成三种类型：全局阈值、局部阈值和动态阈值[16]。全局阈值法只使用一个阈值对整张图片进行二值化，算法简单且区分效果好。局部阈值法与像素点的像素值和该点局部领域特征都有关，将整张图片划分成多个子区域，每个区域使用不同的阈值，该方法的效果比全局阈值明显，但是耗时长，且容易造成笔画断裂。动态阈值法不仅与上面的两个因素有关，还要考虑像素点的位置，即不仅要考虑当前像素点的信息，也要考虑周围像素点的信息，该算法区分效果最明显，但是算法复杂，不具有实时性。基于上文我们定位的冠字号区域的特点，采用全局阈值法能达到有效的区分，而且满足了实时性。我们对直方图阈值分割法、迭代阈值分割法、Otsu法这三种全局阈值法进行简单的介绍并进行测试比较，选择出适合冠字号区域的最优二值化算法。直方图阈值分割法通过直方图分析实现图像的分割即为直方图阈值分割法。一个典型的直方图如图2.13所示。阈值T阈值T图2.13典型的直方图和阈值T的选取上图中的横轴代表灰度级，纵轴代表该级出现的概率，该算法的主要依据是图像中的前景和背景对比度强，在图像灰度直方图中就会出现如图所示的两个波峰和一个波谷，在波谷处取得阈值，即可将目标和背景区分开来。直方图阈值法方法简单，容易实现，但是该算法对图像有一定的要求，就是形成的直方图必须有两个明显的波峰，阈值才可选取在波谷，在很多实际情况中直方图并没有两个波峰，或者是即使存在两个波峰，波谷也很平，这在选取阈值的过程中就显得十分困难，所以这个算法的局限性很大。经过对冠字号区域的直方图检测，设置的阈值为120，用此阈值进行二值化，效果如图2.14所示。图2.14直方图阈值分割法处理冠字号效果图迭代式阈值选择法迭代式阈值选择法采用多次重复迭代求得一个阈值T，再对图像进行二值化处理，具体算法如下：①图像的最大像素值和最小像素值的平均值作为初始阈值T0。（2.14）②大于阈值的确定为前景，而小于阈值的确定为背景，分别计算两个区域的灰度均值u1、u2。（2.15）③用u1、u2来计算新阈值T1。（2.16）④当T0和T1相等时，所求的T1为阈值，否则重复②~③步骤。迭代式阈值选择法是直方图阈值法的改进算法，在选择阈值时的效果比直方图阈值法好，但是该算法较直方图阈值法复杂，运算时间较长。图2.15是采用迭代式阈值选择法对冠字号区域进行二值化处理。图2.15迭代式阈值选择法处理冠字号效果图Otsu法Otsu法（即大津算法）是日本学者Otus于1979年提出的一种处理图像二值化的高效算法，运用广泛，具有良好的适应性[17]。主要思想是寻找最优的类间方差方差，进而取得最优阈值，具体算法如下：①假设原始图像的大小是M×N，像素值大于阈值的个数为N0,小于阈值的个数为N1，计算出前景占比和背景占比。（2.17）②计算前景的平均灰度u0和背景的平均灰度u1。（2.18）③计算区间的像素累加值u（2.19）④计算类间方差（2.20）⑤将（2.19）代入（2.20）得到的化简公式。（2.21）⑥通过遍历的方法，当求出使类间方差最大时的T，即为所求的最优阈值。Otus算法能够优化图像的细节，使细节更加明显，且自适应能力强，选取出的阈值能够有效的区分前景和背景，图2.16为采用Otsu算法对冠字号进行二值化处理的效果图。图2.16Otsu法对冠字号区域进行二值化处理结合三种全局阈值的算法，表2.1显示了三种算法对冠字号区域进行二值化处理的效果图。表2.1各类算法对冠字号区域的二值化处理效果图二值化算法二值化效果图直方图阈值分割法迭代式阈值选择法Otsu法从效果图的比较上来看，Otsu法处理冠字号区域的二值化效果最明显，每一位冠字号的笔画连贯，且粗细均匀，虽然在用时的层面上来说Otsu法的耗时最长，但是区分度并不大，结合实际图像的特点，直方图阈值分割法虽然算法简单且实时性好，但是并不是每张图片的直方图都能形成两个波峰，所以实际效果并不理想。迭代式阈值选择法虽然和Otsu法一样都具有一定的自适应性，但是在处理低分辨率和光照不均的图片时，迭代式阈值选择法的效果没有Otsu法那么好。综上所述，本文采用Otsu算法进行对冠字号的二值化处理。2.3冠字号区域的滤波处理2.3.1噪声的定义图像噪声是指位于图像数据中多余的、带有干扰性的信息，噪声的存在或多或少会影响图片的质量，在某些高精度的图像处理中，噪声的存在会严重影响处理的效果[18]。图像的噪声来源主要从两个方面，一是图片的采集过程，噪声源包括图像传感器的材质、环境、传感器内部构造等因素；二是图像信号的传输过程，当传输设备不完善或者某些输入环节不理想会引入各种噪声。本文中的噪声主要是人民币流通过程中所受到的污染，为了模拟实际过程中产生的噪声，本文对冠字号区域添加噪声密度为0.05的椒盐噪声，效果如图2.17所示。图2.17添加了椒盐噪声的冠字号区域2.3.2数字滤波处理数字滤波处理是将图像中的噪声等影响精确度的因素去除的过程，主要包括空间域滤波和频域滤波两方面[19]。通过模板构造直接对原图像进行卷积处理这个过程为空间域滤波，而先将图像进行傅里叶变换和反变换处理这个过程，即为频域滤波。空间域滤波和频域滤波各有优缺点，结合冠字号区域的特点和椒盐噪声的特点，本文采用空间域滤波对图像进行处理，常见的空间域滤波包括均值滤波、中值滤波、拉普拉斯滤波等等。均值滤波算法均值滤波是一种典型的线性滤波，用内值之和为1的奇数模板与图像进行卷积运算，并取均值结果代替原来点的像素值。如公式2.22所示，其中为像素点，为该点均值，为该点像素值，M为模板中像素的个数。（2.22）以3×3的均值滤波为例，3×3的均值滤波模板为，设原始图像的矩阵为，首先将3×3模板中心对准图像的（1,1），该点的像素值为1，点对点的进行运算，模板在矩阵外的点用0自动填充，求得（1,1）点的均值为，同理用3×3模板对原始图像的其余点遍历，求得均值滤波后的图像矩阵为。均值滤波算法实现简单，对噪声有良好的抑制效果，但是缺点也很明显，均值滤波会造成图像的模糊和细节的丢失。分别用3×3、5×5和7×7的均值滤波模板对添加了椒盐噪声的冠字号区域进行滤波，效果如表2.2所示。表2.2不同模板的均值滤波的滤波效果图均值滤波模板的大小滤波效果图3×35×57×7从上表可以看出，均值滤波总体对椒盐噪声的抑制效果不明显，且随着模板大小的增加，图像变得越来越模糊，丢失了许多细节，这并不利于接下来的图像处理，所以均值滤波并不适用于本课题。中值滤波器与均值滤波相反，中值滤波是非线性滤波，在滤波处理上运用十分广泛[20]。中值滤波的算法与均值滤波类似，主要思想是构造一个奇数模板，该模板为全1模板，通过模板与图像卷积运算，并将卷积结果排序并取中值来代替原来像素点的像素值。中值的定义如公式2.23所示，其中y为输出中值，x1~xn代表样本。(2.23)以3×3的中值滤波为例，3×3的中值滤波模板为，原始图像的矩阵依然选择，先将3×3模板的中心对准图像的（1,1），该点的像素值为1，点对点的进行运算，超出矩阵外的点用0自动填充，得到该点的样本为{1,2,4,5}，进行中值排序后，由于样本数为4，所以求得的中值为2和4的均值，即为3，同理用3×3模板对原始图像的其余点遍历，求得中值滤波后的图像矩阵为。分别用3×3、、5×5和7×7的中值滤波模板对添加了椒盐噪声的冠字号区域进行滤波，效果如表2.3所示。表2.3不同模板的中值滤波的滤波效果图中值滤波模板的大小滤波效果图3×35×57×7从上表中的效果图可以看出，采用3×3的中值滤波模板的滤波效果不佳，噪声依然存在，而采用7×7的中值滤波模板虽然能有效的抑制椒盐噪声，但是对原始图像的影响也较大，造成一些笔画连在一起，5×5的中值滤波的效果最佳，不仅有效的抑制了椒盐噪声，而且保留了冠字号的许多细节信息，因此在冠字号预处理中我们采用5×5的中值滤波对冠字号区域进行去噪处理。由于使用中值滤波后的图像的四个边角有黑点，为了去除黑点，我们使用数字形态学处理中的闭操作将黑点去除，最终采用5×5滤波的冠字号区域效果如图2.18所示。图2.185×5中值滤波效果图2.4本章小结本章介绍了人民币纸币冠字号预处理过程中的前三步处理。在冠字号定位部分，本文提出了一种基于先验知识和投影的定位能够有效的定位出位于人民币左下角的冠字号区域；在冠字号二值化部分，本文对比了3种全局阈值算法，经过比较分析选择了Otsu法对冠字号进行二值化；在冠字号滤波处理部分，本文对比了空间域滤波中的均值滤波和中值滤波，经过检测对比选择5×5的中值滤波对冠字号进行处理。3人民币冠字号的倾斜校正以及字符分割和归一化由于人民币本身存在折痕，以及扫描仪采集角度等原因，采集到的人民币图像并不是完全摆正的，会有一定的倾斜角，因此冠字号区域也会受到影响，导致了冠字号出现字符倾斜、大小不一，因此我们有必要对冠字号进行倾斜校正。由于我们采用基于支持向量机进行识别，因此需要切割冠字号，使之成为单字符。对单字符进行归一化处理，使其具有相同的大小，以便后期的识别准确高效。3.1冠字号区域的倾斜校正由于采集过程中的操作不当以及纸币本身的褶皱，我们发现采集到的一些冠字号的字符大小和高度不一，这对接下来的字符分割处理造成了一定的影响，带来误差。为了消除倾斜角度带来的影响，本文采用Hough变换检测冠字号的倾斜角，并依据倾斜角度对冠字号进行倾斜校正[21]。Hough变换的基本思想是利用点与线的对偶性，将原图像空间中的每个边缘点转换成极坐标系下的正弦曲线，通过这样的映射关系，就把检测出原图像中的直线，并得到直线的表达式，进而可以校正原图像。假设空间中的直线的斜率为k，截距为b，直线的表达式如式3.1所示。（3.1）当直线与x轴垂直，斜率k为无穷大，这对我们的表达带来了不便，为了更好地计算，改用表达式3.2来表示直线方程。（3.2）其中表示(x,y)到原点的距离，表示过点(x,y)和原点的直线与x轴之间的夹角。公式3.2已将点(x,y)映射到空间，上式表明，直角坐标系下的直线映射到极坐标系下为一个点，关系如图3.1所示。图3.1Hough变换通过上图可知：左侧直角坐标系下的蓝色直线就相当于右侧极坐标系下的黑色点，反之，直角坐标系下的一个点相当于极坐标系下的一条正弦曲线。倾斜校正具体算法如下：①通过边缘检测，找出图像可能存在的边缘点。②对所有边缘点进行Hough变换。③检测极坐标系下的交点，由于Hough变换实质是一个投票过程，每个交点的值累加，投票结果最大者认为是期望，所以正弦曲线相交次数最多的那个点即是值最大的交点。④极坐标下的点对应直角坐标系下的直线，重合最多的点对应图像中的直线。⑤获取了冠字号的直线即可得出倾斜角度，对图像进行旋转处理就实现了倾斜校正的目的。图3.2显示了采用Hough变换的倾斜校正效果。倾斜校正前的冠字号(b)倾斜校正后的冠字号图3.2采用Hough变换的倾斜校正3.2冠字号的字符分割冠字号字符分割即把连续的冠字号上的英文字母和阿拉伯数字切割成10个单个字符，并将这些字符贴上标签作为后期识别过程所需要的训练集和测试集，所以字符分割的好坏直接影响了后期识别的准确率，是识别的基础。做字符切割，需要获取的是单个字符的左右边界，无需上下边界，将单个字符切割出来，需要切割的大小刚好合适，过大会带来无用的干扰，过小又会丢失有用的信息，最重要的是，在处理切割算法时必须要保证切割的字符图像完整，以免影响识别[22][23]。3.2.1区域连通法区域连通法通过区域生长提取出包括初始点的图像全部连通域。通过第一章的分析我们知道，冠字号是由英文大写字母和阿拉伯数字组成，基本都可以由一笔写成，即可分割出一个连通分量，连通分量以外的图像我们可以当做噪声去除。区域连通法对去除噪声的要求较高，若噪声去除不明显容易造成字符之间的黏连现象，导致单个字符无法正确的提取出来，且该算法耗时长，不满足实时性。3.2.2先验知识法由于冠字号都为标准的印刷字体，规格统一，字符之间的间距也有严格的标准，冠字号矩形区域的大小规格一般为28mm×3.5mm，每个冠字号的宽为2mm，高为3.5mm，字符之间的间距为1.5mm。先验知识法的基本思想正是基于冠字号的大小规格固定所提出的，根据冠字号定位的结果，估算出单个字符的宽度和字符之间的间距，逐个分割出字符。先验知识法分割的准确率很大程度上取决于冠字号的定位结果，由于该算法的分割点是由人为估算设定的，因此精度不高，而且先验知识法的适应性差，容易造成分割错误。3.2.3基于垂直投影的字符分割法垂直投影投影法是运用十分广泛的算法，该算法不仅可以运用在冠字号区域的定位，也可以运用在冠字号的字符分割上，由于冠字号的单个字符大小规范且字与字之间的间隔固定，采用垂直投影法简单，切割的效果也非常好。垂直投影法的主要思想是扫描冠字号区域的每一列，并计算出每一列的像素值，即得到冠字号的垂直投影图。在二值化图像中，白色代表像素255，黑色代表像素0，而二值化后的冠字号数字和字母是黑色，背景是白色，因为需要累加每列的像素值，所以在进行垂直投影前需要将图像求补，即冠字号为白色，背景为黑色。求补后的图像运用垂直投影算法，逐列扫描并进行列的像素累加，为了再次抑制噪声的影响，我们对图像采用平滑处理，效果如图3.3所示。(a)求补后的冠字号图像(b)冠字号的垂直投影图图3.3冠字号的垂直投影效果图在进行垂直投影后，计算出投影结果的像素最大值和最小值，并设置切割阈值为。MATLAB中的findpeaks函数为寻找波峰函数，通过像素最大值减去每列的像素值即可以实现寻找波谷，图中绿色的点为寻找到的波谷位置，一共9个点，代表着10位数冠字号的9个间隙。通过阈值调整绿色波谷点的位置，对图像进行切割，即可实现将冠字号分割成单字符，如图3.4所示。图3.4切割成单字符的冠字号基于垂直投影的字符分割法算法简单，响应速度快，有较好的自适应性，分割的效果好。3.3冠字号的字符归一化冠字号归一化是预处理中的最后一个环节，从冠字号的字符分割效果图可以看出，每个字符的大小会存在差异，这对我们接下来的识别带来了一定的影响。所谓的归一化，就是将大小不同的单个字符转成大小相等的单个字符，归一化算法有两种：线性归一化和非线性归一化。线性归一化是将原有的图片按线性缩放成规定的图片大小，该算法简单，耗时短，但是该算法不考虑字符笔画的粗细问题，容易造成字符变形；非线性归一化是基于字符笔画粗细的一种改进算法，在字符笔画粗的地方进行放大，在字符笔画细的地方进行缩小，该算法就解决了字符的变形问题，但是算法复杂，耗时长。结合冠字号是标准印刷体这个性质，本文采用线性归一化算法，将分割好的单字符归一化成28×28的像素矩阵，效果如图3.5所示。图3.5归一化后的冠字号本文采集的人民币图像一共1641张，均是用扫描仪扫描出的图像，按照训练集和测试集大约8:2的比例，随机将1397张人民币作为训练集，244张人民币作为测试集，经过一系列预处理得到冠字号的单个字符，并贴好标签放在对应的文件夹下，效果如图3.6所示。图3.6归一化字符分类3.4本章小结本章介绍了人民币冠字号识别预处理的后三步处理。在倾斜校正部分，本文介绍了Hough变换的算法原理并采用Hough变换作为本课题倾斜校正算法。在单字符分割部分，本文对比了几种常用的字符分割算法，经过对比分析选择了基于垂直投影的单字符分割算法进行分割，效果良好。在字符归一化处理部分，本文结合人民币冠字号是标准印刷体的特性，采用线性归一化处理实现了每个字符的归一化，并将处理好的字符贴上标签作为识别的训练集和测试集。本文的冠字号预处理效果良好，对接下来的冠字号识别打下坚实的基础。4人民币冠字号的字符识别经过前期的预处理，我们得到了贴好标签的训练集和测试集，在进行冠字号识别之前，我们需要提取出字符的特征，以便输入到分类器中训练出模型。字符识别作为人民币纸币冠字号识别算法的最后一步，也是最为关键复杂的一步，一个分类器的优劣直接影响到识别的准确率和速度，对分类器的研究是本文的重点。4.1冠字号的特征提取特征提取是进行字符识别之前的必要步骤，是对预处理后的数据进行分析、提取关键信息的过程[25]。特征提取有许多方法，比如HOG特征提取、LBP特征提取、Haar特征提取等等，基于人民币冠字号为大写英文字母和阿拉伯数字的特点，本文特征提取采用HOG算法。HOG（HistogramofOrientedGradient）算法[26]，即梯度直方图算法，是法国人Dalal于2005年提出，在图像的特征提取运用得非常广泛，基于HOG特征提取和SVM（SupportVectorMachine）结合的算法在许多领域都取得了巨大的成功，HOG+SVM的思想已经成为现在识别的主流思想。HOG特征提取的具体算法如下：①对原始图形进行灰度处理并进行归一化。②HOG特征提取的主要思想就是进行梯度运算，分别使用横向模板和纵向模板对图像进行卷积运算得到水平梯度值和垂直梯度值，公式如4.1所示。其中(x,y)为当前的像素点，为像素值，为水平方向的梯度，为垂直方向的梯度。（4.1）③求得水平方向的梯度和垂直方向的梯度后，通过公式4.2和4.3可以分别计算出图像的梯度幅值G和梯度方向。（4.2）（4.3）④定义窗口大小WinSize、块大小BlockSize、块滑动步长BlockStride和元胞大小CellSize。元胞是小像素点之间的组合，通常元胞大小定义为8×8，即每8×8个像素点组成一个元胞。块是元胞的上一级，通常块的大小定义为2×2个元胞，即一个块中包含4个元胞，以2×2的方阵排列，所以块的大小也可以说是16×16。窗口是块的上一级，通常大小设置成64×128，图像扫描的原理是基于块在窗口内滑动，滑动步长通常设置为8个像素，即块每滑动一次走过了8个像素，元胞、块、窗口、图像的关系如图4.1所示。(a)元胞与块的关系(b)块与窗口的关系(c)窗口与图像的关系图4.1元胞、块、窗口、图像之间的关系图⑤定义梯度方向数bins。梯度方向数表示一个元胞中统计梯度方向的数目，也叫做特征向量，通常定义的梯度方向数为9，即一个元胞统计9个方向的梯度直方图，每个梯度代表的方向为度，如图4.2所示。图4.2梯度方向分类图⑥将图像扫描的结果反映在直方图上面，值得注意的是，某点梯度某方向上的幅值是多少，在对应的直方图上该方向所加的值为幅值的值。通过计算机计算样本的HOG特征向量，以上面定义的大小为例，样本的特征向量为3780维，最终将这3780维特征向量输入到分类器做训练。在预处理中，本文已经将冠字号进行了二值化和归一化，考虑到归一化的图像大小为28×28，在基于响应速度和准确率的权衡上，本文设置元胞的大小为8×8，梯度方向数为9，该设置提取的字符特征效果较优，具有实时性，效果图如4.3所示。图4.3对字符进行HOG特征提取4.2冠字号的字符识别经过HOG特征提取，得到了冠字号字母和阿拉伯数字对应的特征，输入到分类器即可训练出模型进行冠字号的识别。常用的字符识别方法有很多，比如模板匹配识别、人工神经网络识别、支持向量机识别等等，不同的识别方法有不同的优缺点，运用的场景也不尽相同，下文对这些方法进行详细的介绍。4.2.1模板匹配识别模板匹配法是最基本、最原始的识别方法，该算法的基本思想是每个字符都有一个对应的模板，模板一一在原图像上进行滑动，相当于扫描过程，过程结束后计算模板与原图像的匹配度，匹配度最大的模板所代表的字符就是识别的结果。该算法在处理相似字符是的表现不尽人意，比如冠字号中的0和O、1和I、S和5、B和8等等，容易造成误判，准确率不高，并且局限性较大，不能处理有一定倾斜角的字符。结合冠字号的特点，组成的元素有25个英文大写字母（除了V）和10个阿拉伯数字，需要的模板较少，计算量也较小，模板匹配法在进行冠字号识别也有一定的研究意义。设待识别的图像为S，模板为T，大小为m×n，模板T在待识别图像S上滑动，被覆盖的区域叫做子图，i、j代表子图左下角的坐标，如图4.4所示。图4.4被搜索图S和模板T相似性由以下公式衡量：（4.4）将其归一化，得到模板匹配相关系数，公式如下：（4.5）当时，代表着相关度最大，即待识别字符与该模板完全匹配，S全部扫描后，最大值对应的子图即位匹配目标。公式4.5结构复杂，使用该公式进行模板匹配响应时间慢，因此使用另一种算法来衡量T和的相似性，公式如下：（4.6）公式4.6计算了两个图像的误差，当误差最小时即为最佳匹配对象。与公式4.5相比，该公式没有采用平方、开根号运算，取而代之的是绝对值差运算，算法简便。4.2.2人工神经网络识别人工神经网络(ArtificialNeuralNetwork，即ANN），也称为神经网络，一直以来都是人工智能研究的重点，在近年来的应用十分广泛[27][28]。常识告诉我们，人脑是由大量的神经元构成，而人工神经网络正是模拟人脑的结构，通过不同神经元网络的搭建来模拟人脑进行识别。神经网络由大量神经元连接形成，不同层的神经元之间存在连接权重，单层所有神经元权重与输入之积经过积激活函数输出到下一层，最终输出因上述因素的不同而不同。图4.5显示了单个神经元的结构。图4.5神经元的结构单层感知网络作为最初的神经网络，具有结构简单、计算量小等优点，但是随着问题的深入，发现单层神经网络无法解决非线性问题，使在具体应用上受到了很大的限制。20世纪80年代，误差反向传播算法(ErrorBackPropagationTraining),简称BP算法的提出，通过反向传播思想解决了单层网络无法解决的非线性问题，在现在的识别领域运用广泛[29]。图4.6典型BP神经网络结构图BP神经网络包括正、反向传播两个过程。正向传播过程是输入信号从输入层输入，经过中间层的处理，最终到输出层得到结果。若结果达不到预期，就会引入反向传播过程，该过程将输出层的误差信号反向传回中间层，在所有的中间层调节神经元之间的连接权重，通过这种方式使得输出结果逼近预期。公式4.7表示正向传播过程，其中表示第层第j个神经元的激活输出，激活函数用表示，表示从层的的第k个神经元指向层的第j个神经元之间的连接权重,表示层第j个神经元的偏移量。（4.7）为了便于表达，第层第j个神经元的线性结果我们用变量表示，公式如4.8所示，因此简化公式可以写成4.9的形式。（4.8）（4.9）反向传播算法的原理是基于梯度下降法，反向传播公式总共有4条，如下所示。输出层误差：（4.10）其中L代表输出层所在的层数。中间层误差：（4.11）参数变化率：（4.12）参数更新规则：（4.13）人工神经网络是新兴的算法，具有自学习性和适应性，且能够处理非线性问题，通过神经元之间的权重实现了存储功能，在各行各业的运用都很广泛，但是不可否认，人工神经网络也有劣势，比如在其学习速度慢，一个简单的问题可能需要迭代上千次才能结得结果，此外，在中间层层数的选择上和神经元个数的安排上并没有一个具体的理论指导，完全凭借试凑和经验选择，基于以上原因，本文并未采用神经网络识别。4.2.3支持向量机识别支持向量机[30][31]（SupportVectorMachine，即SVM）是一种典型的二分类模型，与传统的分类器不同，SVM分类器在实现经验风险最小化的基础上，还要求置信范围尽可能小，也就是说最终目的是寻找结构风险最小化。通俗的来说，SVM二分类本质就是通过在特征空间内寻找间距最大的超平面将数据划分为两类，以实现区分。SVM于1964年提出，该算法能够有效处理非线性问题，泛化能力强，具有鲁棒性，至今依然是解决一些非线性问题的首选方法，其中HOG+SVM的特征提取识别组合成了许多识别问题的主要思想，下面介绍SVM的基本算法。假设给定训练样本，在一个样本空间内的划分超平面有无数个，如图4.7所示。图4.7样本空间存在无数个划分样本的超平面虽然划分样本的超平面很多，但是最优超平面只有一个，正如图4.7的粗线所示。由于数据噪声等因素的影响，可能导致图中的正例向下偏移，而负例向上偏移，这就导致了一些超平面的划分出现了错误，图中粗线所在的超平面能够有效的避免这个问题，因此它的泛化能力最强，抗干扰能力最好，求解出这个超平面正是SVM算法的目的。通常我们定义样本空间的超平面如下面公式：（4.14）其中、x均是n维列向量，代表法向量，x为样本，b是偏移量，因为样本是固定给出的，是定值，显然需要求解超平面的变量是和b。我们将超平面定义为（,b），那么样本空间内的任意点到超平面（,b）的距离为：（4.14）其中代表的是的第二范数。假设超平面（,b）能够正确的划分样本，可以用如下的公式定义样本的属于类：（4.15）公式4.15表明，对于样本，若，则；反之，若，。当样本点能够取得等号成立时，我们将这些点定义成“支持向量”。我们将两类支持向量到超平面之间的距离定义为“间隔”，公式如4.16所示，图4.8将这些定义标注。（4.16）图4.8支持向量与间隔图例要找到最大间隔的划分超平面前提下，必须满足一定约束，即：（4.17）为了求得最大间隔，等价于求||||的最小值，为了后面的求导运算的简便，将公式4.17重写：（4.18）式4.18也叫做凸二次规划问题，为了求解，引入拉格朗日乘子，该问题的拉格朗日函数就可以写成：（4.19）分别对系数、b、求导令其等于零，最终将模型化成如下的形式：（4.20）通过拉格朗日乘子法，把转变成了，减少了约束条件数，使求解方程变得简单。上述求解过程严格满足KKT（Karush-Kuhn-Tucker）条件：（4.21）为了求解上述的对偶二次规划问题，我们采用SMO（SequentialMinimalOptimizaion）算法，与传统的算法相比，SMO算法将优化问题继续细分，划分后的优化问题比未划分的问题求解简单，也就加快了求解的速度。SMO算法的解法主要有8个步骤：计算误差：（4.22）计算上下边界L和H，其中代表松弛变量：（4.23）计算学习率：（4.24）更新：（4.25）根据取值范围修剪：（4.26）更新：（4.27）更新：（4.28）根据更新b：（4.29）上述介绍的SVM是典型的线性SVM，在实际情况中，大多数样本并不是线性可分的，如果依然用上述的方法处理非线性样本，将会进入死循环，无解。处理非线性，一种方法是将SVM分类器的维度提升，通过映射关系，低维的线性不可分问题转到高维就变成了线性可分问题，但是提升维度的方法对造成运算复杂化；另一种方法，也是SVM处理非线性问题最常用的方法，就是采用核技巧，引入核函数，该算法不需要处理样本空间的维度，引入核函数即可实现从不可分问题变成可分问题，计算结果与高维映射一样，如图4.9所示，常用的几种核函数如表4.1所示。非线性问题求得的划分超平面(b)高维空间实现线性可分图4.9引入核函数实现非线性的可分表4.1几种常用的核函数及其表达式核函数名称表达式线性核k多项式核k高斯核k径向核k将非线性不可分问题通过转成转成可分问题，虽然在理想的情况SVM可以做出完全正确的分类，但是实际情况中会有个别样本“越界”，如图4.10所示。一些正例样本越界到超平面的下方，被分类成负例；而一些负例样本越界到超平面的上方，被分类成正例，导致了分类错误。上文介绍的分类器采用的是“硬间隔”的分类方法，即硬性要求所有样本点都满足公式4.15，采用这种方法很容易造成整个规划问题的无解，因此我们引入“软间隔”的概念。图4.10某些不受约束条件的样本示意图软间隔的实质是引入了松弛变量到式4.18的约束条件，使可以间隔小于1，引入了松弛变量，SVM在进行分类时会自动放弃对如上图所示的离群点（红色的点）的分类，对离群点的重视程度，我们引入一个新的设置常量：惩罚因子C，C设置得越大代表着越重视离群点。最终优化问题转成：（4.30）SVM算法是典型的二分类算法，通过一个超平面将样本划分成正例和负例实现区分，人民币冠字号识别不是简单的两类样本问题，冠字号总共包括25位英文大写字母（除了V）和10位阿拉伯数字，是一个35类的多分类问题，下文介绍SVM的多分类算法。4.3基于SVM的冠字号的识别SVM的多分类算法分为直接法和间接法。直接法即在一个优化问题中一次实现多分类，如图4.11所示。图4.11SVM多分类算法的直接法原理图如上图所示，直接法用多个超平面将样本空间划分成多个区域，每个区域代表一个类别，实现分类。该算法对运算量的要求非常大，该算法并没有在实际中采用。间接法主要有两种，一种是一对多法，另一种是一对一法。两种算法是实际运用中视具体情况使用。一对多法一对多法（one-versus-rest），也称为OVR支持向量机算法[32]，该算法将一个样本归为一类，剩余的样本归为另一类，测试结果有总共k个，取其中的最大值为分类结果。一对多法训练的分类器少，训练速度快，但是容易出现数据集偏斜的问题，且有新类引入，需要重新训练模型。根据人民币冠字号识别为35类多分类问题，可构造35类分类器实现冠字号的识别，该算法在实际工程中有一定的意义。一对一法一对一法（one-versus-one），也称为OVO支持向量机算法，该算法是基于投票的思想，两两样本之间都构造一个SVM分类器，这样k个样本就需要构造个SVM分类器，测试时把测试向量放入个分类器中进行分类，结果在对应的输出SVM投票，最终投票数多的为分类结果。以A、B、C三类举例，需要构造3个SVM分类器，分别是A和B；A和C；B和C。初始时输出分类器A=B=C=0，以A做测试，将A的特征向量输入到A,B分类器，A为正例，输出分类器A+1；将A的特征向量输入到A,C分类器，A为正例，输出分类器A+1；将A的特征向量输入到B,C分类器，假设B为正例，输出分类器B+1。最终输出分类器的结果为A=2，B=1，C=0，分类器A的票数最高，所以识别结果为A。一对一法的识别速度快，准确率高，但是当样本数过多时，的SVM分类器的成本很大，训练时间慢。结合人民币冠字号是一个35类多分类问题，样本数目只有35个并不算多，本文采用的是一对一的SVM多分类算法进行冠字号的识别。在人民币冠字号的预处理中，已经将分割成单字符的冠字号贴上标签并分好类，其中1397张人民币作为训练集，分割成单字符即13970个样本提取特征向量输入到SVM进行训练，本文使用MATLAB仿真工具，调用了fitcecoc函数，训练出的模型采用10倍的交叉验证来验证模型，求解出的泛化误差为0.0076，表示该模型有很好的分类效果。将贴好标签的单个字符样本测试集，经过HOG特征提取输入到SVM模型中进行识别，测试结果如下表所示：表4.2冠字号识别结果表样本识别数量识别单个样本的平均速度识别正确个数正确率单个字符24400.68s241498.93%冠字号2446.8s20885.25%测试结果表明，本文采用基于SVM的一对一多分类算法，处理人民币冠字号单个字符的准确率高达98.93%，处理完整的10位数冠字号序列的准确率为85.25%，达到了预期的效果，本算法的响应速率较快，平均识别一张人民币的冠字号时间为6.8秒，满足了实时性的要求。出于某些原因，本算法存在一定的错误率，一些相似的字母和数字，比如“I”和“1”，“0”、“O”和“Q”，“5”和“S”，“C”和“G”等识别容易造成误分，对精确度有一定的影响。图4.11MATLAB仿真结果4.4本章小结本章详细介绍了人民币纸币冠字号识别过程中的字符识别部分，该部分也是整个识别算法的核心，直接决定了冠字号识别的准确率。在字符提取部分，本文详细介绍了HOG特征提取的算法，并采用该算法对冠字号字符进行特征提取。在字符识别部分，本文详细介绍了模板匹配识别、人工神经网络识别和SVM识别三种主要的识别算法，并进行比较，最终结合人民币冠字号的特点采用了基于SVM的一对一多类识别，该算法在识别单个字符的准确率达到98.93%，识别冠字号准确率达到85.25%，均达到了预期效果，且该算法识别冠字号的平均时间为6.8秒，满足实时性。结论随着科技的发展，利用计算机技术对人民币纸币的冠字号识别是模式识别的一个重要领域，该技术对维护市场稳定、打击经济犯罪有着重要的意义。本文这个大背景下，针对2005版和2015版的人民币，提出了一种基于SVM的人民币纸币冠字号识别算法，实验结果表明，该算法有一定的应用前景。本文主要研究的内容如下：研究了人民币冠字号的定位、二值化和滤波算法。基于冠字号的特点，本文提出了一种基于先验知识和投影的定位算法，该算法运算时间短，准确率高，能够有效的定位出冠字号区域。为了减少后期的运算时间，经过对比分析采用Otsu法对冠字号区域进行二值化处理。由于图片传输过程会在图像中引入噪声，本文采用5×5的中值滤波对图像进行滤波处理，有效抑制噪声的影响。研究了人民币冠字号的倾斜校正、单字符分割和字符归一化算法。由于采集的图像存在一定的倾斜角，本文采用Hough变换对图像进行倾斜校正。在归一化处理部分，本文采用与定位算法一样的垂直投影的算法，对冠字号进行字符分割，接着使用线性归一化算法对字符进行归一化处理，为识别部分打下基础。研究分析了现有的特征提取算法和识别算法，采用了HOG+SVM的组合算法对冠字号进行多分类识别，识别结果显示，本算法对单个字符的识别率到达98.93%，识别冠字号准确率达到85.25%，且响应速度较快，具有一定的现实意义。本文对人民币纸币冠字号识别过程始终在计算机上仿真完成，由于时间、能力有限，论文依然有许多不足，具体如下：冠字号的定位算法要求采集的人民币完整，若不完整可能造成定位的错误，今后需结合冠字号的性质研究适应性更强的算法。识别过程依然不能完全区分相似字符，比如“I”和“1”，“0”、“O”和“Q”，“5”和“S”，“C”和“G”等，识别的准确率有待提高，今后需研究更有效的特征提取算法区分这些相似字符。参考文献[1] 邹平.人民币发展史:五套人民币的历史[J].中国防伪报道,2015(08):38-42.[2] 钱海飞.新版百元人民币防伪性能提升[J].人民公安,2016(Z1):23.[3] 徐全发.紫金冠字号跟踪系统在商业银行反假币中的应用和推广[J].中国金融电脑,20

人人文库> 全部分类> 毕业设计 > 任务书类

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人民币纸币冠字号识别

文档简介

温馨提示

最新文档

评论

人民币纸币冠字号识别

文档简介

温馨提示

最新文档

评论

相关文档