




已阅读5页,还剩66页未读, 继续免费阅读
(计算机应用技术专业论文)基于改进主成分分析和神经网络的美元识别研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着我国加入w t 0 ,银行与国际金融的接轨,外汇存兑尤其是 美元柜台交易业务已成为各银行必须的业务。然而美元鉴伪机具很 少,可以信赖的美元鉴伪机具更是微乎其微。再加上造假者猖獗,这 从一个侧面折射出目前所应用的技术尚待进一步完善,另一方面也反 映出美元鉴伪研究课题具有理论与实际双重挑战性。 本文在充分学习了美元识别的国内外研究现状和研究方法之后, 分析了美元真伪币的特征,选用有效的传感器获取美元有用的隐性特 征,并针对美元的特征提取和识别进行了一些的探讨,提出了一种基 于改进主成分分析( i p c a ) 和改进学习矢量量化( i m l v q ) 牢o 经网络的 美元识别方法。 在特征提取阶段,针对广泛用于美元特征提取的主成分分析技术 ( p c a ) 存在计算复杂,不能准确估计训练图像的协方差矩阵以及没 有考虑区分样本真伪的分类特征等的问题,提出了i p c a 特征提取算 法。该方法首先把训练图像的右奇异向量作为p c a 求解的图像子空 间的基向量,避免了将图像阵列转换成图像向量,明显降低了计算复 杂性;然后利用p c a 本身所固有的能量聚集特性和l a p l a c i a n 矩阵的 特性,最大程度上提取了样本的真伪特征信息。 在分类器设计阶段,通过阅读大量文献和书籍,指出了广泛用于 美元识别的l v q 神经网络方法及其各种改进模型的不足,并提出了 i m l v q 神经网络识别算法。该算法不仅从理论上有效克服传统l v q 算法的对初值敏感,泛化能力差的问题,而且具有更好的学习能力。 针对建立的模型,进行了m a t l a b 仿真和c + + 程序设计,并对 实验结果进行了比较和分析。实验结果表明:本文算法获得了很好的 识别效果,从而表明了本文算法在美元识别中具有一定的优势。 识别 关键词改进主成分分析;改进学习矢量量化;特征提取;美元 a bs t r a c t w i t hc h i n a sa c c e s s i o nt ot h ew t 0a n dc o n n e c t i o no fb a n k i n ga n d i n t e r n a t i o n a lf i n a n c es e r v i c ei n d u s t r y ,f o r e i g nd e p o s i ta n de x c h a n g e ,i n p a r t i c u l a rt h ed o l l a rc o u n t e rt r a d i n gb u s i n e s s ,h a v eb e c o m ei n d i s p e n s a b l e h o w e v e r ,t h en u m b e ro fd o l l a rc h e c k i n gd e v i c e si ss m a l l ,a n dt h er e l i a b l e o n e sa r ee v e nl e s s i na d d i t i o n ,t h ec o u n t e r f e i t e r sa r em o r ea n dm o r e r a m p a n t ,s ot h ec u r r e n tt e c h n i q u e sn e e dt ob ei m p r o v e du r g e n t l y ,a n dt h e d o l l a r s c h e c k i n gr e s e a r c hh a st h ed u a lc h a l l e n g i n go f t h e o r ya n dp r a c t i c e a f t e rs t u d y i n gt h ec u r r e n ts i t u m i o na n dr e s e a r c hm e t h o d sa th o m e a n da b r o a d ,d o l l a r s f e a t u r e sw e r ea n a l y z e da n de f f e c t i v es e n s o r sw e r e c h o s e nt oo b t a i nu s e f u lh i d d e nf e a t u r e s t h e n ,a f t e rm a k i n gp r e l i m i n a r y i n v e s t i g a t i o n sa n dd i s c u s s i o n so nt h ef e a t u r ee x t r a c t i o na n da r t i f i c i a l n e u r a l n e t w o r k s ,t h e d o l l a r r e c o g n i t i o n m e t h o db a s e do n i m p r o v e d p r i n c i p l ec o m p o n e n ta n a l y s i s ( i p c a ) a n di m p r o v a b l ym o d i f i e dl e a r n i n g v e c t o rq u a n t i z a t i o n ( i m l v q ) n e u r a ln e t w o r k sw a sp r o p o s e d i nt h ep r o c e s so fe x t r a c t i n gf e a t u r e s ,t h ep r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) ,w h i c hw a sw i d e l yu s e di nt h ed o l l a r sf e a t u r ee x t r a c t i o n ,f a c e dt h e p r o b l e mo fh i g hc o m p u t a t i o nc o m p l e x i t y ,i n a c c u r a t ee s t i m a t e dc o v a f i a n c e m a t r i xf r o mt r a i n i n gi m a g e sf o rd o l l a rr e c o g n i t i o na n dn o tc o n s i d e r i n gt h e c l a s s i f i e di n f o r m a t i o nf o rd o ll a r s c h e c k i n g s ot h ei m p r o v e dp r i n c i p a l c o m p o n e n ta n a l y s i s ( i p c a ) w a sp r o p o s e d i nt h ea l g o r i t h m ,t h es u b s p a c e b a s i cv e c t o re x t r a c t e db yp c aw a ss u b s t i t u t e db yt h er i g h ts i n g u l a rv e c t o r s o ft r a i n i n gi m a g e s ,s ot h a tt h et r a n s f o r m a t i o nf r o mt h ei m a g e st oi m a g e v e c t o r sw a sa v o i d e d h e n c et h ec o m p u t a t i o nw a ss i m p l i f i e ds i g n i f i c a n t l y t h e n ,a f t e rm a k i n gu s eo ft h ee n e r g y c o m p a c t i o np r o p e r t yo fp c aa n dt h e p r o p e r t yo fl a p l a c i a nm a t r i x ,t h ea l g o r i t h ma l m o s te x t r a c t e dt h ed o l l a r s c h e c k i n gi n f o r m a t i o no f t h et r a i n i n gs e t i nt h ep r o c e s so fd e s i g n i n gc l a s s i f i e r ,t h ef a u l t so fl e a r n i n gv e c t o r q u a n t i z a t i o nn e u r a ln e t w o r k sa n di t si m p r o v e dm o d e l s ,w h i c hw e r ew i d e l y u s e di nt h ed o l l a ri d e n t i f i c a t i o n ,w e r ep o i n t e do u ta f t e re x t e n s i v er e a d i n g o f p a p e r s a n db o o k s i m p r o v a b l y m o d i f i e d q u a n t i z a t i o n ( i m l v q ) n e u r a ln e t w o r k i d e n t i f i c a t i o n l e a r n i n g v e c t o r a l g o r i t h m s w a s p r o p o s e d i tc o u l de f f e c t i v e l yo v e r c o m et h et r a d i t i o n a ll v qa l g o r i t h m s s e n s a t i o nt ot h ei n i t i a lv a l u e sa n di m p r o v ei t sg e n e r a l i z a t i o na b i l i t y ,a n d a l s oh a db e t t e ra b i l i t yo fl e a r n i n g m a t l a bs i m u l a t i o na n dc + + p r o g r a md e s i g nw e r em a d et oc o m p a r e a n da n a l y z er e s u l t so ft h i sk i n do fm o d e l t h ee x p e r i m e n ti n d i c a t e dt h a t t h i sp a p e r sa l g o r i t h mg a i n e db e r e ro u t c o m e s ;t h e r e b y ,i ts h o w e dt h a tt h e a l g o r i t h mh a da d v a n t a g eo nd o l l a ri d e n t i f i c a t i o n k e yw o r d s i m p r o v e dp r i n c i p l ec o m p o n e n ta n a l y s i s ,i m p r o v a b l y m o d i f i e d l e a r n i n g v e c t o r q u a n t i z a t i o n ,f e a t u r e e x t r a c t i o n ,d o l l a r i d e n t i f i c a t i o n i i i 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共 同工作的同志对本研究所作的贡献均己在论文中作了明确的说明。 作者签名:龟哈熟 嗍砂0 7 年,月7 彦同 关于学位论文使用授权说明 本人了解中南大学有关保留、使用学位论文的规定,即:学校有 权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允 许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科 学技术信息研究所将本学位论文收录到中国学位论文全文数据库, 并通过网络向社会公众提供信息服务。 作者签名:碰、导师签名:二缒日期:洳勺年f 月,f 日 硕+ 学位论文 第一章绪论 第一章绪论 货币识别问题本质上是模式识别问题,也就是将不同面值的货币区分开来的 多值分类问题,同时也是将真伪货币区分开来的二值分类问题。货币鉴伪技术分 为公众鉴伪、专业鉴伪与专家鉴伪三个层次。公众鉴伪面向大众,主要检查货币 的显性特征,通过手摸眼看耳听判别货币的真伪,是低层次的鉴伪手段;专家鉴 伪是由掌握核心机密的货币发行国的少数银行专家借助复杂精密的特制仪器判断 货币的真伪,主要判别货币的隐性特征,用于最终裁定某张高难度钞票的真伪, 是较少使用的最高级鉴伪手段。专业鉴伪是由专用的嵌入式金融机通过专业检测 手段检测货币的显性和隐性特征,由嵌入式金融机具( 如银行用的点钞机、清分 机、检伪仪、自助服务用的纸币识别接收器) 自动判别出货币面额和真伪,是最 主流最常用的高级鉴伪手段,广泛应用于各金融机构、信用网点与自助服务系统 中。本文研究的货币识别算法正是一种专业鉴伪技术。 1 1 美元识别的研究背景 随着我国加入w t o ,银行与国际金融的接轨,外汇存兑尤其是美元柜台交易 业务已成为各银行必须的业务。但外汇存兑尤其是美元存兑业务水平远落后于实 际需要,严重阻碍相关业务的发展。与遍布各网点的可以信赖的人民币鉴伪机具 形成鲜明对照,美元鉴伪机具很少,可以信赖的美元鉴伪机具更是微乎其微。一 方面,少数商业银行从国外购买价格昂贵的美元鉴伪机具由于得不到及时的升级 服务处于半瘫痪状态,另一方面,为数不多的国产美元鉴伪设备由于鉴伪性能欠 佳而不可信赖,现阶段,一笔美元现钞的存入过程几乎以原始的方式在运作:首 先是机具初检( 如果有机具的话) ,机具初检之后再由人工复检,人工复检之后, 最后柜员还需抄下每张美元的序列号交给储户与银行双方存档。也就是说,即使 储户已将美元存入银行,银行也不能确保储户存入的是真钞,一旦发现是假钞, 银行还要追溯原来的储户i l j 。 目前,国外基于现金支付的自助服务系统( 如自动售货机) 相当发达,仅美 国自动售货机保有量即达7 0 0 万左右,自动售货机及与之相关的美元识别接收器 年需求量在1 0 0 万台左右。中国制造的各种机电设备( 包括售货机) 正在越来越 多的进驻美国市场,而与之相关的具有高额利润空间的美元识别接收器却由于鉴 伪性能欠佳而无法进行应有的出口配套。 美元是一种高价值的世界通货,理所当然成为全世界造假者首选攻击对象, 硕士学位论文第一章绪论 其假币品种繁多( 仅目前发现的美元假币就有2 3 万多种版本) 假币之真( 许多 凭肉眼根本无法辨别) ,都是人民币假币所无法比拟的1 2 , 3 】。目前,国产美元鉴伪 机具鉴别美元的性能远未达到国产人民币鉴伪机具鉴别人民币相应的水准,拒收 真钞、接受假钞的现象屡见不鲜1 4 】。造成这种后果的原因主要在于大多局限于人 民币鉴伪机具的经验主义,直接沿用人民币的鉴伪套路应用于美元,其效果可想 而知。针对美元研究方面,虽也曾有学者触及1 5 j ,但仅仅停留在利用常规的视觉 识别手段去区分不同版本种类、不同面额的货币( 真钞) ,尚未见有针对美元真 伪识别的研究文献。而相应的面向美元的鉴伪特征理论体系与建模研究则基本没 有展开,因而缺乏针对美元防伪机理与鉴伪特征全面、系统而又深入的研究和认 识,进而无法应用基于美元特征模型的行之有效的识别算法处理技术。因此,我 们有必要在美元识别方面进行研究与开发。 1 2 美元识别国内外研究现状 国外发达国家以及使用美元较早、较普遍的国家针对美元鉴伪和识别技术已 开展了多年的研究。相关研究方法有用小波分析法进行特征提取f 6 】,用主分量法 ( p c a ) 进行数据降维1 7 j ,用神经网络( n n ) 进行钞票面额分类【8 j 等等。但研究 上尚未发现构建具有一般指导意义的系统特征模型的报道。产品开发较成功的代 表公司有美国的m a r s 、a r d a c ,m a g n e r 、c u m m i n s a l l i s o n ,日本的g l o r y 、j c m , 加拿大的c a s h c o d e ,英国的i n n o v a t i v et e c h n o l o g y ,韩国的s e e t e c h 等等。但是这 些产品的核心技术对外是保密的。即便是国外成熟产品,也还没有完全达到以真 防假的性能,而是需要不断修改软件或硬件( 如不断增加某些特征信息的利用量 以不断拒收新的假币) 。这从一个侧面折射出目前所应用的技术尚待进一步完善, 另一方面也反映出美元鉴伪研究课题具有理论与实际双重挑战性。 国内针对人民币的鉴伪技术己相对成熟。体现在中低端鉴伪金融机具己基本 取代国外同类产品并大量应用于各金融与信用网点之中。与此形成强烈反差的是, 国产美元鉴伪机具性能远未过关。许多商家沿用人民币的鉴伪套路应用于美元, 其效果可想而知。针对美元研究方面,虽也曾有学者触及【”,但仅仅停留在利用 常规的视觉识别手段去区分不同版本种类、不同面额的货币( 真钞) ,尚未见有 针对美元真伪识别的研究文献。而相应的面向美元的鉴伪特征理论体系与建模研 究则基本没有展开。 值得注意的是,国内许多学者针对其他领域尤其是生物特征识别领域在特征 信息获取、特征信息表示、特征信息融合和处理等方面已经作了大量颇有价值的 工作,如文献 9 , 1 0 , 1 1 1 分别探讨了基于自适应模糊成员函数、基于小波包分析及基于 幅值谱与不变矩的特征提取,文献 1 2 , 1 3 】分别研究了两种复杂特征的描述和表示方 2 硕七学位论文第一章绪论 法,文献t 1 4 , 1 5 , 1 6 贝, l j 分别研究了特征的匹配、检索与识别方法等等。原则上,上述 许多方法都是值得美钞货币识别领域借鉴的,但两个特定领域又具有各自特点, 如生物特征识别领域的每个生态个体( 如人脸) 均不相同,而美元的假钞基本上 是在克隆真钞,以至人都很难区分,因而注定了美元鉴伪与识别有其特点和难点。 1 3 本文的组织安排 本文共分六章,各章的内容和组织如下: 第一章给出了课题研究的背景和国内外研究现状以及本文的组织安排。 第二章通过阅读大量书籍和文献,本章对国内外货币研究技术特别是美元 研究技术做了详细的总结和探讨,得出机器学习方法尤其是优化后的神经网络方 法在美元识别中得到广泛应用。同时,提出了本文的研究思路和设计框。 第三章通过对美元的防伪特征分析,找到了真伪币的区别。在此基础上,给 出了基于光电子理论的传感器特征获取方法,并提出用于特征提取的改进的主成 分分析技术( i p c a ) 。该算法可以提取美元分类和真伪鉴别的有效特征,同时在 时间和空间上都较传统方法有所改进。 第四章通过对l v q 及其多种改进模型对比和探讨,提出了i m l v q 神经网 络分类器设计的算法。该算法不仅继承了m l v q 对初始权值进行有效处理和具有 有理论依据的亏损函数的优点,而且可以更好地提高网络学习能力。 第五章给出了基于本文算法的仿真试验。通过m a t l a b 仿真和c + + 语言的 编程相结合,得到了实验结果,证明了本文算法的有效性。 第六章主要是对本文工作的总结,并指出当前存在的问题和后续研究的方向 和工作重心。 附录中给出了主要算法的实现代码。 硕士学位论文 第二章美元识别研究技术和本文研究思路 第二章美元识别研究技术和本文研究思路 2 1 国内货币识别研究技术 国内货币识别技术主要针对人民币的研究。可以分为传统研究方法和机器学 习研究方法。 2 1 1 传统研究方法 传统研究方法主要依靠试验、经验知识或者专家知识选择有代表性的货币特 征,在此基础上设计相应的识别算法,以实现的j 下确识别。这种方法简单易行, 比较容易实现。下面按照识别内容分别给予介绍。 ( 1 ) 面额识别 不同面额的货币的面额数字是不同的,可以利用印刷体识别技术。另外一种 利用不同面额货币图像的差异,通过图像识别技术识别面额。一般的面额识别应 用需要较高的识别速度,这就需要对图像识别技术进行优化。实际上不同面额的 图像差异较大,所以可以简化样本图像信息来减少处理工作量。通过选择人民币 一个特定子区域的图像作为这个图像的代表,实现输入信息的减少。如果某张货 币的这个子区域被污损,可能造成识别困难,甚至会造成识别错误。为了增强识 别的鲁棒性,可以从几个子区域作为整个图像的代表。这种技术也称为掩模法, 即通过掩模覆盖一部分图像,留下的图像就是用于识别的信息。 对不同面额的图像样本进行主分量p c a 分析抽取最有效的特征进行识别, 同样可以减少需要的图像信息。试验结果往往会发现有很多特征可用于有效识别 面额。例如人民币不同面额的纸币纸张大小不一,可以利用这个特性来识别人民 币的面额【l 。 图像信息是二维空间信息,通过傅立叶能量谱变换或者小波变换转化为多个 基函数的线性叠加,然后利用这些基函数也可有效识别面额。张国华,梁中华等 提出了一维狄度投影的模板匹配算法,该算法通过图像灰度投影变换,形成一维 图像,并用一维图像进行快速匹配【i 引。曹丹华,刘斌呙等采用分类比较和滑动匹 配的方法提高算法速度和适应能力,该算法对人民币的识别速度可以达到2 0 0 0 甜秒【19 1 。 ( 2 ) 真伪识别 货币识别研究最活跃的是对真伪的识别,这是因为真伪识别相关的应用最为 4 硕士学位论文第二章美元识别研究技术和本文研究思路 广泛,识别难度也较大。国内对货币识别技术的研究更多是在人民币有效特征的 选择,并取得很多的成果。其中对防伪技术和保密材料特性的研究是主要方向, 对纸币的研究是重点。 真币和伪币在可见光线下一般较难区分真伪,日常生活中我们往往通过观察 水印的清晰程度来识别。这是因为光通量对固定光源和照射物体是稳定的,透射 光强和其具有正比关系,特别是对水印位置的光透射率真伪币有较大差异,人民 币真币的透过率比伪币的透过率高出许多,图像也就显得更清晰。受此启发孙茂 印,江和平等利用光通量透射率来识别货币的真伪【2 0 1 。进一步,他们考虑到货币 印刷油墨是有独特配方的,而伪币不具备相应的配方,即使伪币和真币的颜色看 起来较为相像,也存在油墨颜料上的差异,而不同的油墨颜料在同常光照下会有 特定的光谱反射率曲线。利用更加精密的光谱传感器,从而实现对同色异谱的有 效识别,进而实现真伪的有效识别【2 。 上述两种识别方法都可在可见光下进行真伪识别,但是所需要的传感器是比 较昂贵,研究者进一步寻找更好的解决方案。在紫外线和红外线照射下,货币会 发出荧光,分析荧光的光谱特性、荧光强度和图像也可实现有效识别。例如在紫 外线照射下会辐射出荧光,被激发出来的荧光可以是可见光。然后对比真币和伪币 荧光图像的差异实现识别。这样就将真伪识别问题次转化为图像识别问题,但是 这种方法要需要在红外设备的基础上添加图像获取设备,成本还是较高的。人们 往往选择对红外线敏感的传感器来代替图像获取设备,以减少成本;而且传感器 信号比图像信号的规模要小很多,从算法实现和速度的角度都是更合理的选择。 实际上真伪货币的纸张质量和油墨厚度是有差异的,这就使红外接收管接受的光 强不一致,程涛,周金运等利用这个特性,将光强信号转变为电压信号,从而实现 真伪识别【2 2 】。 货币在紫外线的照射下,表现出斯托克斯发光现象,不论真假钞票,都存在这种 发光现象,只是激发荧光的大小不同,通过测量钞票激发出来的荧光大小来鉴别真 假钞票。例如人民币真币的荧光少而弱,伪币的荧光多而强1 2 3 1 。货币制造技术一般 均采用了紫外荧光防伪标记,不同中心波长的紫外光照射这些标记,其反射光波 长是有差别的,利用这种反射波长的差别可以有效- i , 只n 真伪【2 训。原军胜,党选举 研究了紫外线的照射下,传感器的光谱响应、温度漂移及响应速度等问题,进行 了定量分析,提高了真伪识别的准确性。 上述方法都是利用人民币的光学特性进行真伪识别。当前主要都有防伪磁性 标志。利用这些磁性标志也能有效识别真伪,而且由于每种面额防伪此信标志是 不同的,通过磁性检测还能有效识别货币的真伪。周冬跃,黄钊洪等利用半导体 磁头起到采集磁信号,磁场的变化会影响电场信号,把磁信号转化为电压信号, 硕十学位论文 第二章美元识别研究技术和本文研究思路 然后分析电信号电压的最大峰值、最小峰值和峰值的集中区域,实现货币真伪的 有效识别【2 引。在使用机器识别货币的时候,往往通过一个滚轴将货币从进币v i 展 平卷入,所以货币相对传感器探头是运动的,反映到信号上就是磁信号的时间序 列曲线,分析这些曲线的特征能够实现对真伪的识别。尤佳,徐炜等利用磁信号 曲线的脉冲平均宽度、一簇脉冲数量、脉冲簇之间的宽度、脉冲簇数量等时域特 征进行模糊识别,实现真伪识别1 2 州。方培生等研究了以磁阻效应为工作原理的 i n s b 磁敏传感器,并成功用于真伪识别【2 7 1 。 2 1 2 机器学习研究方法 从传统方法可以看出,货币识别方法大多采用单色( 单一频率) 光学传感器, 并不能采集到足够的信息来复原真实的图像,即得不到完全的货币数字图像,但 是现在伪钞仿真度越来越高而且很多设备只收取较小面额的货币,甚至有的还对 输入货币的新旧提出了要求,所以必须采集到足够多的典型货币信息,才能有效 分类;另一方面,由于计算机硬件技术的飞速发展和成本的不断减低,可以解决 存储空间问题。所以许多学者丌始研究用神经网络的非线性、泛化、自学习能力 进行货币的真伪识别。另外货币较容易获得,为神经网络的学习提供了较好的样 本条件,这使得基于神经网络的货币识别成为近期主要的研究热点。 张平、徐问之较早进行这方面的研究,他们设计了一个由包含扫描头和探头 矩阵在内的计算机硬件和软件系统,作为神经网络的输入采集系统,能够有效的 识别货币的面别引。储茂祥,巩荣芬等在2 0 0 4 年,将线阵型图像传感器( c c d ) 结合s o f m 神经网络方法识别纸币l 孙j 。但是这种方案最大的问题是设备也较为 昂贵,无法广泛应用;而巨大的输入数据量,也需要规模较大复杂度较高的神经 网络来执行,相应得学习速度和整个系统的效率都受到巨大影响。通过分析,人 们发现要解决这些问题就要首先解决输入数据的规模问题。 对某些识别任务而言,图像信息作为神经网络的输入往往不是最优的。受传 统识别方法启发,很多研究者对真伪识别问题使用光电信号作为输入。所需要的 输入数量更加简洁。谢凯,郝建新混合使用光传感器和磁传感器的信号,在识别 准确率上有明显提高j 。大量实验结果表明,不仅能够识别新币和感染轻微噪声的 纸币,而且对缺损较少但仍能流通的残币、旧币仍具有很强的鲁棒性【3 0 l 。 蒋琳琼研究了支持向量机在货币分类中的应用,利用支持向量机技术进行数 据预处理及货币特征数据获取,用改进s m o 训练算法和d a g s v m 多值分类算 法构建的支持向量机用于货币识别【3 l 】。殷泽兴,钱浙滨等基于数学形态学理论, 得到纹理的模式谱,并以此作为纹理的特征向量,通过双隐层的人工神经网络分 类器进行分类,达到识别的目的p 2 1 。 6 硕士学位论文 第二章美元识别研究技术和本文研究思路 2 2 美元识别研究技术 2 2 1 神经网络方法 神经网络用于美元识别有较长的研究历史,早期的研究主要是利用图像来识 别货币面额【3 3 , 3 4 , 3 5 , 3 6 1 。f t a k e d a 、s o m a t u 等系统研究了神经网络进行货币识别 的可行性问题【3 7 , 3 8 j ,由于神经网络具有非常强的表达能力,基本上各种类型的神 经网络都被用于美元识别,并能取得较好的效果。他们以美元为样本,比较充分 研究了学习矢量量化网络l v q 的性能,试验结果基本令人满意1 3 9 , 4 0 】。 对某些识别任务而言,图像信息作为神经网络的输入往往不是最优的。受传 统识别方法启发,很多研究者对真伪识别问题使用光电信号作为输入。所需要的 输入数量更加简洁。af r o s i n i ,mg o r i ,pp r i a m i 使用低成本的光电传感器来获取 货币信息,经过去噪处理输入后向反馈的多层感知器( m u l t i l a y e r p e r c e p t r o n s ) , 并通过计算输入和输出数据的差异来控制神经网络的操作,实现了真伪识别。这 种方法对比基于图像的识别具有很大的成本优势,而在效率和性能上也更好一些 4 1 1 o 这些方法都是在特征学习和识别过程中引入机器学习的方法,对输入神经网 络的数据根据识别任务的不同,人为选择最有效的货币特征,从而有效减少了神 经网络的输入数据量。但是这种方法过多的依靠人的经验,不可避免的受到人为 主观的影响,增加了选择的盲目性。 2 2 2 优化神经网络方法 前面我们研究者将机器学习的理论和方法应用的美元特征的抽取和识别上。 并通过人为选择,来减小输入神经网络的数据规模。考察人们选择美元特征的过 程,发现这也是一个学习过程。人们通过同常经验和一定的科学推断从美元的大 量信息中抽取出一定的特征,并将这些特征作为美元识别的基础。这启发人们更 进一步的研究是,将机器学习的方法也引入到数据的预处理上,增加数据的可靠 性和合理性,并减少人为选择的盲目性,这种方法称为数据的优化。从理论上更 大范围的使用机器学习的方法,所获得信息会更加准确和简洁。下面我们就各种 优化技术以及相应得研究成果进行介绍。 ( 1 ) 掩模技术优化 掩模技术( m a s k ) 是一种对输入信息结合进行过滤的技术。我们经常用到的 是通过掩模覆盖美元图像的一部分,将没有覆盖的图像信息作为整幅图像的代表。 我们在日常生活中往往可以美元的一部分图像就能正确的识别美元,这是因为不 7 硕十学位论文第二章美元识别研究技术和本文研究思路 同面额的美元在图像上有很大的差异,虽然我们没有看到整幅图像但是依然能正 确识别。这也是应用掩模法的根据。在实际应用中可以使用一个掩模或者多个掩 模。使用一个掩模,则覆盖的情况一般只有一种。使用多种掩模能够组合出各种 不同的覆盖形式。因为纸币一般事规则的长方形,所以一般使用规则的长方体作 为掩模。为了表示掩盖形式,建立一个单元掩模,几个单元可以组成一个特定的 覆盖形式,每种覆盖形式都有一个对应得编码形式。这样一个编码形式就代表了 一种覆盖形式,这种方法对非常有利于基于遗传算法的优化掩模优化。 一种比较简单的方法就是按照单元网格大小建立单元掩模,按照美元图像上 网格的顺序建立一个元的向量( 分别是美元图像纵向和横向网格数量) ,如果某 个网格被覆盖,则向量元素为0 否则为1 。图像抽取的时候将网格的图像信息和 覆盖向量对应元素相乘,即能达到覆盖效果。 f t a k e d a 和s o m a t u 以信号的时问序列,以及傅立叶能量谱作为美元样本 的信息,并且利用一种随即掩模的方法,从样本信息中抽取一个子集,以这个子 集输入神经网络,试验表明:经过简化的神经网络输入数据集并没有降低神经网 络的性能。考虑到每张纸币的图像关于中心轴一般是不对称的,以对称于纸币中 心轴的方式构造掩码,可以减少掩膜选择的预处理工作量、改了效率。将经过掩 膜处理的数据如数b p 神经网络进行训练,然后用于纸币的面额识别。大量实验 结果表明,不仅能够识别新币和感染轻微噪声的纸币,而且对缺损较少但仍能流通 的残币、旧币仍具有很强的鲁棒性【4 2 t 4 3 1 。 ( 2 ) 主分量p c a 技术优化 全面、系统地分析问题,就必须考虑众多影响因素。这涉及的因素一般称为 指标,在多元统计分析中也称为变量。因为每个变量部在不同程度上反映了所研 究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反 映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增 加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的 变量较少,得到的信息量较多。主分量技术就是从信息中选择主要成分,削除一 些次要部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。p c a 有多种不同的数值计算方法,常用的是通过对协方差矩阵进行特征值分解来得到 正交变换矩阵w ,该方法由k a r h u n e n 和l o e v e 首先提出,因此也被称作k l 变 换( k l t ) 。 ( 3 ) 其他优化 上述的优化方法是当前的主流,但是其他优化神经网络性能的优化方法也有 其独特的思路和意义。f t a k e d a 和s o m d t u 通过人为神经网络规模的方法来减 少训练复杂性,从而减少训练周期,优化识别效率【4 3 】。e u i s t mc h o i ,j o n g s e o k l e e 8 硕士学位论文第二章美元识别研究技术和本文研究思路 等将整张美元分为几个子区域,利用小波变换对每个区域的图像灰度特征进行表 示,然后通过过滤得到那些较大的变换系数,用这些变换系数作为美元的识别特 征。这种变换的效果了似于p c a 技术,用相对较少的变换系数来表示美元的特 征,从而实现输入信息规模的缩减m 】。f t a k e d a 等还研究y d , 规模神经网络和免 疫算法相结合识别货币面额的可行性,由于通过遗传算法可以有效减少和优化输 入神经网络的信息,使得输入神经网络的信息更有针对性,具有较少的噪声信息, 所以小规模神经网络也能较好完成识别任纠4 引。 2 2 3 其他方法 前面的各种方法都是直接利用样本信息用于未来的识别任务,并没有利用 样本的概率信息。理论上,基于贝叶斯判决的决策理论能够提供最有的性能,所 以能够获得货币信息的概率情况,那么就能得到性能更好的分类器。实际上货币 是一种应用现代制造技术产品,产品的特性服从一定的概率分布,这方面内容将 在后面部分作更为详细的讨论。而且货币样本比较容易取得,从某种意义上我们 能够获得无穷的样本。这两个前提为基于统计理论的货币识别提供了现实基础。 m t a n a k a 、f t a k e d a 等将货币识别分为两个步骤,面额识别和真伪识别,这样可 以得到较高的速度和效率。面额识别简单,通过神经网络可以得到较好结果。而 真伪识别较为困难。在真伪识别阶段,引入了分布密度的概念,基于结构风险最 小化的高斯混合模型( g m m ) 设计识别分类器,这样通过较为简单的内积运算就可 以得出每张待验样本的距离,进而得出是否为真币1 4 引。a l ia h m a d i 、s i g e r uo m a t u 等也设计了基于结构风险最小化的高斯混合模型( g m m ) 设计识别分类器,并深入 讨论并讨论的置信度和置信区间问题【4 。 2 3 本文研究思路和设计框架 2 3 1 本文研究思路 前面介绍的货币识别方法可归为两类:传统学习方法和机器学习方法,它们 都有其优点和缺点。传统的货币识别技术是通过货币的各种规格的差别来开发研 制识别方法的,这种方法是基于试错法,即通过人工寻找货币的特征,找出不同 美元的差异,完成特征提取,这种方法的主要工作在于对货币差异的选择和测定。 利用差异值来实现货币识别,大量工作是传感器的选择和相应电路的设计上,而 识别算法的构造比较简单。这种方法思路简单,易于实现、研究成本也较低。由 于涉及主观因素,缺乏系统性,实验周期长,而且,系统比较僵化,适应性不强, 9 硕士学位论文 第二章美元识别研究技术和本文研究思路 可修改可升级性较差。对于新面额的引入,需要人工寻找特征,带来很多的重复 劳动。另外,货币的票面情况复杂( 长期流通过程中会不可避免受到磨损、污染 和缺损等) 。因此,识别结果并不理想。尤其是在货币版本不断升级,伪币不断 出现的应用环境下经受了巨大挑战。 另外一种思路是利用机器学习技术。通过机器对不同货币样本进行学习,实 现识别能力的塑造。这种方法很大程度上缓解了算法适应性的问题,尤其是利用 神经网络具有自组织,并行性和较强的泛化能力,被很多研究者用于对美元识别 的研究。但是神经网络的种类很多,必须选用合适的神经网络学习方法,并设置 合适的参数,同时必须考虑计算复杂度的问题。 美元识别技术,尤其是真伪识别主要面临三个方面的挑战。首先,不同国家 的美元,以及一个国家不同的美元版本会采用不同形状、图案、制造和防伪技术, 所以美元识别技术必须具有适应性。其次,对不断发展的伪币技术有较好的防御 性。第三,考虑成本和复杂度的问题。第一个挑战要求美元识别技术采用尽可能 多的传感器,获得尽可能全面的特征;第二个挑战要求美元识别技术能够获得有 效的美元特征和使用识别率较高的识别算法,从而对新出现的伪币能够更好的防 御;而第三个挑战要求降低算法复杂度,提高识别速度。 本文的研究思路要具备两个特性,第一,适应性要强于传统方法;第二,利 用神经网络进行识别时较多考虑学习能力和复杂性的问题。 主要研究内容如下: ( 1 ) 对美元的防伪特征进行分析,选用合适数目和种类的传感器提取美元较 为全面的有效的隐性特征; ( 2 ) 提出更加有利于真伪识别的特征提取算法对数据进行压缩; ( 3 ) 选用合适的神经网络识别算法进行美元识别,考虑学习能力和网络复杂 度的问题。 2 3 2 本文总体设计框架 美元识别实质是模式识别问题。一个模式识别系统及识别过程的原理框图可 以用下图2 1 表示。虚线的上部是识别过程,虚线的下部是学习、训练过程。需 要指出的是,应用的目的不同、采用的分类识别方法不同,具体的分类过程和识 别过程将有所不同。 下面我们对识别系统的主要环节作简要的说明。 ( 1 ) 特征提取。无论识别过程还是学习过程,都要对研究对象固有的、本质 的及重要的特征或属性进行量测并将结果数值( 字) 化,或将对象分解并符号化, 形成特征矢量或符号串、关系图,从而产生代表对象的模式,模式类中的个体在 l o 硕十学位论文第二章美元识别研究技术和本文研究思路 有些场合中也称为样本。用于学习与训练的样本的类别应是己知的。另外,在进 行特征提取之前一般还需要对目标的有关信息进行预处理。 ( 2 ) 特征选择。通常能描述对象的元素很多,为了节约资源,节省计算机存 储空间、机时、特征提取的费用,有时更是为了可行性,在满足分类识别正确率 要求的条件下,按某种准则尽量选用对正确分类识别作用较大的特征,使得用较 少的特征就能完成分类识别任务。这项工作表现为减少特征矢量的维数、符号串 字符数或简化图的结构。 ( 3 ) 学习和训练。为了让机器具有分类识别功能,如同人类自身一样,人们应 首先对它进行训练,将人类的识别知识和方法以及关于分类识别对象的知识输 入机器中,产生分类识别的规则和分析程序。这也相当于机器进行学习。这个过 程一般要反复进行多次,不断地修正错误、改进不足,这包括判决规则方法及参 数,最后使系统f 确识别率达到设计要求。目前,机器的学习需要人工干预,这 个过程通常是人机交互的。 ( 4 ) 分类识别。在学习、训练之后,所产生的分类规则及程序用于未知的对 象的识别。需要指出的是,输入机器的人类分类识别的知识和方法以及有关对象 知识越充分,这个系统的识别功能就越强、正确率就越高。 型屯壁卜悝母 乎 2 4 本章小结 图2 - 1 模式i z 另, j 系统及识别过程的原理框图 训练阶段 通过阅读大量书籍和文献,本章对国内外货币研究技术特别是美元研究技术 做了详细的总结和探讨,得出机器学习方法尤其是优化后的神经网络方法在美元 识别中得到广泛应用。同时,提出了本文的研究思路和设计框架。 硕士学位论文 第二章基丁改进p e a 的美元特征提取 第三章基于改进p c a 的美元特征提取 在进行美元识别前,提取美元有效的隐性特征特别重要。它不仅可以有效降 低后续的识别器设计的复杂性,而且有利于提高分类的精度。本章将对美元的特 征提取部分做一些探讨。 由于各种货币的防伪特征不完全相同,因而美元的特征提取方法应该具体问 题具体分析。本章通过阅读大量的参考资料,总结出美元的各种防伪特征,并对 这些特征进行分析。通过选择适当的传感器,提取美元的隐性特征,并进行有效 的特征选择,作为美元识别的特征数据。 3 1 美元防伪特征分析 现行流通的美元纸币有三类,数量最多的是联邦储备钞票,总面额占流通钞 票的9 9 。其余的1 是合众国钞票和银元票,均已停止印制,在市面上偶尔可 以见到。本文主要介绍联邦储备钞票。 美元是国际印钞界公认的设计特征变化最少的钞票之一。虽经多次改版,但 不同版别的钞票变化并不大,只是防伪功能得到了不断加强。美元纸币票面尺寸 不论面额和版别均为1 5 6 毫米x 6 6 毫米。正面主景图案为人物头像,主色调为黑 色。背面的主景图案为建筑,主色调为绿色。 3 1 1 美元纸币的防伪特征 1 真美元的特征: ( 1 ) 专用纸张:美钞的纸张主要是由棉、麻纤维抄造而成。纸张坚韧、挺括, 在紫外光下无荧光反应。 ( 2 ) 固定人像水印:1 9 9 6 年版美元纸张加入了与票面人物头像图案相同的水 印。 ( 3 ) 红、蓝彩色纤维:从1 8 8 5 年版起,美钞纸张中加入了红、蓝彩色纤维丝。 从1 8 8 5 年版到1 9 2 8 年版美钞的红、蓝彩色纤维是采用定向施放的,即红、蓝纤 维丝分布在钞票的正中间,由上至下形成两条狭长条带。 1 9 2 9 年版及以后各版中的红、蓝彩色纤维丝则随机分布在整张钞票中。 ( 4 ) 文字安全线:从1 9 9 0 年版起,5 美元至1 0 0 美元各
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人买卖转让合同标准文本
- 中交一公局采购合同样本
- 修改供用电合同样本
- 土石方工程安全责任书
- 代建房屋租赁合同标准文本
- 2025二手车买卖合同
- 北师大版数学三年级上册《蚂蚁做操》教学设计
- 部编三下数学-第2课时《常用的面积单位》教案
- 企业自如合作合同样本
- 北师大版小学数学六年级上册《比的应用》教案教学设计
- 2023年中国劳动关系学院招聘笔试备考题库及答案解析
- 创造性思维与创新方法Triz版知到章节答案智慧树2023年大连理工大学
- 英语四级仔细阅读练习与答案解析
- 《产业基础创新发展目录(2021年版)》(8.5发布)
- 排水沟土方开挖施工方案
- CAD教程CAD基础教程自学入门教程课件
- 技术合同认定登记培训课件
- 停水停电时的应急预案及处理流程
- 电商部运营助理月度绩效考核表
- DB61∕T 1230-2019 人民防空工程防护设备安装技术规程 第1部分:人防门
- 第12课送你一个书签
评论
0/150
提交评论