二维条码QR码的分析和编解码设计_第1页
二维条码QR码的分析和编解码设计_第2页
二维条码QR码的分析和编解码设计_第3页
二维条码QR码的分析和编解码设计_第4页
二维条码QR码的分析和编解码设计_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北京邮电大学 硕士学位论文 维条码QR码的分析和编解码设计 姓名:许辉 申请学位级别:硕士 专业:软件工程 指导教师:宋茂强20071101二维条码QR码的分析和编解码设计摘要随着信息技术的发展,条码在更多的领域中得到了广泛的应 用,大大提高了各行业的生产工作效率。条码识别是以条码理论、 光电技术、计算机技术和通信技术为基础的综合性技术,是信息 数据自动输入、识别的重要方法。本设计的主要任务是在研究二维条码的码制标准的基础上, 实现对二维条码QR码的高速采集与识别。本文简要介绍了条码的各种码制与应用现状,详细分析了 QR码的基本特点、符号结构;在条码图像识别方面,研究了对 釆集的条码图像进行预

2、处理的方法,即:对图像进行整形。运用 图像校正、二值化、去噪、边缘检测、Hough变换、图像旋转等 多种图像处理方法实现条码图像的预处理、条码定位、条码分割 和数据提取。对预处理后的条码图像进行译码,设计了 QR码的 解码和Reed-Solomon纠错算法,并在手机软件中加以应用。经实际检测,结果表明该译码算法能够实现手机在一般光线 下拍摄的QR码的正确解译。关键词:二维条码快速响应码条码识别二值化ANALYSIS OF 2D BAR CODE-QR CODE AND DESIGH OF ITS CODING AND DECODINGABSTRACTWith the development o

3、f information technologies, barcodes have been widely used in more fields, and greatly improve work efficiency of industries. The bar code recognition technology, which is based on barcode theory, photo-electricity technologies, computer technologies and communication technologies, is an important a

4、pproach to automatic input and recognition.The main tasks of this design are to acquire and identify image of QR Code in high speed, based on the research on international symbology specification of QR Code.In this paper, the types and application states of barcode are introduced first, then QR Code

5、s basic characteristics, symbol structure. In the aspect of bar code image recognition, the paper researches on the preprocessing, the image collected, namely, the reform of image. Uses image binarization, image denoising, edge detection, Hough transform, and image rotation etc. to complete the prep

6、rocessing, localization, segmentation and data extraction of bar codes. This will ground for the correct decoding afterwards.Then decode the bar-code image after preprocessing, research on decoding algorithms the application of the Reed-Solomon Error Correction Algorithm to QR code. And get the text

7、 information which QR code represents.According to the results of the experiments, this decoding arithmetic can identify the ordinary pictures which are taken by the cell phone and implement to decode QR code correctly. Besides, it is possible to transplant the software to the cell phone.KEY WORDS:

8、Two-Dimension Barcode, QR Code, Bar code recognition, Binarization独创性(或创新性)声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。 尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人 已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位 或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:日期: 09,.关于论文使用授权的说明学位论文作者完全

9、了解北京邮电大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国 家有关部门或机构送交论文的复印件和磁盘,允许学位论文被査阅和借阅;学校可以 公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇 编学位论文。本学位论文不属于保密范围,适用本授权书,本人签名: $導 日期:说,.崢导师签名:日期:/.乙欽北京邮电大学硕士学位论文 第一章绪论1.1课题研究背景条形码技术是集条码理论、光电技术、计算机技术、通信技术等技术于一体的综 合性技术,起源于20世纪40年代,它具有输入速度快、可靠性髙、釆集信息量大、 成本

10、低等特点,近年来发展十分迅速,在国际上广泛应用于商品流通、物流仓储、信 息服务等各个领域,极大地提高了生产效率。近几年,另一个广泛得到普及的领域就是手机。自90年代初以来,无线移动技 术和市场应用得到飞速发展和成功。从寻呼机到目前3G手机的面市,中国人已经习 惯了手中的移动手机不停地变化移动通信发展的焦点已经由用户数量的增长,转为 业务量和新业务的增长:由技术驱动转为业务驱动。在激烈的市场竞争中,越来越成 熟的手机用户不仅注重手机硬件的外观,更注重手机所賦予的强大功能。以上两个普及领域催生了一个新的需求:即将二维码和手机结合起来,利用手机 作为读取设备,实现条码识别。目前国际ISO标准已经有多

11、种条形码,其中应用最广泛的有PDF417、Date Matrix、QR码等。QR码是矩阵式二维条形码的代表,它除了具有一维条码和其它二 维条码所具有的信息容量大、可靠性高等特点外,还具有全方位识读、能有效表示中、 英、简、繁、日、韩等文字、超高速识读以及超强的纠错能力和抗干扰能力等特性。 适合于我国的国情以及汉字编码的特点,综上,QR码在手机中的应用有着良好的前景和潜力,它将有效地推动移动增值业 务的快速增长,有助于提高移动用户的ARPU值,有利于为我国信息产业的发展和经 济建设带来社会及经济效益。1.2条型码的起源与发展北京邮电大学硕士学位论文随着计算机、信息及通讯技术的发展,信息的处理能力

12、、储存能力、传输通讯能 力曰益强大。全面、有效的信息采集和输入几乎成为所有信息系统的关键。条码自动 识别技术就是在这样的环境下应运而生。作为一种有效的识别工具,它具有输入速度 快、可靠性高、釆集信息量大、成本低等特点,能够节省开支、改进业务操作。因此, 自从出现以来,受到各个领域的广泛关注,并且快速应用到工业、商业、国防、交通 运输、医疗卫生、邮电等各个领域。早在上世纪40年代后期,美国乔伍德兰德(Joe Wood Land)和贝尼西尔佛 (BeaySilver)两位工程师就开始研究用代码表示食品项目,称为“公牛眼”代码。靶的 同心环由圆条和空白绘成,在原理上同后来的条码符号很接近,遗憾的是当

13、时的商品经 济还不十分发达,而且工艺上也没有达到印制这种代码的水平。20年后,乔伍德兰德作 为IBM公司的工程师成为北美地区的统一代码UPC条码的奠基人。吉拉德费伊 塞尔(Girad Feissel)等人于1959年申请了一项专利,将数字09中的每个数字用七段平 行条表示。但是这种代码机器难以阅读,人读起来也不方便。不过,这一构想促进了条 码码制的产生与发展。不久布林克尔(EfBrinker)将条码标识应用在有轨电车 上。60年代后期,西尔韦尼亚(Sylvania)发明了一种被北美铁路系统所采纳的条码系统。 这两项发明可以说是条码技术最早期的应用。1970年美国超级市场AdHoc委员会制定了通

14、用商品代码UPC码(Universal Product Code),首先在杂货零售业中试用,为以后该码制的广泛釆用奠定了基础。次年, 布莱西公司研制出“布莱西码”及相应的自动识别系统,用于库存验算。这是条码技术 第一次在仓库管理系统中应用。1972年,莫那奇马金(Monarch Marking)等人研制出库 德巴码(Codabar),后来被广泛应用于血库、图书馆、包裹的跟踪管理等。至此美国的 条码技术进入了新的发展阶段。美国统一代码委员会(Uniform Code Council Inc简称UCC)于1973年建立了 UPC 条码系统,并全面实现了该条码编码以及其所标识的商品编码的标准化。同年

15、,食品杂 货业把UPC码作为该行业的通用标准码制,为条码技术在商业流通销售领域里的广泛 应用,起到了积极的推动作用。1974年,Intemiec公司的戴维阿利尔(Davide Allair)博士 推出39码,很快被美国国防部所采纳,作为军用条码码制。39码是第一个字母、数字式 的条码,后来广泛应用于政府、药物、工业领域。我国的邮政系统的EMS单上也使 用了三九码,北京邮电大学硕士学位论文 1976年美国和加拿大在超级市场上成功地使用了 UPC系统,这给人们以很大的 鼓舞,尤其是欧洲人对此产生了很大的兴趣。次年,欧洲共同体在UPC条码的基础上,开发出与UPC码兼容的欧洲物品编码系统(Europe

16、an Article Numbering System ), 简称EAN码,并签署了欧洲物品编码协议备忘录,正式成立了欧洲物品编码协会 (European Article Numbering Association).简称 EAN。直到 1981 年,由于 EAN 组织 已发展成为一个国际性组织,被称为国际物品编码协会(International Article Numbering Association). 089600070田 1-2 UPC-E 图 14 BAN-869012341lllllllllllill 图 1-1 UPC-Apiiiiiig0123467892116困 1-3 E

17、AI13 |l_llll_lll_閥丨111A B C D *1 2 3 图1-5三;llliiHIDIIIa 0 0 0 8 0 0田1-6库德巴码 图1 一1至图丨_6给出了几种条码样本,这些条码均在一个方向上通过“条”和 “空”的不同宽度以及不同位置的排列组合来存储信息,称为一维条码。维条码的出现提髙了工作效率,改善了人们的生活和工作环境。但随着应用领 域的不断扩展,传统的_维条码渐渐显现出了它的局限:首先,由于信息容量的限制,它仅仅作为一种标识数据,而不能被描述。必须通 过连接数据库才能明确条码所表达的信息,在没有数据库或者不便联网的地方,一维 条码的使用就发挥不了任何作用。例如:目前

18、在国内应用比较成熟的EAN码 6901010101098的标识,我们只能通过与数据库连接并找到对应信息后,才知道它是 中国广东健力宝公司的听装饮料。其次,由于信息密度的限制,现代高新技术发展中越来越多的微小型产品的出现, 例如半导体器件、计算机芯片、医疗药品等,逐渐暴露出传统一维条码的弱点:一维 条码只在水平方向上携带信息,垂直方向上不携赉信息。垂直方向的冗余仅仅是为了 如下目的:一是为了保证局部损坏的条码能正确识别;二是使扫描容易完成。另外,一维条码只能表达字母和数字,而不能表达汉字和图像。然而,在信息化北京邮电大学硕士学位论文急速发展的过程中,迫切要求用条码直接表示大量信息,不需要事先建立

19、数据库,用 以直接保存文字、图像甚至声音等信息。二维条码是为了解决一维条码无法解决的问题而产生的。它除具备一维条码的优 点外,突破了一维条码的限制,具有如下特点: 1)信息密度大。二维条码是在水平和垂直两个方向的二维空间上存储信息的符号,通常情况下其 密度是一维条码的几十到几百倍。 2)编码范围广不仅可以存储数字、字符,还可以存储多种语言文字、图片(如照片、指纹等)、 声音等信息。纠错能力强。二维条码引入错误纠正机制。这种纠错机制使得二维条码因污染、破坏引起局部 损坏时,照样可以正确得到识读。保密性能好。可以用加密算法对图像信息加密后,再用二维条码表示。识别二维条码时,用相 应的解密算法,就可

20、以恢复原来的图像,这样便可以防止各种证件、卡片等的伪造。 一维条形码和二维条形码的比较如表1 一1所示:表1-1 一维条形码和二维条形码的比较条形码类型维条形码二维条形码信息密度与容量信息密度低、容量小信息密度髙、容量大错误校验及纠错能力可通过校验码校验、无纠错能力 损污后可读性差有校验及纠错能力,并可根据实际 应用设置不同的安全等级,等级高 时损污50%仍可读取完整信息。垂直方向携带的信息不携带,垂直方向的冗余是为了 识读方便携带信息。引入纠错机制,可用于 恢复丢失的信息用途用于对“物品”的标识用于对“物品”的描述数据类型仅为英文、数字及简单符号凡可以数字化的信息,包括英文、 中文、数字、符

21、号、图象等北京邮电大学硕士学位论文 对数据库及通讯网络 的依赖多数应用场合必须依赖数据库及 通讯网络可不依赖数据库及通讯网络而单 独存在识读方法线性扫描识读.堆积式:线性扫描或图像扫描 矩阵式:仅能用图像扫描国外对二维条码技术的研究始于20世纪80年代末。1卯7年符号设计专家戴维 阿利尔(David Allais)博士提出了一种称为Code49的二维条码,开创了进行二维条 码研究的先河。特德威廉斯(Ted Williams)于1988年推出Codel6K码,Symbol公司 于1991年正式推出PDF417码,美国国际资料公司(IpternationalDataMatrix)1989年 发明D

22、ata Matrix码。DENSO公司于1994年9月研制QR码这些二维条码的密度 都比传统的一维条码有了较大的提高,如PDF417的信息密度是一维条码Code39的 20多倍。在二维条码标准化研究方面,国际自动识别制造商协会(AIM、美国标准 化协会(ANSI)已完成了 PDF417, QR, Code 49, Code 16K, Code One 等码制的 符号标准.图1 一7至图1 一 11给出了几种二维条码样本:HiW田 1-7 Codel6K 码田 1-8 PDF 码图 1-9 Code49 码图 1-10 DM 码.田 1-11 QR 码在应用方面,美国、德国、日本、墨西哥、埃及、

23、哥伦比亚、巴林、新加坡、菲 律宾、南非、加拿大等国,不仅已将二维条码技术应用于公安、外交、军事等部门对 各类证件的管理,而且也将二维条码应用于海关、税务等部门对各类报表和票据的管 理,商业、交通运输等部门对商品及货物运输的管理,邮政部门对邮政包裹的管理, 工业生产领域对工业生产线的自动化管理。1.3国内研究应用现状我国对二维条码技术的研究始于1993年。中国物品编码中心对几种常用的二维 条码PDF417, QR码,Data Matrix, Code 49, Code 16K等技术规范进行了翻译和 跟踪研究,并制定了两个二维条码的国家标准:GB/T17172-1997四一七条码GB/T 1828

24、4-2000快速响应矩阵码。国内的一些企业也提出了自主研发的二维条码。如: 深圳矽感科技的CM紧密矩阵码(Compact Matrix Code)、GM网格矩阵码(Grid Matrix Code)以及上海龙贝科技的“龙贝码”,它们的多项技术指标超过国际上现有的同类 码制,整体技术达到国际先进水平,实用性强,并且已在民航等领域得到了实际的应用供.为加快二维条码在我国的研究及应用,中国物品编码中心与各地分支机构进行了 许多二维条码的应用试点工作。1999年3月在北京举行的全国人大第九届三次全体会 议和全国政协第九届三次会议期间,在随行人员证件、记者证、旁听证上成功地应用 了二维条码技术,引起了与

25、会代表和新闻界的极大关注;在专利收费、邮政管理、财 政管理、暂住人口管理、部队仓库管理上的应用等,都取得了很好的效果。目前,我 国香港特别行政区已将二维条码应用在特别行政区的护照上:我国的汽车行业自动化 生产线、医疗急救服务卡、涉外专利案件收费、珠宝玉石饰品管理及银行汇票上也已 取得了良好的应用;由于二维条码信息容量大,对主系统和网络依赖性能低,保密防伪性能好,并且 成本低,寿命长,适合我国人口众多、经济发展不平衡、计算机建设还很不完善的国 情。随着信息技术和现代化管理的发展,人们对其认识的提高、理解的加深以及人们 对产品不同需求的增加,二维条码技术在我国有着更加广阔的发展前景。1.4本文的结

26、构本文内容包括研究典型条码的编码技术、QR码二维条码的图像识别方法,结合 了条码中的ReedSolomon纠错技术,实现了 QR码在手机中的应用。 本文的组织结构如下:第一章:绪论。介绍条码技术的起源、发展,现状和前景。第二章:条形码相关技术综述。分别阐述了典型一维条码和二维条码的编码理北京邮电大学硕士学位论文论,为后面的研究提供了理论基础。对一维条码、二维条码以及其它自动识别技术加 以比较。第三章:介绍了二维条码图像的预处理过程。包括图像的灰度化、中值滤波、 二值化、定位与分割以及图像的旋转。第四章:研究QR码的编解码理论及实现。介绍Reed-Solomon纠错在QR码中 的应用,并结合前面

27、所介绍的图像识别方法,设计QR码解码系统。第五章:对本文的主要工作进行总结,并展望了二维条码的发展前景和进一步的 工作。第二章相关技术概述2.1 一维条码国际上公认的一维条形码主要有EAN以及UPC两种。UPC (Uniform Product Code),由美国和加拿大共同组织的“统一编码委员会” Universal Code Council, UCC通过,作为美、加产品统一的标识符号,EAN (European Article Numbering),由欧共体的“欧洲物品编码协会” European Article Numbering Association,吸取了 UPC的经验而确定的物品

28、标识符号,与UPC 兼容。该协会已于拐77年改为“国际物品编码协会”(IAN)我国于1988年成立“中国物品编码中心并于1991年加入EAN。 我国主要釆用的编码标准为EAN,我们也就针对EAN码进行研究。标准版商品条码所表示的代码由由前缀码、制造厂商代码、商品标识代码和校验 码组成(13位数字)组成,其结构如图2-1所示:3C13X12XH 110X9X6X7X6X5X4X3X2XI酋费码F1F2F31造 r 代玛 M1M2M3M4商品代玛I1I2I3I4 校验玛C 图2-1 EAN-13结构我国的国别代码为690695。厂商识别代码由EAN在各国的分支机构分配督理, 我国由“中国物品编码中

29、心”统一分配企业代码。产品代码由制造商根据规定自己编 制。校验码为了校验代码的正确性。北京邮电大学硕士学位论文 标准版商品条码所表示的代码由由前缀码、制造厂商代码、商品标识代码和校验 码组成(13位数字)组成,其结构如图2-2所示:困2-2 EAN-13构成左侧空白:无任何印刷符号,空白处位于条形码符号左侧,用以提示阅读,准备 扫描。当两个条码相距较近时,有助于对它们加以区分。左侧空白不少于9个模块(一 般11个模块)。前置符:国家代码的第一位。用以判断左侧数据符的奇偶位。起始符:条形码符号的第一位符号,用于识别条形码符号的开始。由3个模块组左侧数据符:位于中间分隔符左侧,表示一定信息的条形码

30、字符,由42个模块 组成(6位)。中间分隔符:(主要用于EAN码)位于条形码中间位置的条与空,用来区分左、 右侧数据符,由5个模块组成。右侧数据符:位于中间分隔符右侧,表示一定信息的条形码字符,由35个模块 组成(5位)。条码校验符:表示校验码的条形码字符,用以校验条形码符号的正确与否,根据 条码所表示的字符信息按一定的校验规则生成。由7个模块组成(1位)。终止符:条形码符号的最后一位符号。用于识别条形码符号的结束。由3个模块 组成。右侧空白:无任何印刷符号,空白处位于条形码符号右侧,用以提示终止扫描。 右侧空白一般7个模块。注:条形码是由一组规则排列的条、空以及对应的字符组成的标记。 “条”

31、指对光线反射率较低的部分。由1 一4个模块组成。表示二进制的“1”。 “空”指对光线反射率较高的部分。由1_4个模块组成。表示二进制的“0”。 构成条形码的基本单位是模块(0.33mm),是指条码中最窄的条或空。 构成条形码的一个条或空称为一个单元一个单元包含的模块数由编码方式决EAN码的所有单元由一个或多个模块组成:(另一些码制,如39码中,所有单 元只有两种宽度,即宽单元和窄单元,其中的窄单元即为一个模块。)EAN条形码字符包括09共10个数字字符。每个字符由两个条和两个空组成, 共7个模块。因此EAN码是一种(72)码。它所对应的10个字符有3种编码方式:左侧数 据符奇排列、左侧数据符偶

32、排列、右侧数据符偶排列。因此,这10个字符具有30种 编码,其对应的编码图案也有30种,EAN码是由二进制所表示的。它的左侧数据符有奇偶性,其奇偶性排列取决于 前置符。比如中国的国别码为690695,其前置符为6。则左侧数据符的排列为: OEEEOO。如表2 1所示:表2-1左側数据符奇偶排列组合方式前置符左侧数据符奇偶排列组合方式00 0 0 0 0 010 0 E 0 E E20 0 E E 0 E30 0 E E E 040 E 0 0 E E50 E E 0 0 E6OEEEOO北京邮电大学硕士学位论文7一j0 E 0 E 0 E |8 s0 E 0 E E 0 |1 9 0 E E

33、0 E 0 iEAN-13编码如表22所示:表2-2 EAN-13编码字符值!左侧数据符 i右侧数据符 1奇排列 |偶排列偶排列 丨0oooiioi !010011111100101001100101100111100110 I20010011 I0011011110110030111101 j0100001100001040100011001110110111005011000101110011001110 |601011110000101101000070111011 i00100011000100 j80110111 I0001001100100090001011 !0010111111

34、0100起始符101 丨中间分隔符01010终止符1012.1. 4校验码的计算为防止条形码的脏污或者残缺等原因而导致的误读,确保商品条形码正确性,根 据条形码字符的数值按一定的数学算法计算出校验码。计算步骤如下: 设条形码数字码为Xi(i=l,2,3-13)从第二位开始,将所有偶数位的数字代码求和,将和乘以3,得出N1;从第三位开始,将所有奇数位的数字求和,得出N2;imtN1+N2=N3;N3 mod 10=N4北京邮电大学硕士学位论文 (5)以10为模,取余数N4的补码。即得到校验位C.如听華健力宝饮料的条形码为6901010101098,其中690代表我国EAN组织, 1010代表广东

35、健力宝公司,10109是听装饮料的商品代码*这样的编码方式就保证了 无论在何时何地,6901010101098就唯一对应该种商品。 其校验码计算如下: Nl=3 (9+1 + 1 + 1 + 1+9) =66 N2=6N3=N1+N2=72 N4=2C=io-2=8缩短版商品条码由8位数字组成(EAN8,与EAN-13码相比,EAN-8码没有 制造厂商代码,仅有前缀码、商品项目代码和校验码。条形码符号是图形化的编码符号,对条形码符号的识读就是要借助一定的专用设 备,将条形码符号中含有的编码信息转换成计算机可识别的数字信息。目前市场上常用的条形码设备是光电识读器,它由条形码扫描器、放大整形电路、

36、 译码接口电路以及计算机系统等组成。如图2-3所示:图2-3 识读设备构成TaEil条形玛符号北京邮电大学硕士学位论文扫描系统由光学系统及探测器即光电转换器(一般采用光电二极管、三极管等) 组成。它完成对条形码符号的光学扫描,并通过光电探测器,将条形码条空图案的光 信号转换成为模拟电信号。信号整形部分由信号放大、滤波,波形整形组成。它的功能在于将条形码的光电 扫描信号处理成为标准电位的矩形脉冲电信号,其髙低电平的宽度和条形码符号的条 空尺寸相对应。译码部分一般由嵌入式微处理器组成。它的功能就是对条形码的矩形波信号进行 译码,其结果通过接口电路输出到条码应用系统中的数据终端。扫描识读时,由扫描器

37、光源发出的光束照射在条形码符号上,深色的条吸收光, 浅色的空将光反射回扫描器。反射光经光学系统釆集并投射在光电转换器上,被转变 成电信号。由于考虑到使用者安全,要求光源放射的能量较小。从光电转换器输出的 电信号须送放大器放大。为了避免由于条形码中的污点等而导致信号错误,在放大电 路后需作整形,整形后成为一串矩形脉冲信号,脉冲的高低分别代表相应的空、条; 脉冲的宽度代表相应条、空的宽度。整形后的脉冲信号被送入译码器,由译码器按照 条形码的编、译码规则进行译码,给出条形码符号所表示的信息,然后将译码后的信 息传送给一部手持式终端机、个人电脑、控制器或计算机主机。条形码的这种传统译码方式通常是通过专

38、用的条形码识读设备进行的,有时候识 读设备由于环境以及操作上的失误会导致译码错误(如:采用译码器译码必须保证扫 描线的倾斜角度不能太大,否则不能译码),并且识读设备并不是通用的,某一种识 读设备只能识读一种或几种条形码,所以存在一定的兼容性问题。如果能够用计算机实现条形码的软件译码,则不存在上述问题,将会节约硬件设 备的开销,并且可以根据需要增加可译码的条形码种类。如图像式条码识读器,先用 扫描仪或是摄像头条形码保存为位图后,送到嵌入式计算机系统中进行处理。包括图 像处理、解码、纠错、译码等。它不仅能识读一维码以及堆叠式二维码,还可以识别 光电识别器无法识读的矩阵式二维码。因此,图像方式在条码

39、采集中的应用,将是一 个必然的趋势。2.2 二维条码北京邮电大学硕士学位论文 一维条形码出现后,在各个行业得到了广泛的应用,极大的提高了数据采集和信 息处理的速度,提高了工作效率.然而,随着应用领域的不断扩展,传统的一维条码 逐渐显露出它的局限性。二维条码的诞生解决了一维条码无法解决的问题。它继承了 一维条码成本低、方便容易生成等特点,拓展了条码的应用领域,成时代的新宠二维条码的分类根据二维码的编码原理以及结构差异,可分为堆叠式(或排式)二维条形码和矩 阵式二维条形码两类。堆叠式二维条形码的编码原理是建立在一维条形码的基础之上的。它以线条来组 合空间,由多行短截的一维条码堆叠而成。其编码设计、

40、校验原理、识读方式与一维 条形码兼容。但由于行数的增加,行的鉴别、译码算法与一维条形码又不尽相同。矩阵式二维条形码以点来组合空间,以矩阵的形式组成,在矩阵相应元素位置上 用点的出现表示二进制“1”,空的出现表示二进制“0”,由点的排列组合确定代码表 示的含义。矩阵式条形码是建立在计算机图像处理技术、组合编码原理等基础上的一 种新形图形识读处理的编码方式。目前国际ISO标准已经有多种条形码,其中应用最广泛的有PDF417、Date Matrix、QR码等。PDF417是堆叠式二维条形码的代表,而QR码是矩阵式二维条形 码的代表。P0F417 码PDF417码是由留美华人王寅君等人(美国符号科技公

41、司,Symbol Technologies, Inc)发明的,于1991年正式推出PDF即Portable Data File (便携数据文件),因 为组成条码的每一符号字符都是由4个条和4个空构成,每个条或空由1-6个模块组 成。这4个条和4个空的总模块数为17,所以称417码或PDF417码。每个PDF417符号由空白区包围的一系列层(ROW)组成,层数为3-90,每层由一 个起始符、一个左层指示符、1-30个数据字符、右层指示符以及终止符组成。如图 2-4所示:符 liii田 2-4 PDF417码PDF417条码最大的优势在于其庞大的数据容量和极强的纠错能力. 每一个PDF417码的储

42、存量可高达1,108个字节,如果将数字压缩则可存放至 个字节。由于PDF417码的容量较大,除了可将数字、字符等进行编码外,还可 将人体的特征如指纹、视网膜扫瞄、及照片等个人记录储存在条形码中.PDF417条码具有一个显著的优点便是纠错能力强,它釆用了目前世界上最先进的 R-S (Reed-Solomon)码进行纠错译码。这种纠错技术,不仅可以有效地防止译码错 误,提高译码的速度及可靠性:而且可以将由于条码符号破损、沾污等丢失的信息破 译出来。纠错能力分为8级,级别越高,纠正能力越强。PDF417码是二维条形码的美国标准和欧盟标准。我国也已经制定了 PDF417码的 国家标准GB/T17172

43、1997. Data Matrix码Data Matrix 原名 Data code,由美国国际资料公司(International Data Matrix, 简称IDMatrix)于1989年发明。Data Matrix是一种矩阵式二维条码,其发展的构 想是希望在校小的条码标签上存入更多的信息量。Data Matrix的最小尺寸是目前所 有条码中最小的,能在25平方ram面积上编码30个数字,特别适用于小零件的标识, 如标示集成电路、药品等小件物品。同时由于Data Matrix只需要读取资料的20 % 即可精确辨读,因此很适合应用在条码容易受损的场所,例如印在暴露于高热、化学 清洁剂、机械

44、剥蚀等特殊环境的零件上。Data Matrix具有很强的纠错能力,他这种 纠错能力的获得是采用Reed Solomon纠错算法来实现的。2-4所示:如图所示Data Matrix符号看起来像一个由深浅两种颜色组成的国际象棋棋盘,北京邮电大学硕士学位论文 北京邮电大学硕士学位论文 每一个相同大小的黑色或白色方格称为一个数据单位,Data Matrix符号就是由许多 这样的数据单位组成。在寻边区外层有宽度为一个数据单位的静区。寻边区是“棋盘” 的边界,只用于定位和定义数据单位大小,而不含有任何编码信息。被寻边区包围的 数据区包含着编码信息。如图2-5所示:.、,、: B3jc|2. 2.4 OR

45、码Module 揉荦位图 2-5 DataMatrix码QR码是由R本Denso公司于1994年9月研制的一种矩阵二维码符号,是英文 Quick Response的缩写,即快速反应的意思,源自发明者希望QR码可让其内容快速 被解码。它除具有一维条码及其它二维条码所具有的信息容量大、可靠性高、可表示 汉字及图象多种文字信息、保密防伪性强等优点外,还具有如表23的特性。表2-3 QR码的基本特性符号规格21X21模块(版本1) -177X177模块(版本40) (每一规格:每边增加4个模块)空白区环绕在符号周围的4个模块宽的区域。寻像图形(便丁-明确QR码的位置及角度)包括三个相同的位置探测图形。

46、分别位于符号左上角、 右上角、左下角。毎个探测图形由3个重叠同心正方形 组成。分别为7*7个深色模块、5*5个浅色模块、3*3 个深色模块。模块宽度比为1: 1: 3: 1: 1分割符(便于找到位置探测图形)探测图形和编码区之间有宽度为1模块的分割符定位图形水平及垂直定位符分别在位置探测图形间第6行及6列。 由一个深色(开始及结束)及一个浅色模块交替排列。 作用是确定符号的密度和版本,提供模块坐标位置。校正图形由3个重叠同心正方形组成。分别为5*5个深色模块、 3*3个浅色模块、1*1个浅色模块。校正图形的数据及位置由版本而定, 版本26有1个校正图形 版本7 13有6个校正图形 版本14 一

47、 20有13个校正图形 版本2127有22个校正图形 版本2834有33个校正图形 版本3540有46个校正图形版本信息在图形中出现两次,提供信息冗余。共18位,6位数据 位 12位通过BCH (18,6)编码计算出的纠错位。编码区域包括表示数据码字、纠错码字、版本信息和格式信息的 符号字符*格式信息出现两次,提供信息冗余,包含了条码的纠错等级(第 1、2位和掩码图形参考等信息(第3、4、5位) 格式信息15位,其中5位数据位,10位用BCH (15,5) 编码计算得到的纠错位,数据类型与容量 (指最大规格符号版本40-L级数字数据:7,089个字符 字母数据:4,296个字符 8位字节数据:

48、2,953个字符中国汉字(GB 2312对应的汉字和非汉字字符)、日本汉 字数据:1,817个字符数据表示方法深色模块表示二进制“1”,浅色模块表示二进制“0”纠错能力L级:约可纠错7%的数据码字 M级:约可纠错15%的数据码字 Q级:约可纠错25%的数据码字 H级:约可纠错30%的数据码字结构链接(可选)可用1 一 16个QR码符号表示一组信息掩模(固有)可以使符号中深色与浅色模块的比例接近1: 1,使因相 邻模块的排列造成译码困难的可能性降为最小。扩充解释(可选)这种方式使符号可以表示缺省字符集以外的数据(如阿 拉伯字符、古斯拉夫字符、希腊字母等),以及其他解释 (如用一定的压缩方式表示的

49、数据)或者对行业特点的 需要进行编码。独立定位功能有QR码与其它二维条码的比较见表24。表2-4 QR码与其它二维条码的比较QR码PDF417Data Matrix开发公司(国) |Denso wave (日)Symbol (美)CI Matrix (美)北京邮电大学硕士学位论文方式矩阵堆叠式矩阵数据量-数字7 0892,7103,116数据量-英数字4,2961,8502, 355数据量-二进制2,9531,0181,556数据量-汉字1,817554778汉字表示13bit (特定压缩模式) 表示汉字效率提髙20%16bit16bit主要特长大容量省空间 高速读取大容量省空间识读速度30个

50、/每秒3个/秒23个/秒识读方向全方位(360 )10全方位(360。)主要用途顿域OAFA标准AIM InternationalJISISOAIM International ISOAIM International ISO2.3 QR码符号结构由于在后面研究QR码的编解码设计中需要了解QR码的符号结构,因此,我们 单独设立一节来介绍QR码的符号结构。QR码的基本特性编码字符集QR码编码字符集包括数字型数据(数字09)、字母数字型数据(数字09;大 写字母AZ:9个其它字符:space, $, %,+, ,.,/, : )、8位字节型数据(ASCII 字符集)、日本汉字字符、中国汉字字符(G

51、B2312图形代码表表示的字符集)数据表示法深色模块表示二进制“I”,浅色模块表示二进制“0”。符号规格21X21模块(版本1)到177X177模块(版本40),每一版本符号比前一版 本符号每边增加4个模块。数据类型与容量(指最大规格符号,版本40-L级)数字数据7089个字符、字母数据4296个字符、8位字节数据2953个字符、北京邮电大学硕士学位论文 中国汉字数据1817个字符,纠错能力QR码有4种纠错等级,分别为L级、M级、Q级和H级。对应的可恢复码 字比例为:L级:约7%的数据码字; M级:约15%的数据码字; Q级:约25%的数据码字; H级:约30%的数据码字。结构链接(可选)允许

52、把数据文件最多用16个QR码符号在逻辑上连续地表示。以任意的顺序 扫描,数据文件的原始数据能正确地重新连接起来。掩摸(可选)可以使条码符号中深色与浅色模块的比例接近1:1,使相邻模块的排列而影响高 效译码的可能性降为最小。扩充解释(可选)这种方式使符号可以表示缺省字符集以外的数据(如阿拉伯字符、古斯拉夫字符、 希腊字母等),以及其它数据解释(如用一定的压缩方式表示的数据)或者根据行业 特点的需要进行编码cQR码符号结构每个QR码符号是由正方形模块组成的一个正方形阵列构成,由编码区域和包括 寻像图形、分隔符、定位图形和校正图形在内的功能图形组成,功能图形不用于数据 编码,符号四周为空白区。其结构

53、如图2-6所示。f麵n “ I 图2-6 QR码的结构符号版本和规格QR码符号共有40种规格,分别为版本1版本40。版本1的规格为21模块 X21模块,版本2的规格为25模块X25模块,每一版本符号比前一版本每一边 增加4个模块。以此类推,直到版本40,其规格为177模块X 177模块。不同的版本可以包含不同的信息量。寻像图形QR码符号的寻像图形由三个相同的位置探测图形组成,分别位于符号的左上角、 右上角和左下角,如图27所示。每个位置探测图形可以看作是由3个重叠的同心 正方形组成,它们分别为7X7深色模块、5X5浅色模块和3X3深色模块。位置 探测图形的模块宽度比为1: 1: 3: 1: 1

54、。符号中其它地方遇到类似图形的可能性很 小,因此可以迅速地识别可能的QR码符号。识别组成寻像图形的3个位置探测图形, 从而明确地确定条码符号的位置和旋转角度。分隔符每个位置探测图形和编码区域之间有宽度为1个模块的分隔符,它全部由浅色 模块组成。定位图形tap?电形 功水平和垂直定位图形分别是由深色和浅色模块交替组成的一个模块宽的一行和 一列,其幵始和结尾都是深色模块。水平定位图形位于符号上部的两个位置探测图形 之间的第6行。垂直定位图形位于符号左侧的两个位置探测图形之间的第6列。它北京邮电大学硕士学位论文 田2-7 QR码的寻像囷形校正图形每个校正图形可看作3个重叠的同心正方形,由5X5探色模

55、块、3X3浅色模 块以及位于中心的1个深色模块组成。校正图形的数量视QR码符号的版本号而定, 版本2 (含版本2)以上的符号均有校正图形,校正图形从条码符号的左上角到右下 角沿对角线两边对称地分布。校正图形应尽可能均匀地排列在定位图形与符号的相对 边之间。编码区域编码区域包括表示数据码字、纠错码字、版本信息和格式信息的符号字符。空白区QR码符号的空白区为环绕在符号四周的4个模块宽的区域,其反射率应与浅色 模块相同。2.4条型码与其它自动识别技术自动识别技术近几十年在全球范围内得到了迅猛发展,初步形成了一个包括条码 技术、磁条(卡)技术、光学字符识别、射频技术、声音识别等集计算机、光电技术、 通

56、信技术为一体的高新技术学科。们的作用是确定符号的密度和版本,提供决定模块坐标的基本位置。条码技术能在商品、工业、邮电业、医疗卫生、物资管理、安全检查、餐旅业、 证卡管理、军事工程、办公室自动化等领域中得到广泛应用,主要是由于其具有高速、 准确、成本低、灵活、可扩展等特点。另外,与其他常见的识别技术相比,在抗磁力、抗静电、影印性、 性、容量等方面都有比较突出的优势。二维条码最大的竞争对手是RFID(射频识别系统),二维条码技术与RFID技术相 比,最大的优点在于二维条码与一维条码技术一样,基本上是无成本的,多数条码扫 描寿命结束时可以扔掉而RFID标签的成本相当髙,一般不能随意扔掉,RFID还有

57、 一个致命的缺点,它会不时地发出射频信号,从而可以得知用户的所在,不利于用户 保有个人的隐私。二维条码可以作为移动商务的电子凭证,这是RFID做不到的。RFID 既然是标签,只能应用在实物上。另外,声音、视觉等识别技术目前不如条码技术成熟,其技术和应用的标准也还 不够健全。当然,由于几种自动识别技术各有特点,在实际应用时,根据不同场合分析具体 情况,综合比较,全面考虑。第三章二维条码图像的预处理过程我们在前面的章节提到,传统译码过程是采用模拟方式来解译条码所代表的信 息,而图像方式在条码采集中的应用,将是一个必然的趋势。这里我们采用数字图像信号处理的方法实现译码。包括图像的预处理过程以及译 码

58、过程两个主要部分。图像预处理部分的基本流程主要为:图像灰度化、中值滤波、图像二值化、图像 定位、图像分割、图像旋转。手机的摄像头采集QR码图像会产生不同的失真,例如对于系统获取的原始图像, 由于噪声、光照等各种原因,图像的质量不高,在译码前必须对图像进行降噪、二值. 化、图像旋转等等一系列操作。因此条码图像的预处理在整个条码识别系统中起着非 常关健的作用,直接影响着系统的性能指标,是手机准确读取QR码的有效保证。其 基本思路是:1、首先对釆集的彩色图像进行灰度化:2、然后对灰度图像进行滤波;3、之后用适当的阈值对灰度图像进行二值化,得到二值图像;4、接着在二值图像中扫描位置探测图形;5、通过三

59、个位置探测图形,求出条码的旋转角度和条码的四个顶点坐标(xl,yl), (xly2), (x2,yl),(x2y2);6、然后把图像旋转到水平;7、最后,把条码从图像中分割出来。3.1图像的灰度化彩色图像的灰度化技术在现代科技中有着越来越广泛的应用。在我们的识别系统 中,完全可以应用这种技术将采集到的彩色图像转化为灰度图像。由于QR码仅包含 黑、白两色的有效信息,那些冗余的彩色信息对于条码识别不仅起不到任何作用,通 过彩色图像的灰度化_缩小了图像的存储空间,减少了图像处理时间,提高了后续算 法速度,所以先进行彩色到灰度的转换,使系统达到更为理想的要求。彩色图像的像素点是由R(红色)、G(绿色)

60、、B(兰色)三元色按不同的比例混合而 得。混合而成的不同含量的R、G、B组成不同的颜色,每一个记录单个像素的位数据 单元可表示任意一种颜色模型公式为:C=xR+yG+zB (x+y+z=l)。灰度图是指仅包含亮度信息,不包含色彩信息的图像,亮度由暗到明,变化是连 续的。计算机中表示灰度图是把亮度值进行量化等分成0255共256个级别,0最暗(全 黑),2M最亮(全白)。在RGB模型中,如果R=G=B,则颜色(R,G, B)就表示灰度色。一般手机的摄像机拍到的图像是24位真彩色图,所以应先转化成灰度图,以便 于后续的更快速的图像处理。灰度化可以采用现行标准的平均值法,用g表示灰度化 后的值,R、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论