![基于方向投影和类内散度的ocr构件象斜角度检测算法_第1页](http://file4.renrendoc.com/view/8a7075e8824072017a9ce2e30442d31c/8a7075e8824072017a9ce2e30442d31c1.gif)
![基于方向投影和类内散度的ocr构件象斜角度检测算法_第2页](http://file4.renrendoc.com/view/8a7075e8824072017a9ce2e30442d31c/8a7075e8824072017a9ce2e30442d31c2.gif)
![基于方向投影和类内散度的ocr构件象斜角度检测算法_第3页](http://file4.renrendoc.com/view/8a7075e8824072017a9ce2e30442d31c/8a7075e8824072017a9ce2e30442d31c3.gif)
![基于方向投影和类内散度的ocr构件象斜角度检测算法_第4页](http://file4.renrendoc.com/view/8a7075e8824072017a9ce2e30442d31c/8a7075e8824072017a9ce2e30442d31c4.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于方向投影和类内散度的ocr构件象斜角度检测算法
0ocr证件的制作orc证书技术是现代证书技术与orc技术的综合集成的结果。orc证书的证书称为orc证书。orc证书主要是关于身份的文件,通常是一次性的,并且信息不会被重写,如护照、身份识别、身份等。orc证书技术研究的主要内容包括orc证书的编制工艺和发布顺序。orc证书信息的采集设备适用于orc证书信息的采集系统。在orc证书信息读取软件中,斜率图像校正是一项重要的预处理技术。在扫描orc证书时,图像不可避免地会倾斜。准分析和orc-s型算法对图像的倾斜特别敏感。因此,斜率校正是orc证书图像预处理的重要组成部分。OCR证件一般有两行专门用于机读的OCR字符,可以利用OCR字符的信息来进行倾斜角检测.针对含有OCR字符的OCR证件图像,提出了一种新的倾斜检测算法.该算法用不同倾角的扫描线对图像进行扫描,计算出扫描线方向的投影,在方向投影中寻找字符行类的最小类内散度值,再在所有类内散度最小值中寻找最小值,该最小值对应的方向投影的扫描线方向即为OCR证件图像的倾斜角度.在计算投影时,采用基于整数Bresenham画直线的算法,对扫描线的角度步长采用由“粗”到“精”的分级方法.这些手段使得本算法具有更高的速度.实验表明,该算法是有效可行的,同时具有很好的检测精度和速度.1方向投影和类内散度的计算1.1brchenha算法20世纪60年代,Bresenham提出了一种使用整数计算就能快速画线的方法,称为整数Bresenham算法.这种算法虽然在概念上仍是基于X、Y轴方向坐标改变的比率,但不需要乘法和除法,也不需要进行浮点运算,因而算法速度很快.对于光栅直线来说,线条上每点的位置并非实际像素位置,而是它们的最佳近似位置.假定直线的斜率在0~1之间.Bresenham算法设置了一个决策变量dk,当dk大于等于0时,Y坐标就增加1,当dk小于0时,Y坐标就保持不变,dk根据dk的正负重新设置.Bresenham算法的思路如下:1)初始化:dx=x1-x0,dy=y1-y0,x=x0,y=y0;2)决策变量dk初始化:dk=2×dy-dx;3)确定下一点,同时修正dk:dk<0,则取(x,y)=(x+1,y),dk=dk+2×dy;dk>=0,则取(x,y)=(x+1,y+1),dk=dk+2×dy-2×dx本文用不同倾角的扫描线对二值化的OCR证件图像的OCR字符区域进行扫描.当沿一条扫描线计算方向投影时,利用整数Bresenham画线的算法,判断扫描线经过的图像点位置是否为黑像素,并沿扫描线累加它所经过的黑像素数目,得出该条扫描线对应的方向投影值.图3为倾角分别为0°和1.7191°对图2的OCR字符区域扫描的方向投影.1.2类内散度的计算检测OCR字符的倾角,就需要寻找一个最佳的扫描倾角,使得两行OCR字符在这个倾角扫描下的方向投影空间能分开得最好.要使两行OCR字符分开最好,就需要代表两行字符的两类的总类内散度值最小.在一维方向投影Y空间的类内散度计算如下:(1)计算两行字符类的均值m∼im∼i:m∼i=1Ni∑y∈Yiy,i=1,2m∼i=1Νi∑y∈Yiy,i=1,2(2)类内散度和总类内散度:S˜2i=1Ni∑y∈Yi(y−m∼i)2,i=1,2S˜w=S˜21+S˜22S˜i2=1Νi∑y∈Yi(y-m∼i)2,i=1,2S˜w=S˜12+S˜22图4为图2的ORC字符区域在不同倾角扫描的方向投影的最小类内散度曲线,横坐标表示倾角,纵坐标表示不同倾角的方向投影的最小类内散度.扫描倾角范围[-0.3,0.3],倾角之间的间隔为0.005rad.2最小类内散度曲线基于方向投影和类内散度的OCR证件图象的倾斜检测算法思路:以不同扫描角度扫描OCR字符区域,形成多个方向投影空间;在各个方向投影空间上寻找两个字符行类的最小总类内散度;以各个方向投影空间的最小总类内散度形成最小类内散度曲线;在最小类内散度曲线上寻找最小值,得出该最小值对应的方向投影的扫描角度即为图象倾斜角度.图4中类内散度曲线的最小值对应的角度即为OCR证件图象的倾斜角.在计算投影时,采用基于整数Bresenham画直线的算法,对扫描线的角度步长采用由“粗”到“精”的分级方法.该算法分为两个步骤:先粗检测和再精检测.(1)计算最小类内散度(a)初始化:最小扫描角Angle-Min,最大扫描角Angle-Max,角度步长Angle-Step初始赋值.计算循环次数total-circle=(Angle-Max-Angle-Min)/Angle-Step,分配最小类内散度数组Array-Min[1…total-circle];(b)计算方向投影和类内散度,并且求取最小类内散度曲线:fori=Angle-Min,j=0;i<=Angle-Max;i=i+Angle-Step,j=j+1{应用Bresenham算法计算倾角为i的方向投影;计算倾角为i的方向投影的类内散度,并且求取最小类内散度值,结果保存在Array-Min[j];}(c)寻找Array-Min数组的最小值,记录最小值在数组中的位置,结果保存在变量Loc.(2)类内散度分值的计算精检测的过程与粗检测完全一样,只需要重新初始化.初始化:Angle-Min=(Loc-1)×Angle-Step+Angle-Min,Angle-Max=(Loc+1)×Angle-Step+Angle-Min,Angle-Step=Angle-Step/Scale,其中Scale为缩放系数,循环次数和类内散度数组的计算同粗检测的初始化一样.重复步骤(1)的(b)和(c),OCR证件图象的倾斜角度Angle=Loc×Angle-Step+Angle-Min.3实验结果和分析对图2的签证图片进行倾斜角度的检测和校正.先对图1的签证进行OCR字符区域的定位和截取,得到图2中的OCR字符区域图片.在实际应用中,OCR证件的倾斜角度一般不会很大,粗检测的扫描角度范围设为[-0.3,0.3]rad,角度步长设为0.05rad,精检测的角度步长设为0.005rad,最终检测的性能数据见表1第1项.使用Photoshop软件的画布旋转命令对图2顺时针旋转1.7191°,旋转结果见图5.对图2加10%的高斯噪声,使用相同的二值化算法和相同的检测参数,实验结果见表1第2项.使用本算法对护照图象和增加10%高斯噪声的护照图象的倾斜角度进行检测,二值化算法和检测参数与前述一致,实验结果见表1第3项和第4项,旋转结果见图6(b).实验结果表明,本算法对OCR证件图象的倾角检测是可行的,并且达到一定的检测精度和较快的检测速度,同时在一定的噪声情况下,最小类内散度和检测时间有所增加,但检测的倾角不变,说明该方法有一定的抗干扰能力.4检测精度分级方法的展望上述实验结果表明,基于方向投影和类内散度的OCR证件倾角检测算法是有效的,该算法对扫描线的角度步长采用由“粗”到“精”的分级方法,能达到很高的检测精度和较快的检测速
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度建筑工程施工安全责任保险合同
- 2025年度海洋工程劳务承包合同模板
- 2025年度新能源车用锂电池研发借款保证合同
- 气模鼓风机项目融资计划书
- 金华浙江金华永康市信访局编外工作人员招聘笔试历年参考题库附带答案详解
- 金华浙江金华市技师学院招聘编外工作人员8人笔试历年参考题库附带答案详解
- 贵州2025年贵州省工业和信息化厅所属事业单位招聘1人笔试历年参考题库附带答案详解
- 舟山浙江舟山市普陀区档案馆(区史志研究室)招聘劳务派遣工作人员笔试历年参考题库附带答案详解
- 聊城2024年山东聊城阳谷县第二批招聘教师70人笔试历年参考题库附带答案详解
- 湛江广东湛江市清风苑管理中心招聘事业编制工作人员10人笔试历年参考题库附带答案详解
- GB/T 9386-2008计算机软件测试文档编制规范
- 2023年青岛远洋船员职业学院高职单招(数学)试题库含答案解析
- 2023年卫生院岗位大练兵大比武竞赛活动实施方案
- 2023年浙江省初中学生化学竞赛初赛试卷
- 辽海版小学五年级美术下册全套课件
- 专题7阅读理解之文化艺术类-备战205高考英语6年真题分项版精解精析原卷
- 真空泵日常操作标准作业指导书
- 2022年广东省10月自考艺术概论00504试题及答案
- 中国石油大学(华东)-朱超-答辩通用PPT模板
- 隧道二衬承包合同参考
- 空气能热泵系统
评论
0/150
提交评论