自动文档识别软件中文字增强和字符分割程序的设计_第1页
自动文档识别软件中文字增强和字符分割程序的设计_第2页
自动文档识别软件中文字增强和字符分割程序的设计_第3页
自动文档识别软件中文字增强和字符分割程序的设计_第4页
自动文档识别软件中文字增强和字符分割程序的设计_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、自动文档识别软件中文字增强和字符分割程序的设计一、 任务说明首先能够对位图形式的文档文件进行二值化、去噪声、斜度校正等图像增强处理,然后对提取出的字符版块进行行列切分。二、 设计方案采用VC编程软件设计一个自动文档识别仿真软件界面,采用切分窗口,将处理图像文件的过程清楚的展现出来,直观的显示字符识别的过程。三、 材料设备PC机、VC+6.0四、 综合总结1二值化二值化就是为了使整个图像呈现出明显的黑白效果,而让图像上的所有点的灰度值只用两种可能,不是“0”就为“255”。二值化的最终目的应为:原图像中反映图像结构的灰度值差别经映射后被保留,而不反映图像结构的灰度值抖动被消除,从而最终得到的只是

2、构成字符图像的关键信息。二值化的关键步骤是确定阈值,而确定阈值主要分为两种方法:定阈值法和自适应阈值。其中定阈值法思想简单,实现起来也比较容易。选一个经验灰度作为叛变门限如“128”,高于这个值的就认为是“255”既白色,低于这个值就认为是“0”既黑色。但这种办法局限性大,使用面窄。现实应用中,文件中的颜色千差万别,用定阈值的方法可能得到的结果就是黑黑的一片或者白茫茫一片。所以自适应的阈值选定法得到了更为广泛的应用和研究,算法专家学者提出了许多,但是跑不出一个重要的关键点那就是对直方图的应用。直方图是一种集合图形表,是根据图像中各个灰度的点的数量分布情况,以组距为底边、以频数为高度的一系列连接

3、起来的直方型矩形图。实际上就是利用了统计的思想,统计的越详细越好确定这个最优阈值。如图1所示,一般图像的得到的统计图如下图所示。可以看出较黑的部分和较白的部分中间行成了一个波谷,这个波谷的值就是阈值的最佳值。实际上自适应的方法全部是基于统计学的结果,其他的方法和这个类似。图1 双峰直方图2平滑去噪在图象的生成或传送的过程中,由于种种原因会包含物理上的噪声。当能够对这种噪声的产生机理进行数学上的模型化时,可以采取对应其模型的消除噪声的方法,但当不能进行模型化时,通过平滑(smoothing)使图像变得容易观看。平滑滤波技术用于平滑图像中的噪声,一般在空间域中进行,基本方法是求象素灰度的平均值或中

4、值。在3X3邻域平均法去噪中,对于给定的图像.f(x,y)中的点(m,n),取其邻域S;设S含有M个象素,取其平均值做为处理后所得图像点(m, n)处的灰度;用某象素邻域内各象素灰度平均值来代替该象素原来的灰度,即是邻域平均技术。邻域S的形状和大小根据图像特点来确定,一般取正方形、矩形或十字形等。S的形状和大小可以在全图处理过程中保持不变,也可以根据图像的局部统计特征而改变。点(m, n)一般位于S的中心。如3X3邻域,点(m, n)位于S的中心,则: (1.1)噪声与图像信息g(x,y)无关,含噪声图像f(x,y)可表示为: f(x,y)=g(x,y) +n (x,y)假设噪声n是加性噪声,

5、在空间各点互不相同,且期望为0,方差为,g是未受污染的图像,含有噪声的图像f经邻域平均化后为: (1.2)由上式可知,经过邻域平均之后,噪声的均值不变,方差变为,既噪声方差变小,说明噪声强度减弱了,即抑制了噪声。由上式还可以看出,邻域平均法也平滑了图像信息,特别是可能使图像目标区域的边界变得模糊。可以证明,对图像进行邻域平均处理相当于使图像信号通过一低通滤波器。下面的图2、图3可以看到滤波的效果。可以看到图2中的一写麻麻点点,基本上都消失了,图像显得更为清晰方便观看。图2 滤波前图3 滤波后3斜度矫正在由光输入设备得到文档图像的过程中,不可避免的会出现倾斜,因此一个好的OCR系统必须有倾斜校正

6、的功能,使系统能够忍受一定程度的倾斜。倾斜校正的过程由两步组成,第一步是对图像的倾斜角进行检测,第二步是根据检测到的倾角对图像进行旋转变换,使图象的倾斜得到校正。首先根据旋转的角度、图像对角线的长度计算旋转后的图像的最大宽度、高度,根据旋转后图像最大的宽度、高度生成新的缓冲区,假设图像的左上角为(left, top),右下角为(right, bottom),则图像上任意点(x, y)绕其中心(xcenter, ycenter)逆时针旋转angle角度后,新的坐标位置(x1, y1)的计算公式为:xcenter=(width+1)/2+left; (1.3)ycenter=(height+1)/

7、2+top; (1.4)x1=(x-xcenter)cos- (y - ycenter) sin+xcenter; (1.5)y1 = (x-xcenter) sin+ (y- ycenter) cos+ ycenter; (1.6)图4 倾斜校正旋转前图5 倾斜校正旋转后从这两张图的对比中可以知道,图像旋转之后尺寸是要比原图大的。这样做的好处是旋转后没有丢失任何信息。而与图像的镜像变换相类似,把原图中的象素值读入新缓冲区的(x1,y1)点处。在新缓冲区中与原图没有对应的象素点的值用白色代替。4版面分析版面分析实际上是个很复杂的环节,许多内容都可以包含到其中。是将扫描得到的图像,划分出每一个区域块。对于各个不同的区域块,也就是划分出我们所要识别的图像中文字所在的区域范围。版面分析分为自动版面分析和手动版面分析。简单的图像版式建议使用自动分析,报刊等复杂版式建议采用手动分析,以免遗漏所要识别的文字。而进行了大范围划分之后,就要进一步的把板块中的图与字分开了。并且要把字的行与行之间分割开来,这就是所谓的行分切。行分切后,接下来的就是字分切

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论