


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、VC多特征提取的手写汉字识别算法及实现+答辩PPT VC多特征提取的手写汉字识别算法及实现+答辩PPT摘要该文提出了一种基于多特征提取的手写汉字识别算法及其实现。该算法同时运用了基于统计特征和基于结构特征的汉字识别算法,并对以上两种算法做了适当的改进。算法在匹配判别阶段采用了分类判别思想,在汉字图像输入的同时,记录汉字图像的输入结构特点,在此基础上得到输入的未知汉字的笔划特征,由笔划特征即可对未知汉字做粗分类,这样可以缩小判别时的汉字范围。经过汉字粗分类后,提取整个汉字图像的统计特征,该步骤采用了网格划分方法,即先对图像做划分,再计算每一网格内文字
2、相素与整个图像中文字相素的比值,通过这些特征对文字图像做细分类即可得到识别结果. 基于多特征提取的识别算法对汉字的识别十分有效,能使识别率达到90%以上,该文同时也给出了对书写不规范的字的解决方案。关键词:文字识别,特征提取,模式匹配,模式识别ABSTRACT The article proposes an algorithm for hand-written Chinese character recognition and its realization . The algorithm is based on the multi-characteristics, i
3、t unifies and improves the algorithm based on the statistic characteristic and the algorithm based on the structure characteristics. The algorithm adopts the classified distinction through the match distinction stage. It takes down the character images input unique feature when the image input
4、. With the input unique feature, it can obtains the pen delimits characteristics of the unknown character image. The first classification can be managed based on these steps, thus the range of the second classification will smaller. After the first classification, it must withdraws the statistic cha
5、racteristics of the image. The algorithm adopts the grid division method in this step. It makes a division to the image and then compute the element ratio of every areas. As a result, the character image can be recognized by the steps above. The recognition algorithm based on multi-characteris
6、tics is extremely effective to the Chinese character recognition.The recognition rate can achieves above 90% .This article also provide methods for the characters written standardless. Key words: Writing recognition, Characteristic withdraws, Pattern matching, Pattern recognition世界上的文字有两大类,一种是
7、拼音类文字(如英文),另一种是象形类或图形类文字(如汉字)。在人机交互中,拼音文字显示出了极大的优越性,利用键盘可以把一个个字母很自然很方便的输入计算机,而对与图形类文字,一直没有适当的输入设备。从80年代开始,微机大量地进入我国,许多用于中文信息处理,但输入设备仍然只是键盘,为了将汉字输入计算机,涌现出了各种各样的汉字编码方案,所谓编码方案就是通过人为的规则,把汉字转换成字符或数字以方便利用键盘输入。利用编码方案进行汉字输入需要记忆,这给计算机在生活领域的普及带来了很大的不便,利用西文键盘输入汉字的限制成了计算机普及应用的瓶颈和桎酷。随着科学技术的发展,人们意识到要用图形输入设备输入汉字,输
8、入后由计算机自动识别并转化成内码,至于计算机怎样把输入的汉字图像识别出来,就是汉字识别技术。无耻悲鄙下流的网学,网总是抄六,维'论文'网 从学科上来说,汉字识别属于模式识别与图像处理的范畴,还涉及到人工智能、形式语言与自动机、统计决策理论、模糊数学、信息论、语言文字学、计算机科学等学科,是一门综合性技术科学。由于汉字数量多,结构复杂,相似字很多,所以汉字识别是难度较大的文字识别。近年来,随着模式识别技术及计算机科学技术的发展,汉字识别也取的了极大的进展。汉字识别的基本过程包括汉字输入、预处理、特征提取、分类识别、识别后处理五个大步骤。
9、0; 根据识别对象的不同,汉字识别分为手写体汉字识别和印刷体汉字识别两种,前者因为各人的书写习惯不同和手写汉字变化太大而显的比较困难,后者要相对容易一些。 在手写汉字识别这个范畴中,根据汉字输入方式不同又可以分为联机手写汉字识别和脱机手写汉字识别。通俗地讲,联机手写就是在书写的同时,根据笔划顺序等特征对汉字进行识别,该技术较多地应用在汉字输入设备如手机的手写板中。与联机手写汉字识别不同,脱机手写汉字识别主要是多一副汉字图像进行分类识别,多用于签名识别,笔迹鉴别等领域。 汉字识别应用在以下几个方面:论
10、文网(1) 使汉字高速自动地输入计算机,以彻底解决汉字信息处理系统中手动输入效率底这个关键 (2) 办公自动化和下一代印刷技术的文字信息自动输入。(3) 做为新一代计算机智能接口的重要组成部分 (4) 汉字文本高倍压缩存储和传输。 下面讲述汉字识别的研究现状和发展前景。汉字识别研究始于20世纪60年代,当时大多数文字识别研究者都集中在英文印刷体文本识别,美国科学家Casey和Nagy率先进行印刷体汉字识别的研究工作,并于1966年发表了第一篇有关汉字识别的论文,随后在这个领域有了大量的研究,这些严重主要是在
11、亚洲进行的,如日本、中国大陆、台湾等地。 我国在70年代末开始了汉字识别的研究工作,到现在关于这方面的研究非常活跃,有些产品已经进入市场。眼下印刷体汉字识别系统对实际文本的识别率一般达94%98%,识别速度为510字每秒;联机手写汉字识别系统的识别率最高可大95%;脱机非特定手写汉字识别率最高达85%,速度为1字每秒;脱机特定手写汉字的识别率85%93%,速度35字每秒;其中前两个已经达到实用化要求,台湾的研究水平与大陆相当,日本的研究水平比大陆稍高。无耻悲鄙下流的网学,网总是抄六,维'论文'网 从总体来说
12、,汉字识别技术的广泛应用将产生一个新的产业,而这个产业将覆盖社会生活的各个方面,从笔式电脑到办公自动化设备,从邮政信函的自动分拣到各种表格的自动录入,从证件识别到证券识别,从自动阅读机到智能视觉系统。而与汉字识别密切相关的笔迹鉴别设备将会广泛应用于银行、保安等部门。 汉字识别最直接的用途是汉字输入。针对我国汉字录入的现状,汉字识别技术能很好地满足不同层次的单位、个人需要。对有大量汉字录入任务的单位如报社、出版社、印刷厂等,一方面可以大幅度提高汉字输入的效率,建设汉字输入时间,另一方面还能缩小庞大的录入员队伍及相应的设备。
13、汉字识别的另一大用途是在笔式电脑中。笔式电脑没有键盘,用笔进行输入和操作。该设备的一个技术关键是联机手写字符识别技术。笔式电脑是计算机发展的一个重要趋势。目前已经有多中英文笔式电脑产品。笔式电脑的市场前景很大,据IDG预测,到1966年,英文笔式电脑的全球销售量将达到500万台。中文笔式电脑的市场前景同样也是十分巨大的,所以汉字识别技术的研究十分重要。 邮政信函的分拣也是汉字识别技术应用前景看好的领域,目前我国使用的邮政信函分拣机是依据邮政编码的,也就是手写数字识别。但是单纯基于邮政编码识别的正确分拣率只能达到30%左右,所以手写汉字识别技术将使邮政信函的分拣更加完善。表格信息自动录入也是汉字识别技术大有可为的方向。表格信息的自动录入需要印刷体汉字识别技术、脱机手写汉字识别技术及手写数字识别技术。同样地汉字识别技术还将应用于证件识别和证券识别、智能计算机的智能接口和视觉系统、笔迹鉴别
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年河北唐山芦台经济开发区事业编制教师人员考试真题
- 洗衣机漏水的排查与修复考核试卷
- 电子书自助出版平台的发展与挑战考核试卷
- 相机行业法规与标准解读考核试卷
- 美容仪器智能化控制系统设计方法研究考核试卷
- 美德少年主要事迹(19篇)
- 石材开采作业人员培训与考核试卷
- 纺织品零售市场法律风险防范考核试卷
- 2025高校教师培训学习心得体会(4篇)
- 玻璃制品高温退火工艺考核试卷
- 第四单元-植物细胞工程(教师版)高二生物单元复习知识清单
- (2025)入团考试题库及答案
- 扫描电子显微镜(SEM)-介绍-原理-结构-应用
- 车厢定做合同范文大全
- 《地质灾害监测技术规范》
- 节能环保产品推广与销售代理协议
- 普通地质学知到智慧树章节测试课后答案2024年秋临沂大学
- 2024年长安汽车行测笔试题库
- 2024年度一带一路贸易促进与合作合同2篇
- 临床试验项目质量管理
- 铁路危险货物运输管理企业运输员培训
评论
0/150
提交评论