LeadTools图像处理开发教程(7):使用OCR识别图像中的中文_第1页
LeadTools图像处理开发教程(7):使用OCR识别图像中的中文_第2页
LeadTools图像处理开发教程(7):使用OCR识别图像中的中文_第3页
LeadTools图像处理开发教程(7):使用OCR识别图像中的中文_第4页
LeadTools图像处理开发教程(7):使用OCR识别图像中的中文_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文将为大家介绍:LeadTools识别一页或多页文档的一般步骤概述使用LeadTools创建“使用OCR识别图像中的中文”应用程序的具体步骤LeadTools识别一页或多页文档的一般步骤1选择您将要使用的引擎类型,并创建一个IOcrEngine接口实例。更多信息,可参考创建OCR引擎实例。2使用IOcrEngine.Startup方法启动OCR引擎。更多信息,可参考启动和关闭引擎。3创建一个一页或多页的OCR文档。更多信息,可参考处理OCR页面。4域,都是可识别的。)更多信息,可参考处理OCR区域。5可选。设置OCR引擎正在使用的语言(默认为英文)。更多信息,可参考处理OCR页面。6OCR拼写字典。7区域,这些选项是需要的。更多信息,可参考识别OCR页面,OCR识别模块概述and在LEADTOOLS.NETOCR使用OMR。8识别。更多信息,可参考识别OCR页面。9参考识别OCR页面。10当结束时关闭OCR引擎。更多信息,可参考启动和关闭引擎.步骤4、5、6、7可以以任意顺序执行,只要它们在OCR引擎启动后、识别页面前执行了即可。创建“使用OCR识别图像中的中文”应用程序的具体步骤OCR您需要下载LeadTools全功能试用版。安装全功能试用版后,由于此应用程序要识别中文,因此在创建应用程序之前,您还需要下载安装LeadToolsOCR语言扩展包。安装完OCR语言扩展包,我们就可以开始创建“使用OCR识别中文”的应用程序了,我们将最终的识别结果保存为.docx格式。1.打开VisualStudio.NET。点击。打开新建项目对话框后,在模板中选择“VisualC#”,随后选择“Windows窗体应用程序”。在名称栏中输入项目名称“SampleOcrChinese”,并使用“浏览”按钮选择您工程的存储路径,点击“确定”。2.在“解决方案资源管理器”中,右击“引用”,选择“添加引用”。根据当前工程的Framework版本和生成目标平台,选择添加相应的LeadTools控件,例如工程中的版本为Framework4.0、生成目标平台是x86,则浏览选择LeadtoolsFor.NET文件夹”<LEADTOOLS_INSTALLDIR>\Bin\DotNet4\Win32”,选择以下的DLL“:Leadtools.dllLeadtools.Codecs.dllLeadtools.Codecs.Bmp.dllLeadtools.Codecs.Cmp.dllLeadtools.Codecs.Fax.dllLeadtools.Codecs.Tif.dllLeadtools.Forms.dllLeadtools.Forms.DocumentWriters.dllLeadtools.Forms.Ocr.dllLeadtools.Forms.Ocr.Professional.dllLeadtools.WinForms.dll点击“确定”按钮,将以上所有的DLL添加到应用程序中。注意:添加Leadtools.Codecs.*.dll引用后,可使用BMP、JPG、CMP、TIF和FAX图像文件格式。如果您想使用更多的文件格式,可添加相关文件格式的codecDLL至应用程序。3.拖拽5个button控件至Form1。Button的名称默认为“button1,button2…”,根据以下表格修改相应的Text属性:NameTextbutton1启动OCR引擎button2添加页面button3删除页面button4识别文档(中文)并保存为Wordbutton5关闭OCR引擎4.将Form1切换至代码视图,将以下代码添加至using部分:1:usingLeadtools;2:usingLeadtools.Codecs;3:usingLeadtools.Forms;4:usingLeadtools.Forms.DocumentWriters;5:usingLeadtools.Forms.Ocr;6:usingLeadtools.ImageProcessing;7:usingLeadtools.WinForms;5.将以下私有变量添加至Form1类:1:privateIOcrEngine_ocrEngine;2:privateIOcrDocument_ocrDocument;6.将以下代码添加至Form1的构造函数:1:InitializeComponent();2://解锁OCR功能,用您的密钥替换此处3:stringMY_LICENSE_FILE=d:\\temp\\TestLic.lic";4:stringMY_DEVELOPER_KEY=xyz123abc";5:RasterSupport.SetLicense(MY_LICENSE_FILE,MY_DEVELOPER_KEY);6://初始化OCR引擎7:_ocrEngine=OcrEngineManager.CreateEngine(OcrEngineType.Professional,false);7.将以下代码添加至button1(启动OCR引擎)按钮的Click启动OCR引擎,在此部分将识别的语言设置为中文简体:1://启动OCR引擎2:null,null,null,@"D:\LEADTOOLS18\Bin\Common\OcrProfessionalRuntime");3://创建文档4:_ocrDocument=_ocrEngine.DocumentManager.CreateDocument();5://将语言设置为中文简体,中文繁体为"zh-Hant"6:newstring[]{"zh-Hans"});7:MessageBox.Show("OCR引擎成功启动");8.将以下代码添加至button2(添加页面)的Click句柄中,将单页图像文件添加至OCR文档:1:stringfileName=Path.Combine(Application.StartupPath,@"..\..\Pic\chineseImage.bmp");2:3://将包含中文字符的文件添加至OCR文档4:IOcrPagepage=_ocrDocument.Pages.AddPage(fileName,null);5:intpageCount=_ocrDocument.Pages.Count;6:////显示此页面的相关信息7:stringmessage=string.Format(8:共{0}页\n最后添加的页面大小={1}*{2}\n分辨率={3}*{4}\n每个像素的位数={5}\n",9:pageCount,10:page.Width,page.Height,11:page.DpiX,page.DpiY,12:page.BitsPerPixel);13:MessageBox.Show(message);9.将以下代码添加至Click句柄,从OCR文档中移走了所有页面:1://从OCR文档中移除所有添加的页面2:_ocrDocument.Pages.Clear();3:MessageBox.Show("所有页面已被移除");10.将以下代码添加至button4(识别文档(中文)并保存为Word)的Click句柄,识别文档中的中文字符,并将识别的结果保存为Word文档:1://识别所有页面2://注意,我们不需要调用AutoZone,引擎会检查页面是否被分区,若无,则会自动分区3:null);4://将结果保存为Word文档5:stringwordFileName=Path.Combine(Application.StartupPath,..\..\Result\Result.docx");6:_ocrDocument.Save(wordFileName,DocumentFormat.Docx,null);7://显示我们刚刚保存的word文件8:System.Diagnostics.Process.Start(wordFileName);11.将以下代码添加至OCRClick句柄,关闭OCR引擎:1://释放此文档2:_ocrDo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论