如何将图片转换为文字_第1页
如何将图片转换为文字_第2页
如何将图片转换为文字_第3页
如何将图片转换为文字_第4页
如何将图片转换为文字_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、如何将图片转换成文字用OCR软件用就fice 200嫖砸片帼文字第歩制需要安缓Miciosoft Office Dacument In莓in/的粗件】点分始程序"、在Micxasaft Offic e工具”里点“ Itciosoft Office Dgmg Imaging 即可安装运伉第二步打开萌文字的图片韓刑蒔,阔備望挪師而虾腱盘上的抵疇轆(FnntScieen)进 行屏銅第三歩打荆i敗曲Office tad MS ,将刚才幅OSffiO总点击收甲 稱中的 W ,在安菇 Microsoft Office Docwnt 11铭iig粗件后、系城会自丽 爰藍'彳喀为 aIicr

2、osaft Office Document Dating Wi +erv 的打WtlU 在"打E0tir 下拉列裘框中5 ffNicrosofi Office Document Intagiiig fciierff 打印机具他选 顶无须挪卜设貫,点击彌起按踊話定廉文件輪出附路龈乂件名(鹅便縣文悴),然識賊可以自 动生威-1ID略式版档了.打ffftl才僻諭皿翹文件帥副所示).根辭曲勰用鼠爾文義 儀选中脑容在艷的框内)- 然后单協标石鼬在黜脚賤菜单中选挥幣文本強至帕/(嗣般片鳩自赭脱LbW恤换 档,删就可处恤鳩中随心所欲附孵这躺了.际如劭不想歸换册内容输入到一个腑 嗣文档屯帀是希觀斓-

3、个圏丁开的恤収省只需远觸作中点击右潑单扩塡制J然后翻 指定蜩中执行粘啸呵用X2QC3提觇图片中的文宇第一步我们需姜安装Office lacumeikt Lu胡im尹的爼件* 点“幵皓序"> S wHidrosoft Office 工具 h 里点“ Mi cxosoft Offi ct Ddciment Trn-gi ng99 即可安装?Efj.第二步打齐芾有左字的图片或电子书箔等,找刘你希望提取的页面,按下龍畫上的打闭屏( Fr in日常工作中,有大量的 JPG或BMP格式的图片当中包含着文字与表格,如果需要将它们转换为WORD格式,则需要专门的 OCR软件,如果没有的话,那就

4、需要自已一个个字的 打出来,浪费了大量的时间和精力,现在我们只要使用微软OFFICE2003版软件的话就没必要这么辛苦了。具体操作过程如下: 首先手头要有一张 JPG或BMP格式的图片,我使用的图片如下图2005年度销售情况兴达公司在找审年度共计销售额为30亿元人民币'其中外 汇收入5壬互元人民币,均比上一年度有了大幅度的提高, 以下为销售情况表,单位:亿元地区'金额卢华东区9 口华南区户9呑西南区*2卩华中区Q5 口东北初西北区*2卩软件将其打开。如下图用 OFFICE 软件中的 MICROSOFT OFFICE PICTURE MANAGER® li crosof

5、 t Off ice F i st n r e lajiager2005年度销售情况口未命岛bmp樊童:ENF国像丈小.L.OZ ME尺寸:643 x 559煤索兴达公司在200?年度共计销售额为汇收入、壬忑元人民币,均比上一年度有了大幅度的提髙,以下为销售情况表.单位:亿元H|甲Jit,地区相金额卩华东区.9卩华南区西南区2华中区门5卩东北心3口西北区。2心去前护ibrnT显示比例:2J-4&Microsoft 0££ic&.点击导出图片按扭,在以此文件格式导出”处将格式改为,TIFF TAG图像文件格式(*.tif), 点击确定,将格式改为 tif格式。

6、然后用 MICROSOFT OFFICE DOCUMENT IMAGING 软 件将此tif格式文件打开,点击将文本发送到 WORD按钮,出现下图,并在版式选项中的在 输出时保持图片版式不变选项去勾,按确认键。如下图lUMHU iimm山1川川工件迥褊鍋址)观图世)汇收入5以下为销华东区门华南区门华中区门西南区an显示出例I;型鋤雪笹页面:|1二冬Q莹盏夕莎圏國凰2005年度销售情d兴达公司轉黠料加将下列已识别的立本箫加到新的Microsoft Ttford文档-当前选择范围【所睡页0区I©所有页面履式选顼涟霜出时紀死片烦式芹要帀并 II»UVH WI IB Iflimil

7、 IT默认文件典C" Documents and Set面'浏览确定7牙蘇俸Q'Mi crcsif t Ot'fLc&.兽|1茉命常tif - Mi c.-.经过ORC转换成 WORD。如下图魁未命名hl-li crosoft TordS文件电編辑 视11电)播入 格式© 工具电)夷榕将口迦 帮肋<J旦丛M J令I 出吟痙 艶岂普通网站八衲 卜四24 律 £ 凸 1012141& IS 2C 224363C 323+36404£44-46200多年度销售情况4-1兴达公司在加05年度共计销售额为30记元人民币

8、,其中外i匸收入5王点元人民币.均比上地区,P全额十华东区.9、户华南区、-9、门西南区、J2、p华中区、J护呪J东北、Q3 、 Q西北区,;2 , p育回目:善舉1 <;莲欝 < |自选勰QD” 筑口。喪朋翅总曲国=宗芸电(jjj 昜 !&. *® Mi .:!.:. si ft Gffj.-/ 銷未命念.ti* - . .&,' 3. JfG i 画圉 1B| 魁耒二 页甘、弐 q上二已二英诺庚园)直这样,一个从图片转换为文字的过程就基本完成,现在只要修改一下辨认不是很精确的部位就可大功告成了。另注,如果你的画图中有 TIF格式,可把图片格式直

9、接转为 TIF格式,然后用MICROSOFTOFFICE DOCUMENT IMAGING软件转换为 WORD 格式。1图片转换文字软件http:/www.3339.c n/dow n/view.asp?id=12尚书文字识别系统本软件系统是应用 OCR ( Optical Character Recognition )技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入 需求。本

10、软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。识别字符简体字符集:国标 GB2312-80的全部一、二级汉字 6800多个。纯英文字符集。简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和 GBK汉字。识别字体种类能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混 排。识别字号初号小六号字体。表格识别可以自动判断、拆分、识别和还原各种通用型印刷体表格。可支持繁体WINDOWS系统首先,尚书七号开始将整个OCR的过程,明确化了,通过程序的菜单,我们就能够知道整个OCR的过程,主

11、要分为:文件”编辑”识别” 输出在文件菜单中,您可以调用扫描仪,或者选择将已经扫描好的图像文件打开。得到图像文件后,用户开始的工作,就是编辑 菜单里面所提示的:图像页面的处理,其中包括图像页的倾斜校正(提供自动和手动实现方法),旋转等功能。处理完毕后,就可以进入识别过程”该过程关键的是 版面分析”现在尚书七号的自动版面分析功能很强,面对报纸杂志等复杂情况的版面,也是分析的正确率很高。 不再需要我们在尚书六号里面那样的建议手工划识别范围。也正是这点,大大降低了使用者的工作量。为了方便,识别”菜单下,也提供了用户自己在自动版面分析后,通过修改识别范围框的属性,来决定需要识别否的功能(默认的情况下,图象属性的栏目是不用识别的。当然,如果用户还是习惯原来尚书六号那样,自己来设定识别区域,只要直接用鼠标划框就可以了。接下来,用户就可以直接选择 开始识别”的按钮了,等待识别的结果。2文字图画V

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论