版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
OCR在各行业应用解决方案业务分析方案介绍优势和价值集团介绍业务分析3OCR是计算机视觉领域一项重要应用传统的OCR是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。随着人工智能技术的发展,OCR技术已经转变为利用深度学习技术对印刷体、手写体等各类光学字符进行识别。OCR(OpticalCharacterRecognition,光学字符识别)结构化存储比对搜索审核OCR自动化智能化OCR帮助企业实现数字化到自动化、智能化的转型。应用场景OCR能帮助企业解决什么问题客户业务数据员工简化客户录入操作加速业务办理流程提升客户体验提升业务效率辅助智能决策降低录入人力投入解放员工重复性劳动丰富数据资产提升数据质量增加数据分析维度检查您是否需要OCR解决方案前端业务人员(如客户经理、柜员)否需要在业务流程中手工录入文档?集中作业中心或运营部门是否有大量外包人力进行文档结构化录入?客户使用的APP端或网页端有需要上传文档的业务流程?业务流程中是否有需要人工审核的文档影像件资料?业务流程中是否有纸质文档和系统数据比对的需求?业务过程中会涉及外部机构模板的资料?……业务痛点随着业务量不断增长,文档资料数量爆发式增长,需要不断增加人力成本投入才能满足数据结构化的业务需求;人工长时间录入,出错率高,没有“两录入一校”的机制保障很难发现错误;错误的信息录入导致业务决策过程产生偏差或错误,影响客户体验甚至造成企业风险;客户在业务办理过程中操作冗烦,客户体验差甚至造成客户流失;员工每天需要投入大量时间和精力进行重复性劳动,造成工作意愿下降,产能低效;需求自检急需找到一种
“技术”替代“人力”的解决方案企业应根据自己的业务情况明确对OCR的需求类型开箱即用的模型应用可支持模型应用的平台可支撑企业自主构建多样化CV应用的开发平台Level1Level2Level3OCR需求场景少(个位数);需要简单、快速上线应用;企业自身应用开发维护资源有限;OCR场景众多,需要维护管理多个应用;业务规模持续增长,底层算力资源会持续扩展,需要有效的管理;企业研发资源有限,但具备足够的应用运维管理能力;图像定制化场景较多;按场景逐个采购外包服务建设,建设成本高、周期长;企业自身有较高的自主开发图像模型应用能力,需要灵活且开放的平台支持各类图像场景的研发;您需要的是什么样的OCR解决方案需求场景数量数据支持程度需求实现的优先级是否追求极致效果效率优先,快速上线梳理企业内OCR应用的需求和现状应用场景规划技术团队定位(自主研发/运维/项目管理)研发能力水平基础设施及架构支持情况选择与技术现状和未来发展相匹配的解决方案技术能力评估运营成本的节约人均效率提升带来的产能提升规模效应引起的质变业务收益TCO需求能力投入产出企业OCR建设要围绕着业务、技术、经济三方面因素进行综合考量,明确最佳的落地建设方案和路径。技术经济业务软件、硬件及服务综合成本外部厂商持续服务的成本自主研发的团队建设周期和人力成本方案介绍9OCR解决方案构成OCR解决方案模型产品服务模型面向特定业务场景的模型应用,快速识别非结构化的影像件文档内容并输出结构化数据,辅助业务流程的自动化智能化以及业务效率的提升;既支持通用的OCR场景应用,也可基于业务场景提供定制化的模型;产品支持各类OCR应用开发、上线、运维、管理的平台产品;针对本地化部署需求的客户提供更低TCO的软硬一体化产品;支持Saas服务,帮助开发者快速搭建OCR应用;服务联合优质合作伙伴为客户提供端到端的服务,包括数据标注、模型开发、应用开发、应用上线、模型调优、运维升级等;通过先进的产品及丰厚的技术沉淀帮助客户找到OCR应用建设的效率和效果的最佳平衡点;开箱即用的模型应用类型模型应用固定证件类身份证营业执照银行卡驾驶证行驶证户口本结婚证房产证……通用票据类发票火车票机票行程单……通用表格类企业财务报表……依托先进的算法和领先的技术,可面向各行业客户提供诸多通用的OCR模型应用。加强
合规管理提升
运营效率辅助风控审批决策面向各类定制化场景需求的端到端方案票据识别复杂表格识别信息提取及比对多版式内容识别合同/档案识别指定区域签名识别OCR定制场景示例支持各类OCR模型应用管理的综合型平台13标注信息可视化模型训练评价指标可视化模型训练结果可视化应用上线运维监控可视化可视化运维监控服务预估结果与统计123标注数据预览多种算法配置模式,满足不同用户需求数据预处理/算法参数配置/资源配置智能模式:根据用户数据集推荐最佳配置精调模式:提供可以该场景下可用的数据增强方法专家模式:全面开放高级参数,满足调参需求业界领先的深度学习算法库,内置多种深度学习模型,来应对不同任务场景下的特殊需求Resnet、Faster-rcnn、Densenet、CTPN…支持预训练模型,更快更好训练模型支持多种模型开发方式,实现开发效率和模型效果的最佳平衡模型开发流程1图片数据引入通用模型调用预估效果评估通用模型可
满足应用需求2数据标注训练数据引入算法组合调用模型训练通用模型不适用效果评估3数据标注训练数据引入算法组合调用模型训练基于已有模型增量训练提升效果效果评估样本扩充已有模型文件规则后处理规则后处理规则后处理示例1——开发固定证件模型以开发行驶证识别模型为例。识别区域识别内容编号4小型轿车编号5云A1W5K2编号9王白露编号11地址、电话∶云南省昆明市官渡区官渡街道办事处螺峰村六组122号393编号14室编号18福特牌CAF7152A1编号19非营运编号22LVSHFFAL7AN111097.编号273228229编号322017-11-10编号342010-12-2【基于流程一】直接使用通用模型进行预估,并基于通用模型产生的预估结果,编写简单规则,提取或简单加工目标识别内容并输出;上层规则开发工作量人天级即可完成。【基于流程三】假设通用模型+简单规则的效果不能达到业务高标准的预期,可采用增量训练方式提升效果。如果是定位的准确率需要提升,则基于少量行驶证数据(1000-2000)针对性训练定位模型即可。如果定位ok但需提升识别准确率,则训练数据量需要增加,但仍可调用通用算法快速完成训练模型。避免了模型开发从零开始,极大的降低了开发成本和时间周期。示例2——提取文档中的特定内容以某保险公司保单OCR需求为例,只提取保单号、险种、被保人ID、投保人ID四个字段。需求实现难点:保单板式各异,通过定义板式的方式去开发模型是不现实的。待识别内容所在的区域和位置不固定;客户场内无法提供大量样本训练;需求落地方式:【基于流程一】直接使用通用模型进行预估,并基于通用模型产生的预估结果,编写简单规则,提取或简单加工目标识别内容并输出;上层规则开发工作量人天级即可完成。面向不同需求的客户,提供多样的产品形态支撑提供各类支持本地化部署的OCR成熟应用产品体验试用Saas服务,可按查询收费开箱即用的模型应用可支持模型应用的平台可支撑银行自主构建多样化CV应用的开发平台Level1Level2Level3应用市场云Hyper
Engine图像应用上线、管理、运维平台利用平台底层算法自主构建各类OCR应用基于底层通用模型能力进行场景定制化和应用开发先知EE优势和价值19OCR解决方案优势低门槛快好省多基于通用能力快速开发上层应用短时间达到良好效果覆盖复杂多样的长尾需求软硬一体化方案降低客户TCO先进的方法论领先的技术丰富的实践积累通过大量项目积累,OCR解决方案方法论已走在同业前列基于强板式的OCR方法论VS基于弱板式的OCR方法论定义基于板式定义,对每个要素通过定位+识别满足特定应用场景的OCR需求。降低板式的依赖(理想状况部分场景可以不依赖板式),通过通用定位和通用识别算法支撑各类OCR场景应用优点数据足够的情况下效果可以做到极致新场景孵化、定制化需求实现成本低TCO低可以面向更多长尾场景需求缺点新场景孵化、定制化需求实现成本高灵活性不足TCO高海量数据支撑的情况下,单个场景上效果略差于传统OCR定制OCR解决方案为基于弱板式的方法论(部分场景甚至完全不依赖板式),通过沉淀底层算法能力支撑上层更广泛的场景应用和更精准的识别效果。基于先进的方法论,通过对底层能力抽象,各类应用场景得以快速更低成本落地板式识别通用印刷体识别通用手写体识别表格识别通用定位模型应用类型基础能力各行业需求场景图片分类固定证件识别票据/单据识别报表/表格识别开放长文本
识别……身份证、结婚证、军官证、户口本等各类身份证件营业执照银行卡发票银行流水企业报表……风控NLPCV-OCR能力图片清分(粗类、细类定制化)转账支票进账单各类业务凭证……运营合同内部文件发票……合规投研报告会议纪要物流单据医疗单据……其他OCR解决方案具有丰富的案例应用及突出的效果行业客户单据类型识别效果银行某国有银行转账支票个人贷款申请表大写金额准确率:97+%小写金额准确率:97+%勾选框准确率:99%开放性文本准确率:83.5%某股份制商业银行转账支票大写金额准确率:98%小写金额准确率:98%支付密码、付方户口号:95%付方开户行、票面收款人、用途及摘要:90%某股份制商业银行进账单转账支票电汇凭证进账单大写金额准确率:96%,小写金额准确率:95%,收款人名称准确率:84%转账支票大写金额准确率:94%,小写金额准确率:96%,用途准确率:86%电汇凭证大写金额准确率:95%,小写金额准确率:94%,收款人名称准确率:85%某股份制商业银行进账单进账单大写金额准确率99%,小写金额准确率99%,账号准确率97%,全称准确率91%某国有银行结算业务申请书、身份证营业执照银行流水结算业务申请书大写金额准确率:98.36%,小写金额准确率:96.85%,申请人全称准确率:94.39%,业务种类勾选框准确率:99.4%,申请日期准确率:96.6%,票据编号准确率:98.24%营业执照存款人名称准确率:91.03%身份证姓名准确率:93.18%,证号准确率:94.12%,有效期准确率:93.75%,银行流水识别准确率:96.25%某城市商业银行承兑汇票存续存单现金缴款单承兑汇票大写金额准确率:99%,小写金额准确率:99%储蓄存单大写金额准确率:98%,小写金额准确率:97%现金缴款单大写金额准确率:96%,小写金额准确率:97%保险某大型保险集团100张样本直接预估保单批单确认书分类准确率:保单100%,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高一化学本章测评:专题有机化合物的获得与应用
- 2024.0927推文-Elisa文献解读
- 餐饮场所使用瓶装液化气燃气的安全检查事项
- 2024高中地理第五章交通运输布局及其影响第二节交通运输方式和布局变化的影响课时演练含解析新人教版必修2
- 2024高中生物专题3胚胎工程3胚胎工程的应用及前景达标训练含解析新人教版选修3
- 2024高中语文第三单元因声求气吟咏诗韵阁夜训练含解析新人教版选修中国古代诗歌散文欣赏
- 2024高考地理一轮复习第十章区域可持续发展第32讲湿地资源的开发与保护-以洞庭湖区为例教案湘教版
- 护士长2023年工作总结和2024年工作计划课件
- 应急保障措施
- 四年级语文上册第七单元第22课为中华之崛起而读书习题课件2新人教版
- GB/T 3478.1-1995圆柱直齿渐开线花键模数基本齿廓公差
- GB/T 20174-2006石油天然气工业钻井和采油设备钻通设备
- GB 6000-1999主要造林树种苗木质量分级
- 2023年弥渡县广播电视台(融媒体中心)招聘笔试题库及答案解析
- GB 18613-2020电动机能效限定值及能效等级
- 体能训练讲解健身课件
- 农业昆虫学实验5蔬菜害虫课件
- 地震工程学-反应谱和地震时程波的相互转化matlab编程
- 大学研究生赴境内外高校学习课程学分认定管理办法
- 非标设计最强自动计算-压入力计算
- 建筑工程施工现场视频监控布置实施方案
评论
0/150
提交评论