RPA财务机器人:基于UiBot 课件 第七章 PDF自动化_第1页
RPA财务机器人:基于UiBot 课件 第七章 PDF自动化_第2页
RPA财务机器人:基于UiBot 课件 第七章 PDF自动化_第3页
RPA财务机器人:基于UiBot 课件 第七章 PDF自动化_第4页
RPA财务机器人:基于UiBot 课件 第七章 PDF自动化_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

PDF自动化授课教师:余冰冰目录PDF自动化概述01案例拓展103合同信息录入机器人02案例拓展204单击此处添加文本具体内容,简明扼要地阐述您的观点根据需要可酌情增减文字,以便观者能够准确地理解您所传达的思想。素质目标了解PDF自动化操作命令应用场景掌握PDF自动化常用操作命令的用法巩固Excel、Word、OCR等常用操作命令的用法能力目标了解上市公司质量评价方法;掌握上市公司评分流程的设计思路和具体自动化流程设计;利用UiBotCreator开发上市公司评分自动化流程。知识目标本章学习目标本章主要内容案例导入PDF(PortableDocumentFormat)是一种广泛应用于日常生活与办公领域的文件格式。其显著特点在于高度的安全性,支持设置密码、限制打印与复制等功能,有效防止文件信息泄露。PDF文件具备良好的可读性和编辑性,用户可在不同的操作系统和设备上顺畅打开、浏览和编辑PDF文件,且文件格式始终保持一致。

总之,PDF作为一种便携式文档格式,凭借其高度的安全性、跨平台兼容性和用户友好的特性,在日常生活和办公中扮演着举足轻重的角色。无论是保护敏感信息、提高工作效率,还是方便文件共享和传输,PDF都是一种理想的文档解决方案。随着科技的持续进步,PDF将继续发挥其独特优势,满足更多用户的多样化需求。案例思考PDF文档作为一种便携式文档为何还需要RPA技术协助处理呢?0102工作中有哪些RPA技术与PDF文档结合的案例呢?PDF自动化概述01PDF介绍通用性可靠性安全性一致性PDF文件格式是以跨平台支持多媒体集成信息的出版和发布为目的而设计的文件格式。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。PDF文件的安全性得到了广泛的认可。可以通过设置密码、添加数字签名、限制文件打印和编辑等方式来保护文档内容,防止未经授权的访问和篡改。这种安全性对于需要保护知识产权、商业机密或敏感信息的场景来说,是非常重要的。PDF文件格式的另一个显著优点是它的阅读体验一致性。这一点在跨平台、跨设备的阅读环境中尤为重要,它确保了信息的传递不会因为硬件或软件的差异而产生误差。PDF文件不管是在Windows、Unix还是MacOS操作系统中都是通用的。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。PDF常用命令

PDF因其出色的跨平台兼容性和内容稳定性,赢得了广大用户的广泛认可,在需要共享和传递文档时。因此,对于PDF文件的处理,包括编辑、阅读、转换以及信息提取等环节,均显得至关重要。

为用户在办公场景中高效处理PDF文件提供了极大的便利。UiBot提供对PDF文件处理的命令,包括“获取总页数”、“获取所有图片”、“将指定页另存为图片”、“获取指定页图片”、“获取指定页文本”、“合并PDF”等活动。

企业年度报告是一个企业展示自身财务状况和经营成果的重要渠道,也是对股东、员工和社会各界公开透明的必要手段。

通过年度报告,相关利益者不仅可以了解公司的财务状况、盈利状况以及现金流量情况,评估公司的市场价值,为投资决策提供依据;而且还可以为外部筹资提供依据,例如银行等外部机构可以通过年报了解公司的各项指标,从而决定是否放款,以此评估信贷风险。

小悠科技公司的财务人员小程日常业务之一就是通过分析年度报告了解行业竞争对手的财务状况,以备企业积极应对做决策支持。PDF自动化-自动读取年报信息课堂小示例课堂小示例

现在小程尝试用UiBot自动打开某竞争对手的年度报告PDF文档,并读取相关内容。开发思路如下:

新建一个名为“PDF自动化处理”的流程,该流程仅包含一个“PDF自动化”流程块。将相关实验材料保存在该流程的res文件夹下通过UiBot提供的PDF自动化处理控件,如“获取总页数”、“获取所有图片”等命令了解PDF文档命令使用规则课堂小示例步骤1:新建流程图。新建一个“PDF自动化处理”流程,该流程仅包含“PDF自动化”一个流程块,并将准备文件保存在该流程的res文件夹下。点击“PDF自动化”流程块右上角编辑图标,进入可视化视图。步骤2:在命令列表依次执行“文件处理”→“PDF格式”→“获取总页数”命令,该命令的功能是获取指定的PDF文件总页数。“获取总页数”命令包含3个属性,“输出到”的变量名默认为iRet,“文件路径”处需指明要打开的文档的路径与文件名,为@res“2022年年度报告CN.pdf”,此处需表示为字符串形式,因此加“”。“密码”属性为文档密码,如果该文档未设置密码,默认为空值。在“获取总页数”命令后拖入“调试输出信息”命令,将获取的页数结果iRet打印至输出面板。步骤3:依次执行“文件处理”→“PDF格式”→“获取总页数”命令,用于获取PDF文档中的图片信息。该命令共有4个属性,与步骤2一样,“文件路径”为@res"2022年年度报告CN.pdf",“密码”属性默认为""。“保存目录”属性指的是将获取的图片存放的路径,设置为@res"",即保存在该流程块的res文件夹下,“图片格式”属性共有PNG格式、JPG格式、BMP格式3种选择,此处选中“PNG格式”。课堂小示例

步骤4:依次执行“文件处理”→“PDF格式”→“将指定页另存为图片”命令,用于将PDF文件中指定的页另存为图片。该命令有5个属性,与步骤3一样,“文件路径”设置为@res"2022年年度报告CN.pdf",“密码”属性默认为"",“保存目录”设置为@res""。“开始页码”属性设置为1,“结束页码”属性设置为1,表明指定第1页另存为图片。课堂小示例

步骤5:依次执行“文件处理”→“PDF格式”→“获取指定页图片”命令,用于获取PDF文件中指定的页的图片,图片以“PDF文件名_序号”的命名方式保存。该命令有5个属性,与前述步骤一样,“文件路径”设置为@res"2022年年度报告CN.pdf",“密码”属性默认为"",“保存目录”设置为@res""。“开始页码”属性设置为49,“结束页码”属性设置为49,表明指定获取第49页的图片。课堂小示例

步骤6:依次执行“文件处理”→“PDF格式”→“获取指定页图片”命令,用于获取PDF文件中指定的页的文本。该命令有5个属性,“输出到”的变量名默认为sRet,用于保存获取的文本信息。与前面步骤一致,“文件路径”属性设置为@res"2022年年度报告CN.pdf",“密码”属性默认为""。“开始页码”属性设置为2,“结束页码”属性设置为2,表明指定获取第2页的文本。在“获取指定页文本”命令后拖入“调试输出信息”命令,将获取的文本结果sRet打印至输出面板。课堂小示例

步骤7:依次执行“文件处理”→“PDF格式”→“合并PDF”命令,用于将多个PDF文件合并成一个PDF文件。如下图所示,该命令有2个属性,“文件路径”属性设置为[@res“2021年年度报告CN.pdf”,@res“2022年年度报告CN.pdf”],指将上述两个PDF文件合并为一个PDF文件,“保存路径”设置为@res“年度报告.pdf”,指的是合并后的文件名。单击快捷栏上的“运行”后,打开res文件夹查看合并后的文件。课堂小示例合同信息录入机器人02需求分析

小悠科技有限公司业务人员需要根据企业购销合同提取关键信息。

具体要求:

将PDF格式的购销合同中的合同编号、商品名称、数量、单价及金额等信

息录入汇总表。将上述两个文件保存在该流程的res文件夹下。业务流程图动手画一画流程图自动化流程分析为便于实现RPA的功能,本案例仅包含两个流程块,即“获取合同信息”和“写入合同信息”;主要涉及PDF文字识别、变量赋值、打开工作薄、写入单元格、关闭工作薄等操作。具体开发流程如下:通过PDF智能文档通用识别平台将PDF格式的购销合同内容读取出来后提取合同编号、商品名称、数量、单价及金额等关键信息将上述信息写入合同信息汇总表自动化流程设计开发实现步骤【实验准备】新建一个“合同信息录入机器人”流程,该流程包含包含“获取合同信息”和“写入合同信息”两个流程块。将相关实验材料(购销合同.pdf、合同信息汇总表.xlsx)保存在该流程的res文件夹下。“录入购销合同”自动化流程开发实现步骤010203识别PDF文件设置“金额”变量值设置“合同编号”变量值开发实现步骤0103识别PDF文件设置“金额”变量值设置“合同编号”变量值02开发实现步骤010203识别PDF文件设置“金额”变量值设置“合同编号”变量值开发实现步骤0102写入单元格打开工作薄“写入合同信息”自动化流程流程小节1.开发易错点识别率问题:在对PDF进行文本识别时,可能存在识别率低于预期、识别的内容超出了预期范围、过低的识别速度等影响执行效率。查找文本位置:在识别过程中,PDF中文字所在位置不一定很规范,尤其是遇到特殊表格、文字方向等问题时,可能需要特殊处理以便正确识别。2.流程适用性适用于需要批量进行相似PDF文本识别、录入等场景。该流程通过OCR技术对PDF文本进行识别,获取文本信息以减轻员工的重复工作和人为识别错误,提高工作效率。读取审计意见机器人03需求分析在现代商业活动中,财务报告作为衡量一个公司财务状况与业绩的重要工具,其真实性、准确性和完整性至关重要。为确保财务报告的质量,许多企业会采取独立审计的方式。独立审计不仅有助于防范财务报表中的错误或疏漏,避免因税务问题导致的负面影响,有效保障投资者的经济利益和合法权益。审计工作的核心在于对被审计单位在特定会计期间的会计报表进行全面深入的审查,并据此提出审计意见。这些意见通常包括无保留意见、保留意见、否定意见和无法表示意见等类型,它们各自反映了企业的不同财务状况和可能存在的问题。现要将小悠科技有限公司的“审计报告.pdf”中有关审计意见类型的字段提取出来,以确定该企业年度审计报告意见类型。通过将审计报告有关内容以图片的形式保存下来,然后读取文本信息并写入Word文档。业务流程图动手画一画流程图自动化流程分析为准确读取PDF文本信息,通过OCR图像识别技术来高效地从PDF文档中提取审计报告相关字段信息例如:关注的审计意见类型字段;将上述信息写入一个名为“审计意见.doc”的Word文档中输出审计意见类型字段接着保存并关闭Word文档以便将来需要时能够轻松访问这些信息。自动化流程设计为便于实现RPA的功能,本案例仅包含一个流程块,即“读取审计意见”,主要涉及PDF另存为图片、获取文件路径、打开文档、写入文字等操作。开发步骤开发流程包含一个“读取审计意见”流程块网页信息批量转PDF机器人04需求分析股票市场是一个充满波动和不确定性的地方,投资者需要时刻关注股票行情,并对其进行准确的分析。股票行情是指股票市场中各个股票的价格走势和交易量等相关信息,了解股票行情对投资者来说非常重要,因为它直接影响着投资决策的准确性和效果。通过及时了解股票行情,投资者可以得到市场的实时信息,并根据这些信息制定相应的投资策略。股票行情还可以反映市场的整体情况和趋势,帮助投资者判断市场的走向,更好地理解市场,抓住投资机会。现将查询有关企业的股市行情,并将相关信息通过网页截图保存为PDF格式后进行整理。通过将查询的股票行情有关内容以图片的形式保存下来,然后转为PDF格式进行保存。业务流程图动手画一画流程图自动化流程分析首先,需要打开“待查询股票.xlsx”获取待查询股票的信息,例如股票代码。其次,需要登录深交所官网,进入股票行情走势查询页面,在该页面内输入待查询股票代码或股票名称进行搜索,获取股票的详细的行情数据,包括开盘价、收盘价、最高价、最低价、成交量等关键信息。最后,将相关股票行情数据以图像的形式保存下来,插入Word文档进行排版整理后,批量转为PDF格式,确保了信息的真实性和可靠性。自动化流程设计为便于实现RPA的功能,本案例仅包含一个流程块,即“网页信息批量转PDF”,主要涉及启动浏览器、打开工作簿、打开Word文档、遍历数组、鼠标点击、对元素截图、插入图片、另存为文档等操作。开发步骤

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论