处理非结构化内部审计数据的方法创新_第1页
处理非结构化内部审计数据的方法创新_第2页
处理非结构化内部审计数据的方法创新_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(一)处理非结构化内部审计数据的重要性随着计算机、互联网、数字媒体等的不断普及,以非结构化数据为主的信息急剧增加,使其在内部审计数据中所占据的位置越来越重要。非结构化数据中往往蕴藏着有用的信息资源,是为审计人员提供审计线索和审计证据的信息宝库。如果不能对非结构化内部审计数据进行有效处理和分析,不仅会影响到审计内容的全面性和完整性,还会影响到审计工作的效率和效果。重视对非结构化内部审计数据的处理和分析刻不容缓。(二)处理非结构化内部审计数据的难点如何存储、查询、分析、挖掘和音频。其二,访谈。根据审计方案中摆在我们面前的一大难题。一方面,根据非结构化数据的特点可知,它们(一)处理非结构化内部审计数据的重要性随着计算机、互联网、数字媒体等的不断普及,以非结构化数据为主的信息急剧增加,使其在内部审计数据中所占据的位置越来越重要。非结构化数据中往往蕴藏着有用的信息资源,是为审计人员提供审计线索和审计证据的信息宝库。如果不能对非结构化内部审计数据进行有效处理和分析,不仅会影响到审计内容的全面性和完整性,还会影响到审计工作的效率和效果。重视对非结构化内部审计数据的处理和分析刻不容缓。(二)处理非结构化内部审计数据的难点如何存储、查询、分析、挖掘和音频。其二,访谈。根据审计方案中摆在我们面前的一大难题。一方面,根据非结构化数据的特点可知,它们结构复杂多变、来源广泛、样式繁多,存储方式较为分散,并无规则、顺序可以遵循。传统的数据库在数据分析应用领域擅长解决结构化数据问题,在处理非结构化数据方面存在很大的欠缺。另一方面,现今针对非结构化数据的处理技术发展并不成熟,方法有限,而且再加上内部审计人员并非专业的技术人员,对相关知识和技能的掌握并不到位。以上都成为处理非Copyright博看网.AllRightsReserved.结构化内部审计数据的难点。二、运用ASR、OCR技术处理非结构化内部审计数据的现实基础(一)运用ASR技术处理非结构化内部审计数据语音识别技术(AutomaticSpeechRecognition,简称ASR)是将人类语音中的词汇语句识别并翻译转换成计算机语言。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如从语音到与语音的翻译。在内部审计工作中,可用于ASR技术处理的语音资料主要通过以下三种方式获得:其一,由被审计单位提供,例如公司以往录制的重大会议的

制定的审计目标,审计人员与被审计单位的主要领导或负责人展开有目的的谈话。其三,询问。审计人员就已发现的审计线索和审计证据向被审计单位的主要领导或相关负责人征求意见。(二)运用OCR技术处理非结构化内部审计数据光学字符识别(OpticalCharacterRecognition,简称OCR)是指采用光学的方式将纸质文档中的信息转换成计算机文字的过程,供文字处理软件

处理非结构化内部审计数据的方法创新

林琳(河南省审计厅,河南郑州450000)

摘要:现今,在内部审计中,以非结构化数据形式提供审计资料的现象越来越常见,而非结构化数据具有格式多样、结构复杂、存储分散且无序无规则的特点,处理起来相当困难。针对这一问题,本文结合内审工作的具体实践,探讨ASR、OCR技术在处理非结构化内部审计数据的现实基础、实际应用、发展前景,以达到提高审计工作效率和质量的目标。关键词:非结构化数据;数据处理;ASR技术;OCR技术

随着大数据时代的到来,科技信息化高速发展,云计算、物联网、人工智能、4G及即将到来的5G通信等技术正以空前的影响力、传播力和渗透力,不可阻挡地改变社会的经济结构、生产方式和人们的生活方式,这客观要求审计的信息化建设必须努力适应,快速跟进,同时也对审计技术提出了更为苛刻的要求,包括对审计制度、审计人员、应用程序、软硬件等的要求。在大数据背景下,非结构化数据逐渐出现在内部审计资料中已成为一种必然的发展趋势,为了确保审计资料尽可能地全面、完整,不断提高审计工作的效率、质量,探讨运用ASR、OCR技术处理非结构化内部审计数据具有实际意义。利用这些非结构化内部审计数据成为一、处理非结构化内部审计数据的重要性与难点审计人员在开展审计调查的过程中,需要从被审计单位的电子信息系统中提取审计数据。审计数据主要分为结构化数据、半结构化数据和非结构化数据。本文主要讨论的是非结构化数据。非结构化数据具有结构不规则或不完整的特质,没有预定义的数据模型,难以用数据库二维逻辑来表现,其主要形式包括文本、图片、图像、音频等。

34

人力、财力,尤其是在审前调查中获取文本、图像、语音、视频等资料,运用ASR、OCR技术及时处理这些非结构化数据,能够帮助审计人员开展有效分析,快速锁定审计目标,发现审计线索和证据,在接下来正式的审计阶段中有针对性地开展调查,有助于实现事半功倍的审计效果。面对海量复杂的非结构化审计数据,将ASR、OCR技术相结合,可以对其进行有效处理和分析,拓宽审计数据收集的范畴,保证内部审计内容的全面和完整;加大对审计数据的挖掘力度,进一步提升审计价值;加大内部审计的力度和深度;大大提高审计工作的质量、效率。现阶段,应用ASR、OCR技术处理非结构化的内部审计数据具有现实基础,推动了审计技术的创新和提高。识别转换的时长由导入文件的内存大三、运用ASR、OCR技术处理非结构化内部审计数据的实际应用内部审计获取的非结构化数据包含的内容丰富,范围广泛,形式多样,贯穿公司经营管理的各个环节,在审计工作中如何将ASR、OCR技术相结合来处理非结构化数据?(一)运用ASR技术处理非结构化内部审计数据的实际运用语音是内部审计非结构化数据中重要且较为直接的一种表现形式。其一,运用ASR技术能够将公司重要会议的录音、视频转化为计算机文字。在对某公司年度经济责任审计时,发现该公司外协加工一批货物,经审查这批货物的加工劳务合同,其记载的交易金额数目较大,而加工的零件数量并不多,且这批零件都是统一的规格型号,单个零件的加工价格高。审计人员接着审查零件加工费用35的定价依据和过程。被审计单位称价格是经多家公司对比后,召开会议讨论后决定的,并提供了一份会议录音。按照以往最直接的办法就是一边听录音,一边用计算机编辑,然而这份会议录音时长将近人力、财力,尤其是在审前调查中获取文本、图像、语音、视频等资料,运用ASR、OCR技术及时处理这些非结构化数据,能够帮助审计人员开展有效分析,快速锁定审计目标,发现审计线索和证据,在接下来正式的审计阶段中有针对性地开展调查,有助于实现事半功倍的审计效果。面对海量复杂的非结构化审计数据,将ASR、OCR技术相结合,可以对其进行有效处理和分析,拓宽审计数据收集的范畴,保证内部审计内容的全面和完整;加大对审计数据的挖掘力度,进一步提升审计价值;加大内部审计的力度和深度;大大提高审计工作的质量、效率。现阶段,应用ASR、OCR技术处理非结构化的内部审计数据具有现实基础,推动了审计技术的创新和提高。识别转换的时长由导入文件的内存大三、运用ASR、OCR技术处理非结构化内部审计数据的实际应用内部审计获取的非结构化数据包含的内容丰富,范围广泛,形式多样,贯穿公司经营管理的各个环节,在审计工作中如何将ASR、OCR技术相结合来处理非结构化数据?(一)运用ASR技术处理非结构化内部审计数据的实际运用语音是内部审计非结构化数据中重要且较为直接的一种表现形式。其一,运用ASR技术能够将公司重要会议的录音、视频转化为计算机文字。在对某公司年度经济责任审计时,发现该公司外协加工一批货物,经审查这批货物的加工劳务合同,其记载的交易金额数目较大,而加工的零件数量并不多,且这批零件都是统一的规格型号,单个零件的加工价格高。审计人员接着审查零件加工费用35的定价依据和过程。被审计单位称价格是经多家公司对比后,召开会议讨论后决定的,并提供了一份会议录音。按照以往最直接的办法就是一边听录音,一边用计算机编辑,然而这份会议录音时长将近4个小时,如此一来,需要耗费大量的时间,还有人力、物力和财力,将会拖延甚至耽误其他审计项目的进度,拉长整个审计工作的周期,而且这份录音又是一个重要的审计证据,不可忽略。这时,运用ASR技术就可以轻松解决这一难题。现今,运用ASR技术开发出很多将语音转换为计算机文字的软件,并且这些软件随着ASR技术的不断创新而不断改进,打开软件,在主页面选择导入文件,将该会议录音导入,随后软件会对语音中的词汇内容进行识别,直接转换成可输入的计算机语言,小决定,这份会议录音在短短钟内就转换成功了。这种繁琐、工作量大的难题就可以通过这样的办法迎刃而解。其二,运用ASR技术能够将访谈或询问录制下来的语音转化为计算机文字。在审查该公司某项交易金额较大的采购业务时,由于可接触到的相关审计资料有限,需要向该项业务的相关负责人询问有关情况。首先,向公司领导人询问了解该批材料用于生产哪些产品,以往和将来关于这些产品的生产计划等。其次,向财务负责人询问了解该批材料的审批手续是否齐全,付款程序是否按合同规定支付,后续加工产生了哪些费用,最终产成品经销售所产生的利润等。然后,向采购人员询问了解订购这批材料是否符合生产计划要求,采购的实际数量和计划数量是否存在出入,是否符合10分

进一步编辑加工的技术,可用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。OCR技术不仅可以将文稿中的文字转换成计算机可输入语言,同时还可以自动判断、拆分、识别和还原各种通用格式的表格,将结果还原成与扫描文件版面布局一致的新电子表格。在内部审计工作中,运用OCR技术处理非结构化数据已不是什么新鲜事,但还远远达不到普及的程度。在具体的审计实践中,主要由被审计单位提供文本、图像等非结构化资料,具体的表现形式有很多,如公司重大会议的笔录、经营业务合同、原材料入库单、产成品出库单、某个事项的手写说明等等。无论是通过何种方式获取的语音资料,还是何种表现形式的文本、图像资料,其选取的范围非常广泛,涵盖公司的方方面面。大到公司的经营范围、管理体制、组织机构、人员编制,公司的发展战略与规划,财务状况和经营成果,公司重大的经营管理活动和对外投资情况,公司内部控制与风险情况等;小到公司签订的某份采购或加工合同,销售某批货物开具的发票,公司员工某次出差的报销单,公司董事会成员变更的会议视频,访谈公司领导人有关员工责任分工的录音,询问公司相关负责人主要产品的材料构成或工艺流程的录音等。(三)运用ASR、OCR技术处理非结构化内部审计数据的优势非结构化内部审计数据可以直接递交或通过邮件等互联网方式远程获得。在有关领导的许可下,经过相关程序的审批后,采取远程方式获取审计资料为审计单位和被审计单位提供了很大的便利,节省了双方的时间、

Copyright博看网.AllRightsReserved.

商品的数量,对该产品每一个环节的数量汇总统计,制成表格。试想一下,将这厚重的资料进行一页一页系统地统计,然后再将其一一输入电子文件中,工作量可想而知。而现今,运用OCR技术识别转换文本、图像的软件已十分常见,使用起来简单便捷,将原材料入库单、领料单、生产和加工后的发出单、零件检验合格单、产品入库单及发出单一一拍照,将拍好的照片一次性全部导入,经软件自动扫描识别后,照片就已经被保留备份,接下来转换后就可以在软件编辑框中直接获得和原稿版面布局一致的电子表格,再运用Excel表格进行汇总统计即可,不到两天就可以解决一周都难以完成的任务。其二,OCR技术能快速将图像信息识别转化为计算机语言。该公司某种由27个零件构成的产品经过17道生产加工工序后才算完成,需要审查每个零件在其每个制造环节中每一种原材料的实际用量。审计人员要求被审计单位提供了这27个零件在每个环节的工艺图纸,掌握每个零件在其每个工艺流程中原材料的实际用量。这些大量的工艺图像复杂难懂,各有不同,每页还附有这道工序耗用材料数量的数字表格,用传统的办法使用计算机画图、一一编辑输入数字,再制作表格显然是行不通的,就需要借助运用OCR技术研发的软件识别并转换这些工艺图像,打开软件,在主页选择图像文件导入,将不可编辑更改的工艺图像全部导入,经过软件一一识别,转换成可以操作录入的电商品的数量,对该产品每一个环节的数量汇总统计,制成表格。试想一下,将这厚重的资料进行一页一页系统地统计,然后再将其一一输入电子文件中,工作量可想而知。而现今,运用OCR技术识别转换文本、图像的软件已十分常见,使用起来简单便捷,将原材料入库单、领料单、生产和加工后的发出单、零件检验合格单、产品入库单及发出单一一拍照,将拍好的照片一次性全部导入,经软件自动扫描识别后,照片就已经被保留备份,接下来转换后就可以在软件编辑框中直接获得和原稿版面布局一致的电子表格,再运用Excel表格进行汇总统计即可,不到两天就可以解决一周都难以完成的任务。其二,OCR技术能快速将图像信息识别转化为计算机语言。该公司某种由27个零件构成的产品经过17道生产加工工序后才算完成,需要审查每个零件在其每个制造环节中每一种原材料的实际用量。审计人员要求被审计单位提供了这27个零件在每个环节的工艺图纸,掌握每个零件在其每个工艺流程中原材料的实际用量。这些大量的工艺图像复杂难懂,各有不同,每页还附有这道工序耗用材料数量的数字表格,用传统的办法使用计算机画图、一一编辑输入数字,再制作表格显然是行不通的,就需要借助运用OCR技术研发的软件识别并转换这些工艺图像,打开软件,在主页选择图像文件导入,将不可编辑更改的工艺图像全部导入,经过软件一一识别,转换成可以操作录入的电子图像。这样处理审计资料,有利于高效开展审计工作。如果被审计单位是涉密单位,或Copyright博看网.AllRightsReserved.者审查的内容涉及保密,不允许携带手机、相机、摄像机等移动电子设备,就无法使用由ASR、OCR技术开发的一系列识别转换软件对非结构化的内部审计数据进行处理,因此这种方法受客观条件影响具有一定的局限性。四、发展与展望随着智能信息化的高速发展,内部审计不再是一项查错防弊的工作,而是一项从企业整体大局出发,立足于为企业价值增值的活动。运用ASR、OCR技术可以对非结构化的内部审计数据进行有效的收集、整理、分析及存储,为内部审计工作提供了一个范围更广、层次更高、视野更加开阔的平台。但是,目前也存在运用ASR、OCR技术难以处理或解决不了的问题。由于非结构化数据本身复杂程度高,并且会随时代推进出现新的难题,而且现阶段ASR、OCR技术有限,发展并不成熟,需要在不断的探索实践中加以完善。参考文献:[1]韩强.大数据环境下审计模式创新研究[J].创新科技,2015(6).[2]马晓荣.科技云中非结构化数据向结构化数据的转换方法[D].西安电子科技大学,2017.[3]曲艳.大数据环境下企业内部审计模式转变研究[J].商场现代化,2017(17).[4]汪莉,叶建彪.基于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论