版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 面向电网企业内控审计的知识图谱建模研究 邵磊落周成轩黄琪华张铖怡余建波【关键词】 电网企业; 内控审计; 知识图谱; 关系挖掘; 深度学习f239.1;tp301.6 a 1004-5937(2021)20-0122-07一、引言随着我国人工智能发展进入全新阶段,数字化和智能化已成为企业提高自身竞争力的核心力量。为了跟进智能化的发展,电网行业逐渐推进全新内部审计技术。电网企业进行内部审计过程中,涉及大量文本数据、财务数据。如何从这些数据中高效、精确地挖掘重要审计信息,构建数据之间的关联,是提升内部审计工作的关键。针对
2、电网公司内控审计数据复杂和智能内控审计技术匮乏导致的效率低下的问题,本文提出了一个设想,将内控审计与知识图谱进行集成,采用知识图谱中的关系挖掘技术建立内部控制方法和内部控制实施下财务报表上资金的状态和流动中增值性的因果关系,协助判断内部控制实施效果,最终形成内控审计综合评价方法。电网企业内部控制审计和财务报表审计对企业提升信息披露质量、增强相关方信任有直接影响。本文将知识图谱应用在电网企业的内控审计中,探索财务数据和内控审计的内在关联以及相互影响,开拓从财务数据出发实施内控审计的新思路,开辟智能内控审计的新途径。二、文献综述在大数据的背景下,数据挖掘技术的发展积极推动了内部审计模式的转变,各类
3、数据挖掘技术的应用能有效提高内部审计人员运用智能化技术核查问题、评价判断和分析问题的能力。尤其是人工智能技术的发展,给内部审计工作提供了新的可能。张庆龙等1讨论了在人工智能发展下的内部审计的转变,构建了内部审计智能化的应用框架。余从容等2研究了基于大数据的电力行业审计平台建设和基于知识图谱的大数据审计方法。高效的内部审计工作能让企业更好地实现自我评估和完善,同时增强企业风险防控能力3-5。在电网企业的主营业务中,当前电力调度、生产、财务、人力资源、合同管理、协同办公等数字化的程度已有了大幅度的提升,在营销收费、企业资源管理等领域,大量的被审对象数据发生了巨大改变。例如财务数据、经营数据等不但量
4、大,而且具有高度敏感性,然而数据特征和数据间关联难以仅凭人工获取,这造成了内部审计工作困难、效率低下。各类业务数据在各业务系统间的流动,构建了跨部门、跨系统、跨应用的内部审计环境,这使电网系统大数据分析技术的发展迫在眉睫。基于人工智能的数字化技术能够将复杂多变的非结构化数据转化为数字数据,通过知识图谱、数据挖掘、关系检测等方法实现非结构化数据与结构化数据的特征融合,挖掘两者间关联关系,提供审计线索。知识图谱将客观的概念、实体及其关系以结构化的形式呈现,以更直观的方式对信息进行表达。知识图谱已经在医疗、商业及金融等领域得取得了良好研究效果。在这些行业领域中,各类信息系统的普及积累了海量行业数据,
5、如何从这些数据中挖掘隐藏信息并加以管理、共享及应用,是推进行业智能化的关键问题。知识图谱能对从各种渠道所获取的行业数据进行加工处理,然后提取出对构建知识图谱有价值的知识,它已成为促使计算机从海量数据中获取认知能力的重要方法。目前,我国学者专注于知识图谱的构建方法和算法。比如,侯洪等5认为,知识图谱技术不仅能够清楚地分析处理知识,并且能实现知识可视化,在推动知识的发展方面具有潜力。袁凯琦等6采用自底向上的构建方法建立面向跨语种、专业性强以及结构复杂的医疗数据的知识图谱,涉及医学知识表示、抽取、融合和推理以及质量评估等方面。目前知识图谱在医疗、商业、金融等领域应用较为广泛,且取得了较好的效果。张德
6、亮7针对金融图谱缺乏问题及知识图谱补全模型的缺陷,爬取大量金融股票及企业信息进行金融知识图谱构建,然后提出基于组合关系路径的知识图谱补全方法对金融知识图谱进行补全任务验证。胡扬等8研究了面向金融知识图谱的实体和关系抽取算法,提出了基于能识别重叠关系的bi-lstm+crf模型,通过参数共享实现两个任务联合学习。甘云强9从文本数据中识别出金融实体,并判断实体间存在的语义关系。企业的内部控制审计主要针对财务数据的可靠性和完整性10。知识图谱不仅能够实现知识表达,同时又在信息检索、智能问答等方面具备巨大优势,知识图谱的应用可以有效地解决内部审计过程中任务繁重的问题,弥补审计力量的不足。王倩玉11研究
7、了基于知识图谱的财务与业务指标间的关联对应关系的构建方法,提出了基于机器学習的财务审计知识图谱构建,设计并实现了财务与业务指标对应关系语义网络。崔婧等12将知识图谱引入医保审计,以解决数据量庞大带来的医保审计低效问题。目前我国关于将知识图谱这种智能化技术和审计领域相结合的研究成果还相对较少,研究方法也较为单一。三、知识图谱知识图谱的概念由谷歌公司于2012年提出。知识图谱技术能像人类大脑一样建立不同类信息之间的关联,得到关系网络。jiang et al.13最早发现可以使用马尔可夫逻辑网来提取事实之间的关系。知识图谱采用了新型的信息检索方式,知识图谱在信息检索中加入智能推理,操作性更强,并且它
8、能建立知识网络,将知识图形化,以结构化形式呈现。知识图谱的主要作用在于对数据的整合与规范,向用户提供有价值的结构化信息。近年来,研究人员将人工智能、深度学习、自然语言处理等技术融入知识图谱构建过程,提高了知识图谱构建效率,使其在信息搜索、自动问答、决策分析等领域被广泛应用14。知识图谱可分为通用知识图谱和领域知识图谱,目前,国内外代表性通用知识图谱有搜狗知立方、百度知心、yago、dbpedia、worldnet等,通用知识图谱主要包含常识性知识,例如worldnet包含人、地点、音乐、电影、组织机构、物种、疾病等定义。它能从多种语言的维基百科中挖掘知识,构建名词、动词、形容词和副词之间的关联
9、。领域知识图谱一般面向某个特定领域,例如学术领域的acemap、生物医学领域的drugbank、新闻领域的eckg等15。知识图谱的可视化技术中能将抽象数据进行可视化展示,从而增强用户对数据的认知及数据获取效率。在电网企业内部审计中主要涉及知识建模、知识获取、特征融合、知识存储、语义搜索、关系挖掘等技术。在审计的大数据处理中,人们普遍采用语义引擎和数据挖掘算法,挖掘数据的隐藏信息,并对这些隐藏知识进行预测分析等,将各类数据处理技术融合在知识图谱中。知识图谱在内部审计中的应用能够可视化审计知识,实现数据向知识的转化。在内部审计中,知识图谱可以用于数据分析决策,比如在评价经济报告、分析财务报表等结
10、构化数据中,基于知识图谱可以分析财务状态,搜索审计疑点,预测未来发展,为未来财务上的决策提供有价值的参考。知识图谱中的语义搜索领域,可以对文本等非结构化数据进行分析,将非结构化数据中的线索以结构化的形式呈现,并帮助审计人员发现文本中的审计线索,提高审计效率。内控审计知识图谱示例如图1所示。本文建立的知识图谱面向电网企业的内部控制政策落实情况持续审计应用场景。考虑到电网企业主营业务中电力调度、生产、财务、人力资源、合同管理等方面所涉及的被审数据复杂多变,内部控制政策在各个业务领域的有效性难以凭借单一的内控评价报告衡量。本文针对电网企业的内控审计问题,采用深度学习方法提取内控审计中所涉及的各类结构
11、化和非结构化数据的特征,结合多源异构被审数据共同评判企业内部控制实施的有效性。与单纯的财务报表审计不同的是,内部控制审计是对保证财务报表质量的内部控制的有效性进行审计,过程涉及各类内部控制有效性文件,审计人员针对各类报表和评价报告获取证据来判断内部控制设计和运行的有效性。借助知识图谱,可以挖掘财务报表等结构化数据和内控有效性报告等非结构化数据之间的隐藏联系,对数据进行匹配,实现结构化数据与非结构化数据的特征融合。四、内控审计与知识图谱本文讨论了如何利用深度学习建立面向内控审计的知识图谱。企业内部控制的目的是合理保证企业经营管理合规合法、资产安全、财务报表及相关信息真实完整,提高企业经营水平。通
12、常情况下,企业内部控制指有效的内部控制,即如果内部控制评价结果低于既定水准,则被视为无效内部控制,因此,为了保证企业内部控制手段的有效性,内控审计尤为重要。内控审计最重要的是能满足法定的内部控制监管要求并促进提升企业的经营管理水平,发现内部控制缺陷。它是改变企业内部控制环境的基础和保障。内控审计在内部控制中具体体现四方面的作用:(1)弥补内部控制体系中的缺陷,约束员工行为,促进内部控制的有效落实;(2)为企业财务信息安全提供保障,促进财务管理制度的完善;(3)增强内部控制监管力度,全局分析既有内部控制的合理性,提高内部控制作为辅助管理手段保障企业内部经济平衡的能力;(4)规避企业风险,完善企业
13、风险管理制度,促进风险管理优化体系的建立。本文主要通过财务报表数据的特征来反映内部控制的成效。内控审计与财务报表审计的主要区别在于,财务报表审计直接评价资产、资金本身的安全状态,而内部控制审计直接评价内部控制对保障资产、资金的安全的影响,对象是内部控制。在内部控制过程中,既要保障资产、资金的安全,又要保障其“动的安全”,即同时考虑资产、资金状态和其流转中增值性的关系。本文主要研究基于知识图谱的内控审计信息挖掘,其核心任务为非结构化文本和结构化数据因果关系的挖掘。非结构化文本针对内部控制手段和评价方法等,结构化数据主要针对内部审计过程中涉及的财务数据。采用深度学习方法可以有效挖掘财务报表上资产、
14、资金的状态以及资产、资金在流转中的增值性与内部控制手段的因果关系,实现结构化数据与非结构化数据的特征融合,最终判断企业内部控制的有效性。五、面向内控审计知识图谱的构建方法电网企业主营业务的信息化程度已经非常高,信息化技术在电力调度、生产、财务、人力资源、合同管理、协同办公等业务领域都已普及。大数据技术的发展使得电网企业各项业务的数字化程度已有大幅度的提升,企业日常的经营活动产生了海量被审对象数据,增加了内部审计难度。所有被审对象数据中,企业财务信息决定了企业运营是否真实可靠。内部控制是企业重要的内部监督制度,内控审计体系的建立和执行,能合理保证财务报告质量,使企业的各项经济活动平稳运行,因此对
15、内部控制的有效性进行审计的环节尤为重要。本文主要针对电网企业的内控审计过程,构建内控审计知识图谱,挖掘内控审计中涉及的各类财务报告等结构化数据和内部控制有效性报告等非结构化数据内在特征及其相互关联,从而帮助审计人员快速、精准地判断电网企业实施的各项内部控制措施的有效性。由于电网内控审计中的数据通常较为抽象,首先需要采用深度学习方法对异构数据进行知识挖掘,从复杂数据中抽取关键信息,其次采用人工智能技术挖掘知识因果关系。內控审计的知识图谱的构建关键需从数据的知识挖掘着手,探索异构内控审计数据中有效的审计知识,找寻数据背后的隐藏特征。(一)异构审计数据的知识挖掘异构审计数据的知识挖掘是建立面向内控审
16、计知识图谱的首要工作,本文研究的知识获取示意图如图2所示,主要知识来源于结构化和非结构化的信息源,关键问题是如何运用深度学习等技术从异构审计数据中获得计算机可处理的结构化数据,以实现进一步分析处理。知识挖掘任务分为三个主要任务:实体识别、属性抽取与关系挖掘。而实体识别的目的是抽取原始数据中的实体,即候选事物。在多源异构数据中,主要分为结构化数据实体和非结构化数据实体。(二)因果关系挖掘本文主要研究内控审计,通过观察财务数据的动态来反映内部控制的有效性,因此需要借助知识图谱工具建立内控审计手段和财务数据之间的因果关系。因果关系挖掘是内控审计知识图谱构建中的一个重要环节,因果关系描述了几件事之间客
17、观的联系。因果关系由原因事件和结果事件构成,因果关系挖掘是关系的结构化呈现。在完成候选事件对象挖掘之后,再实现因果关系分类。常用的因果关系挖掘方法包括基于模式匹配的方法、基于模式匹配与机器学习组合的方法、基于深度学习的方法。基于模式的方法用语义特征、词汇符号特征和自构约束,并对它们进行模式匹配实现因果关系挖掘。基于模式和机器学习技术相结合的方法将关系挖掘分为两个子任务,候选因果对挖掘和关系分类,并前后解决这两个问题16。而基于深度学习的方法因果关系挖掘在卷积神经网络等算法的蓬勃发展之后渐渐崭露头角,基于深度学习强大的特征提取能力,可以有效定位关键事件词,并对隐含的模棱两可的关系进行精确分类。(
18、三)基于深度学习的内控审计知识图谱框架近年来,深度学习方法已经在关系挖掘中获得了一定地位,常用的语义检测神经网络有卷积神经网络(convolutional neural network,cnn)、长短期记忆网络(long-short-term memory,lstm)等。在实体识别阶段,cnn、lstm等神经网络可以通过捕捉句子重要特征从而获得句子表示,从而识别语料中的事件触发词和相关论元。在关系挖掘任务中,神经网络的使用可以提高对已标记实体的语料进行因果关系的判别的准确性。基于深度学习的内控审计知识图谱和关系挖掘框架如图3所示。本研究提出的面向内控审计的知识图谱主要以财务报表作为观察对象判断
19、内部控制有效性。搜集内部控制过程中的文本文档和企业的资产、资金“静”和“动”的数据,可以通过知识深度学习算法构建知识图谱,挖掘两者之间的隐藏因果联系,为内控审计提供参考。再结合政府监管部门等的评价意见,形成内控审计综合评价,最后判断内部控制手段是否对企业产生效果。六、面向内控审计知识图谱建模对于企业而言,完善落实内部控制及其考核监督是完成企业内部控制系统建设尤为重要的一个环节,内控审计在其中起到了评价企业内部控制成效的作用。本文研究内控审计的最主要的目的是评价内部控制在提升财务报告的可靠性程度方面的作用,运用基于深度学习的因果关系挖掘和分类技术建立知识图谱,并且通过挖掘内部控制的实施结果报告和
20、实施后企业的财务情况来判定内部控制的有效性。电网内控审计中,数据敏感多变,数据量大,有价值的审计信息潜藏在海量行业数据背后,数据间的关系错综复杂,难以梳理。知识图谱通过迭代反馈、不断更新、持续学习的循环流程将复杂数据转化为易理解的结构化信息,便于数据的组织、管理和理解,知识图谱的构建不是从数据到知识的一次性工程,知识建模与知识更新至关重要。本节将说明知识图谱在电网企业内部审计中的应用过程,完整流程如图4所示。第一步,数据获取。搜集各类内部控制常用证据,包括员工执行过程的观察记录文件、企业内部员工的询问结果、企业内部事项的记录文件、审计师跟踪重新执行过程记录文件等。同时搜集各类财务报表数据,包括
21、资产、资金状態等静态数据以及资产、资金流转中增值性等动态数据。第二步,实体抽取。采用创新的cnn、lstm等深度学习算法构建语义网络,用于抽取事件中的触发词和相关论元。在这个过程中,由于不同应用情况下数据的多样性和差异性,模型的选择和参数的选择和设置需要依据特定情况来确定。第三步,因果关系挖掘。实体与结构化数据组成数据对,并利用新的深度神经网络挖掘数据对之间的特征表示,识别数据对之间的因果关系(例如,用“0”表示因果关系不成立,“1”表示因果关系成立)。最后通过层层关系挖掘,构建面向内控审计的知识图谱,可以从构建的知识图谱中获取内控审计有效性评价,并且综合外部组织对企业内控措施的综合评价,得出
22、综合评价报告。(一)采用卷积神经网络实现关系挖掘由于深度学习在自然语言处理领域发挥出的良好性能,基于深度学习的关系挖掘方法逐渐被广泛应用。深度学习算法不仅具有学习数据内在特征的强大能力,而且可以联合人工特征进行补充。基于cnn的关系挖掘方法采用cnn对输入语句进行编码,通过多层卷积层和池化层逐层特征提取,得到句子的高级语义表示,最后采用基于全链接层的尾部分类器对这些特征表示进行关系分类。cnn的网络结果大致包含输入层、卷积层、池化层和全连接层。网络结构如图5所示。这些隐藏层将句子中的词转化为向量表示,一般可以加入一些如词法、语法等额外的特征来增强cnn学习句子的语义表示能力。此外,通过词的位置
23、信息(位置向量)来考虑语序。(二)案例分析本研究基于相关文献的金融关系数据集说明基于cnn的知识图谱的关系抽取步骤。从网上爬取各种非结构化金融数据和结构化数据素材,首先进行数据清洗,清除数据中的表情、字符等噪声数据,减少噪声信息对准确率的影响。对数据进行预处理之后,根据知识抽取思路,对非结构化数据进行分词,筛去修辞等无用词汇。再采用cnn实现实体识别,对名称、组织机构、地名等进行识别。关系建立在两个实体之间,完成实体识别后,继续构建新的cnn网络实现关系抽取。为构建简单的知识图谱示例,采用人工标注数据的实体及其对应语义关系,设定3类语义关系:“行业属于”“概念属于”“董事会成员”,并整合数据,
24、每条语句至少包含一个实体关系。该数据集中共有四种实体类别(企业、人物、概念、行业)和三种关系类别(行业属于、概念属于、董事会成员)。本文中所用的数据源大体分为非结构化数据和结构化数据,针对知识图谱建立中最关键的关系挖掘环节,本文采用一个简单案例来说明知识图谱的基础“三元组”的建立。本文采用多个三元组描述数据中各个实体之间的关系,并根据三元组之间的相互关联构建简单的知识图谱来结构化展示原本杂乱无章的数据,便于研究人员对数据以及数据间关联进行查询。本文拟采用基于cnn的语义网络去除语句中无效信息,提取复杂数据中的关键实体,并对各类实体间关系进行分类,以形成三元组。最后可视化各个三元组形成知识图谱,
25、简单的知识图谱示例如图6所示。通过图谱可以直观地查看实体和实体之间的关系,并且可以对实体关系进行查询,具体包括企业实体、行业实体、概念实体、董事会实体。以同济科技为核心,得到(同济科技,概念属于,燃料电池)(同济科技,概念属于,上海本地)(同济科技,概念属于,污水处理)(同济科技,概念属于,高校背景)(同济科技,概念属于,节能环保)(同济科技,概念属于,氢燃料)(高国武,董事会成员,同济科技)(王明忠,董事会成员,同济科技)多个三元组,这些三元组描述了各个实体之间的关系,可以得到同济科技是具有高校背景的综合行业,它的行业标签、董事会成员信息等都能轻松获得,并且还能获取与它具有相同标签的企业信息
26、。在内控审计问题中,通过构建内部控制条例和财务数据的因果关系三元组,得到面向内控审计的知识图谱,判断内部控制手段和财务数据等因果关系,从而判定企业内部控制的有效性。七、结语本文讨论了面向电网企业内控审计的关系挖掘和知识图谱建立。内控审计是为了满足内部控制监管要求,发现内部控制缺陷,并促进提升企业的经营管理水平,主要评价内部控制能否保障资产、资金的安全,在电网企的内控审计过程涉及了大量各种形式的文本数据、财务数据。如何从这些多元异构数据中高效、精确地挖掘数据特征,构建数据之间的关联,实现特征融合,是提升审计工作水平的关键。本文通过构建面向内控审计的知识图谱,采用深度学习方法挖掘财务报表中资产、资
27、金的状态以及资产、资金在流转中的增值性与内部控制手段的因果关系,实现结构化数据与非结构化数据的特征融合,最终形成内部控制综合评价。通过与先进的深度学习技术等结合,企业内部审计效率和效果取得显著提升。【参考文献】1 张庆龙,邢春玉,芮柏松,等.新一代内部审计:数字化与智能化j.审计研究,2020(5):113-121.2 余从容,卢利娟,梁东贵.电力行业数据式审计模式研究j.现代信息科技,2018,2(4):6-10.3 桑瑞.电力企业内部审计风险及对策j.中国市场,2021(2):144-145.4 蔡向南.煤矿企业内部审计风险及防范措施策略j.财会学习,2021(1):163-164.5 侯洪,孟志华,余瀚.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿教师师德工作个人总结5篇
- 幼儿园活动收获心得美文五篇
- 急诊科临床诊疗常规-技术操作规范标准
- 毕业典礼的致辞语怎么写5篇
- 道理感悟类满分作文范文(6篇)
- 关于中国新兴产业发展未来问卷调查
- 山东高速合同制员工待遇标准
- 销售总结报告心得(10篇)
- 毕业典礼的致辞稿范文5篇
- 城市夜景照明工程招投标
- 职业技术学校老年保健与管理专业(三年制)人才培养方案
- 2024年秋季人教版新教材七年级上册语文全册教案(名师教学设计简案)
- 有子女民政局常用协议离婚书格式2024年
- 中国介入医学白皮书(2021 版)
- 2024中华人民共和国农村集体经济组织法详细解读课件
- 代运营合作服务协议
- 婚内财产协议书(2024版)
- 有限空间作业应急管理制度
- 2024全国普法知识考试题库及答案
- 化工企业中试阶段及试生产期间的产品能否对外销售
- 篮球智慧树知到期末考试答案章节答案2024年浙江大学
评论
0/150
提交评论