浅析“大数据”时代如何加强数据深度分析应用_第1页
浅析“大数据”时代如何加强数据深度分析应用_第2页
浅析“大数据”时代如何加强数据深度分析应用_第3页
浅析“大数据”时代如何加强数据深度分析应用_第4页
浅析“大数据”时代如何加强数据深度分析应用_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、浅析“大数据”时代如何加强数据深度分析应用课题承担单位:宁阳县国家税务局摘要:本文首先就“大数据”时代税收数据分析发展背景进行了简要说明,并提出了数据深度分析利用的理论与方法:完善的一体化税收数据分析工作体系与数据挖掘理论;其次从技术应用层面与管理层面剖析了做好数据深度分析利用的重点、关键点;最后结合实际情况,提出目前发展数据深度分析应用存在的问题及建议。关键词:数据挖掘系统 一体化数据深度分析工作体系 工作流程 业务重组 管理机制 技术应用 一、当前税收数据分析发展情况简析近年来,国税部门结合税收工作中的热点、难点和焦点问题,不断拓展选题范围,积极探索开展数据处理分析,建立起了比较完善的数据

2、处理分析工作运行机制,实现了税收数据的增值应用,为加强税源管理和辅助领导决策提供了重要依据。数据分析在税收管理工作中的作用初步显现。随着金税三期工程建设的实施,国税系统各主要业务应用系统已实现总局、省局集中运行,总局、省局拥有的数据量迅速增大,税收数据资源变得更加丰富,我省也建立了独立自主的数据综合分析利用平台,税收数据在税收管理和服务中的核心作用渐趋明显。但是在大数据时代的背景下,以业务操作为主要特征的信息化应用平台在数据管理和数据应用分析这一关键领域的功能缺陷日益突出,成为制约数据分析应用一个主要瓶颈。虽然省局综合数据分析利用平台实现了一定的数据分析功能,并且制定了一定量的预警分析指标,但

3、在多行业数据采集、预测性分析、跨部门联网数据交互分析、互联网大数据分析、逻辑性分析、征管数据纵向深度分析、跨省数据交互分析以及数据取数口径准确性等方面还有待加强。本文结合当前税收信息化工作,就如何在“大数据”时代充分利用这些丰富的税收数据资源,实现税收数据的深度分析应用,从中发现税收征管工作中存在的问题和薄弱环节,发现税收管理规律,更好地为税收管理和辅助决策服务,进行了认真的思考和探索。二、数据深度分析应用的理论与方法所谓税收数据的深度分析应用,可以理解为:在系统整合和税收数据集中的基础上,遵从科学化、精细化管理要求,树立利用税收数据资源分析主导税收工作的理念,利用相关学科的原理、方法和模型,

4、对海量涉税数据,包括税务系统内部数据及通过对政府、企业、居民、互联网等采集的外部数据,进行加工、处理,多层次、多角度分析和挖掘税收数据资源,再经过掌握数据分析技术与税源管理的复合型专业人才的深度加工,形成能够发现税收征管漏洞、辅助税收征管决策、监督政策执行、促进税收增长的有价值信息,为税收管理和决策提供重要依据,达到信息管税的目标,促进税收管理质量和效率的提高。开展数据深度分析应用工作,首先在工作方法上,要有明确、精准的数据分类,完善、科学的工作流程和规范、标准的岗则设计,这就要求建立一套完善的一体化数据深度分析应用工作体系;其次在技术理论上,要能够实现在海量“大数据”中排除无用数据、找出涉税

5、数据规律并评估出有意义的数据规律或模式,就必须以先进的数据挖掘理论为指导,以多样化的数据挖掘技术为支撑。以下两部分将对一体化数据深度分析工作体系建设与数据挖掘在税收数据分析中的应用展开详细介绍。(一)一体化数据深度分析应用工作体系建设开展数据深度分析应用工作需要有三个条件:一是数据在总量上要达到一定规模,这里的数据总量不仅指征管数据总量,还包括其他相关的第三方数据总量。只有在数据总量上达到一定规模后,才有可能从大量的无序的数据中发现其中所蕴藏的规律性。二是数据分析技术要发展到一定程度,才能够实现对海量数据的深度分析挖掘,使有规律数据转变为有意义数据。三是通过科学有效的工作模式将分析得到的数据信

6、息融入到稽查、征管、评估、计统等税收工作的方方面面,将数据的作用最大化,推动税收工作的“数字化”革命。目前,税收数据的高度集中,“互联网+”、“云数据”等信息化新模式的出现,促进了数据信息的快速积累,为税收数据的深度分析应用在数据总量上创造了条件;数据挖掘技术的完善,为税收数据的深度分析应用在技术上提供了可能;金税三期工程建设的实施以及增值税发票升级版系统的推行,使税收信息化步入了一个全新的发展阶段,为税收数据深度分析应用开辟了道路。新阶段、新形势、新任务都要求必须加强数据利用,税收数据深度分析应用是税收信息化建设发展到一定阶段的必然结果,也是税收信息化发展的必然要求。因此,建立一套集多方数据

7、采集、数据深度分析、数据充分利用的一体化数据深度分析工作体系势在必行。(1)税收数据资源的分类收集税收数据资源是税务部门在税收征管过程中,根据其所能收集到的与之有关的数据信息,包括各种消息数据,情报数据,资料数据等,经过筛选,加工,处理,存取,能够满足税务部门及纳税人需求的,可以反映经济活动及其发展变化情况的各种信息的集合。税收数据资源在信息系统中又可以被分为程序数据、税收业务数据和税收相关数据;按来源可分为税务系统内部数据和税务系统外部信息数据两大类,内部数据来源于两个方面:首先是纳税人,纳税人是产生数据的主体(例如申报数据、发票领购数据、税务登记数据等);其次是税务机关,税务机关内部不同部

8、门根据各自职能围绕纳税人开展工作产生新的数据(例如稽查黑名单数据、风险预警数据、资源综合利用认定数据等);税务系统外部数据是政府职能部门及相关产业为纳税人办理审批和服务过程中产生的数据以及互联网数据(例如工商、国土、海关、建委、公安、银行、电力、石油等部门数据以及来源于网络的交易数据、物流信息、信息服务平台数据等)。(2)一体化数据深度分析工作流程一体化数据的分析工作一般流程为:数据的收集、数据的确认和存储、数据的加工分析、数据的传输使用、数据的交叉验证。结合日常的税务业务,得到一个完整的工作流,如图1所示。图 1(3)以流程为导向实施税收业务重组实施税收业务重组,首先要从税收数据流运转的角度

9、重新审视税收业务流程,运用信息管理的一般原理分析其本质,依托信息技术和数据流转规律建立适应税收数据流运转的统一规范的业务流程,可以实现全面的信息共享。结合实际工作,可以从下面三个方面进行流程优化:一是尽量减少、合并人工的信息流环节,实现纳税人与税务人员单点接触,甚至零点接触,以尽量减少或排除人为因素的影响;另一方面整合、简并面向纳税人的咨询、受理、审批等涉税流程数据,提高数据质量。二是重塑数据采集流程,提高数据共享度。重塑涉税信息的采集流程,实现各级、各部门和各行业涉税信息的广泛共享,充分利用现代信息技术,与统计、经贸、地税、工商、银行、技术监督、民政等相关部门建立横向、纵向联网体系;制定严格

10、规范的采集制度,使采集标准和口径统一,实现一次采集,多环节共用,提高信息共享度。三是科学设置税收信息流转工作流程。结合税收业务的要求,按流程、分环节设置,将税收信息流运转的主要环节科学分解到办税服务部门、税源管理部门、计算统计部门等各部门,各部门将各自信息初步加工后由数据处理部门整合形成数据分析报告。(二)数据挖掘在税收数据分析中的应用在1989年美国底特律召开的人工智能学术会议上,首次提出了“数据挖掘”的概念,此后,数据挖掘理论不断完善,数据挖掘技术飞速发展,目前数据挖掘的理论与技术已经相当成熟,金融、财务、通讯、互联网等领域在关于如何更好的利用数据挖掘技术服务产业发展的研究上已取得了显著建

11、树,美国等税收征管系统比较完善的国家也逐步将数据挖掘技术应用到税收工作的各个方面,并取得了显著成效。数据挖掘理论是在“大数据”时代开展数据深度分析利用最有力的武器。所谓数据挖掘,是一个从大量数据中抽取挖掘出其中隐含的、以前未知的、对决策有价值的模式或规律等知识的复杂过程。简单地讲,就是从大量数据中提取出有潜在用途的知识。数据挖掘的全过程定义描述如图2所示。图2如图2所示,数据挖掘的主要步骤有:数据清洗:清除与挖掘主题明显无关的数据和噪声数据;数据集成:组合来自多个数据源中的相关数据;数据转换:将数据转换为易于进行数据挖掘的存储形式;数据挖掘:利用智能方法挖掘数据规律或模式;模式评估:根据一定的

12、评估标准,从挖掘结果中筛选出有意义和价值的规律或模式;知识表示:利用可视化和知识表达技术,向用户展示挖掘成果。综合考虑我国税收信息化的建设情况以及近年来在税收信息化方面的研究成果,将数据挖掘技术全面地应用数据深度分析应用工作中,已经具备可行性。随着金税三期工程的进一步开展,税务决策支持子系统不断的完善,三方数据交互机制的建立,“互联网+”模式的进一步发展,数据挖掘技术必将使税收数据分析工作迈上新的台阶。(1)数据挖掘系统开展数据挖掘工作,首先要建立完善的、符合税收业务工作需求的数据挖掘系统。数据挖掘涉及多个学科,包括统计学、数据库和信息技术等。此外,不同的数据挖掘任务,还会运用到其他学科领域的

13、一些知识理论和技术方法。数据挖掘的复合交叉性,决定了数据挖掘系统的多样性。数据挖掘系统基本框架: 图3税收数据挖掘系统不但要挖掘金三核心征管数据库中的数据,还要挖掘相关的第三方信息,比如企业用电信息、国土资源信息、互联网交易信息、银行资金往来信息等对税收数据分析可能有用的信息,而后者,也就是第三方信息,是目前最迫切需要的也是最难挖掘的。要建立完善的、功能强大的税收数据挖掘系统,应该做到以下几点:一是在处理数据类型方面,数据挖掘系统应具备挖掘数据信息、文本信息、互联网信息、异构信息、历史信息功能。二是在数据挖掘的方法方面,数据挖掘系统应具备提供描述知识、对比概念描述知识、分类知识、关联知识、趋势

14、与演化分析知识等多种或集成的数据挖掘结果。三是在数据挖掘技术方面,应具备完全自主交互式、基于查询驱动、基于数据库与数据仓库技术、基于机器学习、统计等数据挖掘技术的整合。(2)数据挖掘算法数据挖掘算法可以将有用信息分类汇总、初步加工,让信息自动生成初步成型的逻辑关系,也是进行有效的数据分析必不可少的步骤。数据挖掘算法灵活多变,类型多种多样,下面列举几种比较常用的数据挖掘算法:统计学算法:在数据挖掘中常常会涉及一定的统计过程,通过这种过程可以从抽样分析中提取到未知的数学模型,如数据抽样和建模、判断假设以及误差控制等。决策树:决策树方法主要用于数据分类。一般分成两个阶段:树的构造和树的修剪。模糊逻辑

15、:模糊逻辑是模糊集合与布尔逻辑的融合。一个公式的真值,可在0,1区间任意取值。在数据挖掘中,常用来进行证据合成、置信度计算等,可为税收风险管理、数据质量监控、税源监控提供初步的情报信息。粗集:粗集理论是一种处理模糊和不确定问题的新型数学工具,可以处理的问题包括数据简化、数据相关性发现、数据意义的评估、数据的近似分析等。探索、完善有针对性的数据挖掘算法,可以另数据采集工作事半功倍。三、税收数据深度分析应用工作的重点(一)技术应用层面(1)规范数据资源分析应用流程税收数据资源分析应用不是一个独立的环节,而是一个互动循环的过程,是一个复杂的系统。首先通过对业务的理解,明确业务需求,即确定税收分析的目

16、的,从而提出问题;结合问题明确分析主题,围绕主题确定需要的变量和抽样方案,根据抽样方案从集中后的数据库平台中提取数据;按照实际需要对实施方案作进一步的调整,然后构建分析模型,通过模型计算得到分析结果,将其进一歩转换成可行的决策建议并付诸实施,评价实际工作中取得的成效,在此基础上提出改进建议,不断完善,得到最佳的决策方案。税收分析流程可以用下图描述。图4(2)注重数据挖掘流程标准化现行税收分析体系已经很难满足信息使用者对税务信息的一般使用要求。信息使用者往往需要自己完成对税收信息的再次加工和深度挖掘。信息使用者相互之间由于资源不能共享,进行了大量重复的分析工作,造成了资源的浪费。因此从社会经济的

17、角度出发,税收信息化的建设应该要考虑到使用者对于税务信息的需求,在税收分析模块中引入适当的数据挖掘流程。首先要对信息使用者进行深度调研,充分了解使用者的信息需求,明确税收分析的目的。根据税收分析的目的,更新税收分析体系构架,完善税收分析工作流程。(3)优化完善数据综合分析利用平台结合分析应用需求,采用数据仓库技术,开发囊括政府部门、银行、互联网等多渠道的税收信息资源接口,建立计统、税收预测、重点税源、税源调查、综合征管等税收信息资源分析集成平台,对各级税务机关和人员的业务处理、纳税人的主要涉税信息进行全面分析和监控,为决策提供辅助支持。研究业务系统查询功能与专用的査询分析工具整合问题,不断优化

18、数据应用技术体系。利用数据挖掘等技术,从集中后的统一的数据库中针对性的提取大量税收信息资源,从不同角度深层次、多维度的分析各项业务指标。其次,要开发常态税收信息资源分析模块,完善分析指标和评价体系:由业务部门提出需求,建立完善税收信息资源分析利用指标和评价体系,为基层提供指标参考标准,拓展税收信息资源分析模型,提高深度挖掘和综合分析税收信息资源的能力。开发常态税收信息资源分析模块、数据二次分析模块,实现对已分析数据的循环利用。完善业务査询统计分析功能,将相对固定成型的査询需求转化为一个分析査询功能,纳入综合数据分析利用平台中管理,从而不断提高税收业务信息资源査询需求的响应效率,进一步规范分析行

19、为,统一分析标准,提高分析效率,深化分析应用效果。(4)建立高素质数据分析人才团队无论什么工作,其有效开展的关键因素都在于人。税收信息资源深度分析应用需要使用先进的分析技术,比如数据仓库、数据挖掘技术等,这无疑给税收分析人员素质提出了更高的要求,不仅要掌握税务业务和计算机知识,还要了解数理统计,经济,管理等知识,因此为了保证税收信息资源分析应用的深入开展,必须提高人员素质,培养一支高素质的人才队伍。一方面加强对税收信息资源分析专业人员的培养,多给予税收数据分析应用工作实践及学习深造的机会,采取多种形式开展培训,有针对性地对分析人员进行专业培训,使其熟练掌握税收分析应用必备的基本理论、技能和方法

20、,提高综合素质和工作水平。另一方面建立税收分析人才库,选拔专业型、复合型人才,夯实数据处理工作的人才基础。通过内部培训和外部招聘培养一支高素质的人才队伍,为高质量地做好分析预测工作储备人才资源,他们不仅懂税收业务、计算机技术和数学分析技术,而且要有事业心和责任感,具备一定文字功底。(二)管理机制层面税收数据分析应用是一项复杂的系统性的工作,具有全局性、技术性、综合性,需要各级管理、业务和技术部门通力配合,上下一心,形成合力。为保证其高效运行,税务系统必须建立科学规范的税收信息资源深度分析应用管理机制:首先要在税务系统内统一思想,明确税收分析应用的目标,强化税务管理人员的思想意识;其次,建立完善

21、的基于税收分析应用业务流程的运行机制,健全分析应用考核评价体系。(1)强化思想意识,明确分析应用目标虽然税务系统已经开始重视税收信息资源深度分析应用,但是在整个税务系统内还存在着认识不足,认识不统一等思想问题,影响了整个税收分析应用的效率和质量,因此我们必须明确分析应用的目标,强化各税务管理人员的思想意识。以税收信息资源运用为重点,以税收信息资源质量监控为基础,以管理需求为导向,以综合平台为依托,以热点问题分析为突破,努力做到基础信息资源真实完整、信息资源数据分析模型科学合理、问题筛选准确及时、分析结果深入全面、应用渠道通畅高效,用税收信息资源描述现状、预测趋势,实现税源管理的科学化与精细化,

22、为决策服务,为管理服务,为基层服务,为公众服务。本着"循序渐进"的原则,相应制定近期短期目标和长期目标。短期目标:提出数据分析运用的业务需求和发展框架,构建"指标体系科学、数据标准规范、业务完整覆盖"的数据分析运用模型;完善"功能齐全、界面优化、操作简便"的数据分析利用平台,做到数据一次采集、多环节使用,不断提高税收管理和决策水平,减轻基层单位统计和上报报表数据的工作负担。提升对宏观税负、行业税负等指标的全面分析,继续完善相对统一的以纳税人税负预警指标、税种申报纳税收入与财务报表收入比对预警指标、分地区GDP宏观税负预警指标、分行业宏

23、观税负预警指标为主体框架的预警机制和纳税评估模型,强化评价征纳行为,预测税收变化趋势。长期目标:进一步对系统中积累的海量数据,运用先进的技术手段和数学模型,开展深度挖掘和增值运用,积极分析税收政策对各时期国民经济发展和产业布局的影响,不断把握税收与经济变化规律。不断挖掘税收潜力、实现征管流程再造,并进而为深化经济体制改革、优化产业布局、深化税制改革,提供较详实、准确、客观的数据分析运用报告。(2)完善绩效考核评价体系,规范税收分析工作流程按照税收信息流转环节,将各环节的工作过程和工作效果列入考核内容,比如将原始信息采集录入准确率等、税收分析成果转化与应用水平、纳税评估与稽查选案效果等列入考核内

24、容,从工作量化、工作质量、工作能力三个方面进行考核,同时将考核制度与现行征管制度衔接,如征管质量考核办法、风险管理制度、重点企业管理办法、纳税评估办法等数量化、精细化,将责任细化,并落实到基层单位和具体管理人员,进一步完善竞争激励机制。其次,对税收分析工作进行定期检査,对分析工作开展情况实行奖优罚劣;同时定期开展税收分析成果评审,对优秀的税收分析报告,比如反映问题深入、指导实践效果突出等,予以表彰、奖励,激发税收分析人员的积极性和创造性。四、发展税收数据深度分析应用存在的问题及建议(一)存在的问题近年来, 各地通过开展数据分析应用工作,取得了一定的成效,但是要想实现税收数据的深度分析应用, 还

25、必须关注并解决以下问题: 一是思想问题。目前很多税务干部对开展税收数据深度分析应用的意识不强, 没有树立数字化的现代税收管理理念, 对数据大集中形势下开展税收数据深度分析应用工作的紧迫性、重要性认识不足, 没有形成统一的思想认识。 二是机制问题。在开展数据分析方面投入的人力物力不足、技术部门与业务部门配合不紧密、分析结果落实反馈不力等问题, 没有建立上下联动、技术部门与业务部门密切协作的良性互动机制和数据深度分析应用的长效机制。三是数据采集面窄、共享性差问题。当前,税务机关采集的主要是纳税人申报表及附表所列的静态信息,没有采集纳税人的生产经营状况、商品数量、单价、库存量等动态信息,与系统外部的

26、部门间的信息资源交换和共享度差,与其他政府部门、银行部门、能源部门等部门的数据联网交互机制尚未建立,在互联网数据的获取方面仍存在技术短板。四是数据质量问题。从系统外部看,由于存在着纳税人纳税意识不强,纳税积极性、主动性不高等原因,一定程度地存在纳税人故意瞒报涉税信息、做假账等现象,造成纳税申报资料不实,不能正确反映纳税人的生产经营及财务状况,致使税务机关采集的纳税人涉税信息存在失真问题。从系统内部看,由于计算机操作人员人为失误导致的数据录入错误、录入信息不全等原因,导致系统中存在错误数据、垃圾数据以及数据漏洞。(二)几点建议(1)提高思想认识开展税收数据深度分析应用工作是数据大集中形势下税收信息化发展的必然要求,是提高税收工作竞争力和管理与服务水平的重要措施。谁抓住了这个机遇,谁就掌握了税收工作的主动权。因此,应统一思想,提高对税收数据深度分析应用工作重要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论