地税数据管理系统方案_第1页
地税数据管理系统方案_第2页
地税数据管理系统方案_第3页
地税数据管理系统方案_第4页
地税数据管理系统方案_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章建设背 第2章建设目 第3章建设方 第4章与其他系统的关 与征管的关 第5章实施建 部署我省管理信息系统已初具规模征管信息实现覆盖大部分管理领域在优化纳税服务强化征管规范行政管理等方面发挥了有力的支撑作用。随着数据大集中和图像音等行为数据并逐步向外部门第一的数据管理和数据管理体系理清数据管理思路明确数保数据资产得到系统高效安全的管理更好地服务决策、服务办税服务基层征管服务经济社会发展成为征纳双方信息不对称海量涉税信息与碎片化孤岛式信息管理的日益突出数据相对滞后数据分析利“收收入分析政策效应分析风险管理等工作深入开展的大期为基础以数据管理办法为抓手以税务数据资产为以据质量和利用效率的提升推动管理和服务的持续创新加快现代化建设。一、聚合数据形成全面可用的数据资二、统一平台实现统一数据管基于统一的建设全局型数据管理平台,实现数据统一、统一管理和统一应用。三、开放数据服务促进业务创、基于信息共享、开放经济的理念,将数据服务化,实、四、建立应用商店提供灵活、智能的数据应地税数据管理系统总体框架如下图所示:图3-1:数据管理系统总体框地税数据管理系统逻辑上分为三大部分:数据加工处理部分主要完成数据加工功能。数据数据部分主要实现数据标准管理管理、数据管理数据数据安全管理数据运维管理与数据知识管理等功能,通过数据实现对全局的数据管理。数据应用服务部分分为两类,一类是数据管理系统自身对持第社会开发商进行二次开发组合形成新的应用软件在各业务系统中,按照相关规保数据质量。接收来自数据管理系统的消息3.组织制定各自所负责业务领域的数据标准并进行ETL创建、领域分析模汇集数据需求并组织审、、、开发配置工具并进行数2.问题处按照业务需求及相关标准对数加工过程中的问题处理数据规划数据工组织制定数据质量检测标准或组织确定数据质量问题的解决数据质量问题处理处理业务部门运维需按照总体规划与设计建设数据按照业务需求开发各类数据应开发、部署数据服务,第厂商开发应用提供支第在数据管理系统的开放服务基础上,构建第应用软持查询接收的信息推地税数据管理系统的系统架构如下图所示,包括六大图3-2:数据管理系统架构示地税数据管理系统管理的数据包括四大类:内部数据指内部产生的各类数据包图3-3:内部数据构第数据指地税系统以外的其他部门行业主管图3-4:第数据构税务数据是指通过实地人际网络和图3-5:税务数据构互联网数据,指来自互联网的各类涉税图3-6:互联网数据构图3-7:数据源分数据处理是数据仓库的一个重要步骤,与传统数据仓库不同的是地税数据管理系统不但包含传统关系数据的处理而且还包含从互联网的海量数据及批量的文件等如下图所示:图3-8:数据加工处理过程示意传统数据的处传统数据包括内部数据、税务数据和第数据针对以上三种数据需要用到传统ETL处理过程对数据对数据进行转换即对过的数据进行结构转换代码统一、数据进行归集,即把汇总数据按照不同分析进行归类存放,形成数据库对数据进行归集对需要的数据进行有效集成,按模型予以组织对数据进行分析以便进行多角度多层大数据的处点对于互联网数据所内容数据结构复杂冗余数据多,先需要配置网络爬虫,对网页内容进行;然后利用大数据ETL布式等操作数据的过滤功能可以过滤掉导航页页只保留含有正文的页面再通过正文提取页面的标题正文信息提取出来其中正文要把HTML和导航栏数据网页底部的信息等无用数据过滤掉,只保留我们关心的文字部分最后的结果到HDF(hadoop分布式文件系统或者NosqlWordPDF具提取正文并保存;对于,可以用OCR识别软件自动识别文本。同理,对以上数据要进行、转换、匹配等。SqoopHDFS。潜在的数据价值将管理的传统业务转向数据分析数据挖数据:数据管理系统主要包括四方面数据内部数据第数据税务数据和互联网数据其中内部数据、第数据和税务数据主要以结构化数据为主,数据量较两种不同数据类型,系统引入了基于关系型数据库的传统:3-9:数据传统数据仓库的传统数据仓库中根据数据分布区域的不同,划分为原始数原始数据层:从各业务系统中过来的数据数据仓库层:分为轻度汇总层DW1层和汇总层DW2层。DW1册类查询及分户统计业务;DW2层基于DW1层上的汇总形成面DW1大数据数据仓库(HBase,(HDFS:(HBase的税务数据同步过来,为提供数据查询服务(Hive行为分析稽查的智能推送图谱的展示和纳税人等功能的实现。(HDFS数据文件、电子和税务搜索索引文件的传统数据仓库和大数据数据仓库并不是相互独立的,传统数据仓库中的涉税数据可以同步到大数据数据仓库中用于数据、传统数据仓库基于关系型数据库进行建设支持复杂的SQL进行开发的传统应用如统计查询风险管理交换和数据、创新应用,如税务搜索、智慧稽查和图谱等。数据.1.数据标准管实现各类信息资源的整合规定各类数据加工管理、共享发布的标准和规范使得各种分散的数据可以转换为在数据整合及治理的过程中需坚持依据数据对数准、管理标准两大类。技术标准是IT技术相关的标准,包括应准与安全标准等等;管理标准是IT制度体系的一部分,可以分地税未来的数据标准框架如下所示:图3-10:数据标准体系框执行与发布与管理控制等多个环节目标是构“有图3-11:数据标准管理过注:数据标准的管理流程详见《地税数据管理办法.2.管管理针对不同来源和不同类型的数据,提供的工具并提供统一的界面进行转换集成等各项功能的管理在设计和部署过程中各类工具差异配据第信息税务信息和互联网数据等四类数据分别进内部数据管、内部数据主要包括征管类纳税服务类风险难度中等。因此针对此类数据,系统采用的ETL工具进行。的ETL工具具有抽取规则管理、转换规则管理规则管理匹配规则管理抽取任务管理和抽取调度、图3-12:内部管第数据管、第数据主要包括来自外部部门的业务数据和行业数据,如部门数据工商部门数据部门数据房管部门数据、的特点是价值高集中度中等难度中等因此针对此类数、图3-13:第管税务数据管税务数据主要包括通过实地、人际网络和交换等方式获取并录入系统的信息如被者的行为人员流量、车辆情况等此类数据的特点是价值高集中度低难度高。图3-14:税务管互联网数据管、、、数据的特点是价值高集中度低难度高因此针对此类数据系统采用的分布式网络爬虫工具进行工具具有聚类搜索配置管理配置管理、转换规则管理、采集任务管理和管理等功能。、、、.3.数据管

图3-15:互联 管数据管理包括数据的生命周期管理、数据策略管数据生命周期管数据管理是数据仓库建设的基础支撑。数据管理采用分级管理策略。依据数据生命周期不同的活跃程度采用不同的策略。图3-16:数据生命周期管理示整合区:存放数据仓库中各层数据,其务数据只存放55-1010数据策略管数据仓库建设采用分级管理策略。依据数据不同的活跃程度采用不同的策略。分级管理如下图所示:图3-17:数据管理示数据随着时间的推移频率逐渐降低依据生命周期的不同阶段数据处于不同的区中分级管理策略对不同的区采用不同的管理。整合区包含数据仓库、数据集市、以及当前使用的数据,其务数据的是最近5年的数据,该区段数据需要频繁,采用高效率的磁盘阵列。近线区包含数据仓库、数据集市中5-10年的数据。区转移到近线区,该区段数据频率较低,采用效率较低、价格略便宜的磁盘设备。归档区归档区数据是近线区中超过10年以上的数据,生命周期归档服务定期将该数据移出近线区转移到归档区,该区段数据频率极低,偶尔统计或分析数据时会使用,采用价格便宜的归档、磁带类设备。数据分类管依据的数据如相关信息数据税务登记信息数据等。据。如申报数据、入库数据、抵扣联明细等数据。迁移策略管策略管题数据库对对近线区、归档区的历史数据采用不同的策略。对于近线区数据的历史主要有两种方式:直接方ETL对于归档区历史数据首先将归档数据恢复到归档数据中转区归档数据需要用的设备第二从归档数据中转区历史数据。备份策略管数据备份是管理的重要组成部分。数据备份是指为防止系统出现操作或系统故障导致数据丢失,而将整个系统制到其他的介质的过程。数据当发生数据丢失的时将发生之前的备份还原就在实际应用中备份策略通常是以上3种的结合例如星期一至星期六进行一次增量备份或差异备份,每星期日进行.4.元数据管、系统之中,从、加工、应用等各个环节均有元数、图3-18:元数据管、了解所有数据资源的生产转换和同步等所有相关活动,、完善数据库建设系统基础设施,为数据质量系统的规范数据资源管理,改进知识机制口径的理解,为分析应用结果提供数据;9元数据管理的最终目的是通过对元数据的分析和利用可.5.字典管数据字典是数据管理的一个组成部分。数据字典是对数据、理是有关数据的信息的收集和发布的机制这里主要涉、数据库信息指物理实体的数据库用户、服务器等位置、通过字典管理可以实现对字典信息查询及版、字典信息可以有三种方式实现手工程序自字典信息的包括字典信息补录及修改字典变更申请、字典变更、字典变更执行等功能。.6.知识管识、知识共享、知识、知识默化以及知识优化等。通过图3-19:数据知识管人员在应用实践过程中获得的认识、经验以及各种获取的数据模型数据分析方法典型分析案例等知识到知识库,知识生命周期管理知识资产评估动态浏览知识安全管数据的目的是为了提高数据的完整性准确性一数据分为事前预防、事中、事后检测三个阶段。事中是指根据数据标准对正在进入系统的数据进行校数据实现了对数据质量的闭环管,包括的具体环图3-20:数据流数据质量检测是根据预先配置的规则或算法,进行数据和规则校验,依据稽核和检查过程中发现的数据质量异该功能提供一个统一的数据质量问题,系统自动通过该进行问题单的填写和提交,并触发问题处理流程。数据质量评估是由数据人员根据需要发起,根据数据质量报告是对数据质量全过程累积的各种信息进行汇供了一个集中展示系统数据质量状况的窗口,数据人.8.安全管数据安全是信息系统安全的,以下是基于等级保护二级要求从数据管理数据安全技术管理以及数据安全运行管理面对数据的数据进行了规划,图3-21:数据安全管性、性、抗抵赖和数据备份和恢复。.9.运维管数据运维管理主要包括数据运营和数据两大部分,其目的是为了保证数据的正确性和数据的可用性。数据运维遵循图3-22:数据运维管数据的主要内容包括日常呼叫支持状态评估、数据运营主要包括数据转换数据数据入考核激励和等方面的工作流程管理包括管理服务管理规范数据加工管理规范数据管理规范数据应用管理规范数据规范数据安全管理规范数据运维管以数据资源服务和应用三种形式开放给开发商和、、数据资源将开放给开发商和,开发商和将通过数据统计分析、数据共享交换图谱、税务搜、、数据应用将开放给和,和通过税务搜索、图谱、Widget等应用和服务来使用数据应图3-23:数据开放与服务示、是土壤中的养料各种应用就是树上结出的硕果而开发商、和就是果实的人。树根吸收土壤中的这些成各种数据资源服务和应用开发商和选取自己需要的果实来。、图3-24:数据生态环.1.管管理是把通过实地、人际网络和交换等方式获取到的税务进行加工处理,并提供服务的过程。实地主要包括访谈、问卷 、现场观察被者行为、人员流量、车辆种典型案例中涉税数据从国际交换中定制从部门内不同区域中定制图3-25:数据管、、,、、处理包括规划加工数据分析等三大功能系其中规划包括指导关键数据权限分配等内容加工包括政策管理行业政策分析分类筛选和等内容数据分析包括指标数据指、、,、、、、、服务包括报告搜索服务推荐邮件推送、指标、分类导航和个人收藏等功能模块。、、、.2.税务搜统中通过查找关联数据和信息的功能。它是针对税务行图3-26:税务搜税务搜索是相对通用搜索引擎的信息量大查询确深度不够等提出来的新的搜索引擎服务模式,通过针对税务领域搜索细类全面,包括企业、企业服务、税务文库,企业,企业地址(地图)等。UI数据源包括税务内部数据、第数据、税 数和语义分析等先进的。.3.智能稽查管企业制度的广泛建立以及征管的不断深化和征管模式逐步与国际接轨,税务稽查工作着新的形势和任务。,传统的税务稽查主要以手工选案为主来源单一,图3-27:智能稽查管理了以自动推送数据分析为的智能稽查管理系统智能图3-28:智能稽查管理选案自动化采用智能推送与手工方式相结合避免了因素的干扰可以客观地进行综合稽查选案提高税务稽。、、数据多样化的分析数据不仅仅是企业财务数据包括税务数据数据、互联网、土地数据数据和统计。、、撞和图谱等多种分析方法对ERP数据互联网数据税务数据和数据进行全面、综合的分析和挖掘。.4.税银互图3-29:税银互动示更快发展实现共赢的一个数据创新应用税银互动的整体企业填写申请信息企业提供纳税数据税银互动评定双方信用数据,输出结果提供给银行银行通过,企业获得开展生产经营活动并归还税银互动更加准确地判断企业的财务状况和实际经营情况,节约成本,降低风险。运用范围提高对纳税信用等级的重视程度进而提高税法遵从度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论