(计算机应用技术专业论文)数据仓库技术在河南国税系统中的应用.pdf_第1页
(计算机应用技术专业论文)数据仓库技术在河南国税系统中的应用.pdf_第2页
(计算机应用技术专业论文)数据仓库技术在河南国税系统中的应用.pdf_第3页
(计算机应用技术专业论文)数据仓库技术在河南国税系统中的应用.pdf_第4页
(计算机应用技术专业论文)数据仓库技术在河南国税系统中的应用.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学硕士学位论文 摘要 随着数据库技术在税务系统应用的不断深入,河南省国家税务局积累了大量的 税务管理信息。如何能够实现对这些信息的深层次分析利用,是河南省国税局近年 来一直关注的问题。本课题旨在以河南国税局数据仓库建设过程为立足点,总结探 索出一套实用的数据仓库建设的理论和方法。并在此基础上,通过数据应用分析的 方法,对其在税收预测上的运用进行一些研究,这种技术对解决税务机关的数据分 析利用问题提供了很好的解决途径。 数据仓库系统包括三方面的内容,即数据仓库技术、联机分析处理技术( o n l i n ea n a l :c a lp r o c e s s i n g ,o l a p ) 和数据挖掘技术。数据仓库是企业进行数据 分析的基础,它的主要工作是将数据库中的原始数据进行归纳整理,聚集成一个可 供高层次使用的数据集合。在数据仓库的基础上有两类分析工具,一类是做分析型 工作的o l a p ,另一类是做预测型工作的数据挖掘。 论文的主要内容:通过对现行税收管理信息化工作的分析,总结出其特点和主 要问题所在并提出解决问题的主要发展方向。数据仓库理论的简单介绍,以及从理 论上如何通过数据仓库的建设思想来适应税收信息化工作中的实际环境,并解决其 主要问题。最后进行河南国税数据仓库建立的数据转换方法及建立数据仓库的主要 算法分析,以及在数据仓库建立后的数据分析和应用。 关键词:税收征管,数据仓库,联机分析处理技术 华中科技大学硕士学位论文 a b s t r a c t w i t ht h ea p p l i c a f i o no fd a t a b a s et e c h n o l o g i e s ,a ne n o r m o u sa m o u to fd a t aa b o u t t a x a t i o nm a n a g e m e n ti ss t o r e da th e n a nn a t i o n a lt a x t a t i o nb u r e a u m o r ea n dm o r e t a x c o i l e c t o r sp a yt h e i rr e s p e c tt oa n a l y s et h i sc o l l e c t e dd a t aa n dm i n i n gi n t e r e s t i n g k n o w l e d g ef r o mi t t h ep r e s e n tt h e s i sa i l n st oa d v a n c eas e to fp r a c t i c a lt h e o r ya n d m e t h o d sf o rd w ( d a t aw a r e h o u s e ) c o n s t r u c t i o no l lt h eb a s i so fh e n a nn a t i o n a lt a x a t i o n d wc o n s t r u c t i o np r e c e s s a n dw i t ht h ed a t aa n a l y s i s , w e dl i k et os e e k 曲- t e rs o m ew a y o ft h eu s eo nt h et a x a t i o nf o r e c a s t t h ed a t aw a r e h o u s es y s t e mc o n s i s t so ft h r e ep a r t s :t h ed a t aw a r e h o u s e t e c h n o l o g y , o nl a n ea n a l y t i c a lp i o c c s s i n g ( o l a p ) t e c h n o l o g ya n dd a t am i n i n g t e c h n o l o g y a st h ep l a t f o r mf o re n t e r p r i s et oa n a l y z ei t sd a t a , t h ed a t aw a r e h o u s e i n d u c e s ,p r o c e s s e sa n da s s e m b l e sl a wd a t ai nd a t a b a s ei n t od a t as e tw h i c hc a nb e a p p l i c a b l ef o rt h eu p p e ra p p l i c a t i o n s t w oa n a l y s i st o o l sa g ea v a i l a b l eo i ! t h eb a s i so f d a t aw a r e h o u s e :t h eo l a pf o ra n a l y s i sa n dt h ed a t am i n i n gf o rf o r e c a s t t h i st h e s i si sb a s e do nt h ef o l l o w i n gp a r t s :w i t ht h ea n a l y s i st ot h ew o r ko ft h e t a x a t i o nb u r e a u , w es l l m m a r l z ei t sm a j o rp r o b l e m s ,a n dp u tf o r w a r dt h ed i r e c t i o no ft h e s o l v a b i l i t y g e n e r a l l yi n t r o d u c et ot h et h e o r yo fd w a n dh o wt 0m a k ed wb er e a s o n e d w i t ht h e p r a c t i c e e n v i r o n m e n ta n d h e l p t o r e s o l v i n g t h e p r o b l e m si n v o l v e d a b o v e t h e d a t at r a n s f e rw a ya n dt h ea r i t h m e t i co ft h eh e n a nn a t i o n a lt a x a t i o nd w , t h e g e n e r a li n t r o d u c et ot h eu s a g eo ft h ei t 独创性声明 y 。1 0 1 1 3 2 2 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除文中己经标明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集 体,均己在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 一签名去扬 日期:) 咿喝年f 汐月;1 日 关于论文使用授权的说明 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密口 本论文属于在年解密后适用本授权书。 不保密团 ( 请在以上方框内打“4 ”) 学位论文作者娩乏! 扔 指导柳签 靴做储鹤:乏艺堋 艚剖磁 目期:砒年胡;j 日 华中科技大学硕士学位论文 1 引论 计算机管理信息系统在河南省国税系统应用已经有了1 0 余年的历史了,随着 税收信息化建设步伐的不断加快,国税机关的数据库中积累了大量的税源数据( 如 早期的z t 9 7 和如今的c t a i s 软件、金税工程数据等) ,同时征管数据的分布也由 原来的区县集中过渡到地市集中,并将在年内实现全省集中。这些数据既客观地反 映了企业的生产经营历史情况和现状,同时也蕴藏着企业乃至整个国民经济的发展 规律和趋势。国税部门如果能以数据分析为切入点,通过对纳税人数据信息的综合 分析,科学地分析税源发展的内在规律,可以预测税源发展趋势,发现税源管理中 存在的问题和不足。 1 1 数据的分析应用存在的问题 自从实行税收征管电子化以来i 埘,特别是河南省推行c t a i $ 软件以来,税收管 理软件不断得到成熟与完善,但数据的分析应用程度仍然较低。 1 是税收电子信息数据综合利用率较低,仅限于分类统计、静态查询的层面 上,潜在效能远远没有发挥出来。 2 企业涉税信息分散在z t 9 7 、馓i s l 0 5 、傩i s 2 0 、防伪税控、进出口管 理等多个管理系统中,整合度不高。同时,系统所显示的信息,不能够从区域、行 业等角度进行动态对比、分析。 3 ,税收电子信息数据格式不统一、不规范,各类应用采用了不同的数据库产 品,信息交互困难,对税收指标口径的理解各不相同,给科学利用历史数据带来不 便。 4 纳税评估软件信息源不足,对象确定的难度和工作量成倍增加。如:新办 的商贸企业用票情况、“四小票”的进项抵扣额占同期全部进项税额5 0 以上的纳 税户等信息,现有的管理软件都不能准确提供,影响了评估效能的发挥。 华中科技大学硕士学位论文 1 2 如何实现数据信息共享 如何以一种有效的方式逐步整理各个业务处理系统中积累下来的历史数据,并 通过灵活有效的方式为各级业务人员提供统一的信息视图,从而在整个系统内实现 真正的信息共享,一个比较好的办法就是先分步骤完成数据仓库的建设,再逐步开 展数据分析应用。 从技术上讲,河南省国税局开展数据分析的条件已经成熟。因为该局已经建设 了大集中系统,业务集中提供了统一的业务规范和可靠的数据质量,这为数据分析 的实现准备了良好的数据环境。 在国外数据仓库技术在税务领域成功应用的案例为数不少1 3 1 ,比如i b m 帮助新 西兰国税实施了c r m :1 9 9 8 年帮助加州税务启动了基于i b md b 2 数据库软件的综 合逃税入监察项目数据仓库解决方案( i n c ) 项目,使加州税务能够在超过2 2 亿 项的独立税务信息中利用商业智能技术进行业务分析。又比如n c rt e r a d a t a 已经成 功地实施了包括美国国家税务局( i r s ) 、澳洲国家税务局( a t o ) 等在内的数据 仓库和数据挖掘项目。数据仓库的效益仅1 9 9 6 年就帮助美国国家税务局追回补交 税款两亿笔、增收2 0 0 亿美元的税金和罚款,并进行了1 2 0 万笔帐目审计。 数据仓库概念始于上世纪年代中期,随着人们对大型数据库系统研究、管 理、维护等方面的深刻认识和不断完善,为数据仓库提出了更为精确的定义,即“数 据仓库是在企业管理和决策中面向主题的、综合的、于时间相关的、不可修改的数 据集合”。以国税系统业务为例,管理型系统围绕功能进行设计:税务登记、申请 文书、购买发票、纳税申报缴款、税务稽查等。数据仓库则针对主体:纳税人、 购票纪录、缴款纪录、稽查结果等。主题的排列次序关系数据仓库的设计和实现。 管理型系统需要考虑过程的设计,而数据仓库不需要决策分析所不需要的数据。数 据挖掘是指从大量的数据库中抽取出此前还没发现的有效实用的信息,并且此后使 用此信息来帮助制定关键的商业决策的过程。在实旖过程中应充分考虑数据仓库与 数据挖掘的关系:数据仓库是基础,数据挖掘是数据仓库之上的高层应用。二者需 整体规划、分步实施。 2 华中科技大学硕士学位论文 针对河南省国税系统的实际情况,将数据仓库从逻辑上分五个层面 4 , 5 , 6 1 ,即: 源数据层、数据导入层、数据存储与管理层、中间服务层和前端应用层。 1 源数据层包括该局的业务数据( 征管系统、金税系统、出口退税系统等) 、外 部数据( 包括工商、地税、海关等有关单位信息) 和其他数据等。 2 数据导入层主要完成源数据向数据仓库系统的抽取、传输、转换和加载,需 要配备数据加载转换( 明 l ) 服务器。由于系统涉及到数据源较多且模式复杂,需 要对源数据作一些比较复杂的转换与清洗工作,较为理想的方法是在中央数据仓库 中设置一部分存储空间来作为数据转换与缓冲区,借助数据仓库引擎强大的复杂查 询处理能力,通过s o l 实现数据的转换与清洗。 3 数据存储与管理层是整个系统的核心,通过数据仓库统一存储和管理各种数 据,这些数据通过逻辑数据模型( l d m ) 进行组织和重构;为了数据应用分析的需 要,还可以在该层根据用户层的不同,建立相应的数据集市 4 中问服务层主要包括o l a p ( 联机分析系统) 服务器,o l a p 技术主要通过 多维的方式来对当前的和历史数据进行分析、查询,能够很快地向业务人员提供一 定范围内灵活的多维分析报表,比传统的通过编程来生成报表的方式要快捷得多, 从而实现访问方式豹多样化和信息存取的透明化。 5 应用层主要包括决策分析用户:决策分析用户主要访问o l a p 服务器或直接 对数据仓库进行存取,实现随机查询、统计报表和决策分析功能 该系统从用户岗位上分为基层数据处理和决策层数据处理两层。基层数据处理 岗位侧重于微观数据分析处理,根据上级部门数据分析结果对单户纳税人进行纳税 评估、企业信用等级评定等,偏重于税源监控分析。一是运用。税收负担率”这个 指标,纵向监控企业发展变化情况,对企业的长期和短期经济情况进行分析,掌握 企业的税负情况和变化趋势,发现企业在某一时期的纳税异常问题,为税源管理提 供依据;二是横向监控行业税负。在同一行业中选择三年或三年以上通过税务稽查 未发现偷逃骗税行为的依法纳税并且正常经营的企业,计算其税负,并作为本行 业内的税负标准,与行业内其余企业的税负情况进行对比,如果高于或者低于这个 比率,则说明企业纳税存在异常。然后把筛选出的税负异常的企业,运用数学统计 3 华中科技大学硕士学位论文 的原理。测算出税负的偏离率,对偏离标准税负率较大的企业进行监控分析,为税 源监控管理人员提供实时的相关数据,认真分析企业税负异常的原因,看看是否存 在偷税行为或征过头税的行为,极大地提高了税源监控管理的针对性。 决策层数据处理侧重于宏观数据、行业数据、重点税源分析。一是进行区域税 收收入形势发展预测,把握工作主动权。在数据采集过程中,要进一步扩大了信息 数据来源,把统计部门的宏观经济指标纳入数据信息范围,并通过分析各类宏观经 济指标,如对g d p 、社会消费品零售总额、工业增加值、工业用电量等每一经济分 指标,建立模型进行预测,测出单个指标对税收指标的影响,再用基于b p 神经网 络回归的线性神经网络组合模型进行预测,测出多个经济指标分别对税收指标的影 响,然后,再通过数学模型来确定每个经济指标对税收指标的影响程度,综合分析 这些指标和税收指标的相关弹性系数,研究宏观经济和税收之闯的关联度,通过经 济的发展趋势来预测税收的发展趋势,预测一个地区或者行业的纳税能力,从而使 组织税收收入工作建立在客观经济税源的基础上,把“依法治税,依率计征,坚决 不收过头税”的组织收入原贝落实到税源管理工作中。 数据仓库是在螺旋式开发方法学的指导下开发的,需要一个持久的过程,业部 门在业务的开展过程中会不断提出新的需求,也就是说模型的开发同样也是无止境 的,这将是一个不断探索、不断完善的循序渐进的过程。 1 3 研究数据仓库的重要意义 近几年来我国在数据仓库的应用方面已有了开端用,进一步加强数据仓库技术 的研究和应用推广有着重要的意义。 第一,推进和推广数据仓库在一些重要行业、大型工业企业以及重要政府部门 中的应用,可以提高管理决策的现代化和科学化水平,面对加入w t o 后来自国外 的竞争,尤其重要。在金融、保险等行业中,数据仓库的应用可以提高企业或行业 规避风险、市场预测的能力;在工商业中数据仓库的应用可以提高企业对市场、客 户的分析、预测及适应能力;在制造企业中,数据仓库的应用可以提高产品质量,增 4 华中科技大学硕士学位论文 强企业的生产组织能力;在一些政府部门,数据仓库的应用可以提高业务能力,有利 于制定更合理的方略、政策,有利于提高宏观计划能力和不利因素防范能力。 第二,加强数据仓库技术研究既能促进应用,又能降低数据仓库构造成本。目 前数据仓库的辅助工具,数据库平台等都采用国外的产品,这既不利于在国内开展 数据仓库建设,也带来了成本的升高。国外和国内在信息系统建设水平、数据使用 习惯、报表结构等方面有较多的差异。研制适合中国应用现状的解决方案、辅助工 具等有着重要意义。也有利于向国内外用户提供咨询 第三,加强数据仓库技术研究,有利于指导企业信息环境的建设与重构。目前 运行的许多数据库应用系统,由于系统互相独立,数据不一致以及异构性,导致数 据集成困难重重,极不利于作全局应用数据仓库的思想提示我们,在设计数据库 系统时,要从全局出发,形成一定的信息资源管理标准,自上向下地建设数据库, 注意数据的一致性,从而为建设全局级的集成信息系统进而构建高档次的企业数据 环境打好基础。 1 4 本课题的研究目的与研究内容 本课题拟将通过信息整合技术,实现数据仓库和税收征管业务数据库的无缝整 合,按照一定的模型,建造一个企业级的数据仓库,实现税收征管业务数据的自动 采集、清洗、汇总。 根据一定的业务口的需求,认真制作需求分析,解决数据仓库数据结构的设计 方法,数据集成方法和追加方法,并努力提高这些方法在一定场合下的实用性。然 后需要解决的问题是使用哪种多维分析工具,有效地将数据转化为灵活的报表和决 策支持信息。 1 5 论文结构 论文第二章通过对现行税收管理信息化工作的分析,总结出其特点和主要问题 5 华中科技大学硕士学位论文 所在并提出解决问题的主要发展方向,并对当前河南国税数据仓库的需求进行分 析。第三章是数据仓库理论的简单介绍,以及从理论上如何通过数据仓库的建设思 想来适应税收信息化工作中的实际环境。并解决其主要问题。第四章是对河南国税 数据仓库建立的数据转换方法及建立数据仓库的主要算法分析。在数据仓库建立后 的数据分析和应用。 6 华中科技大学硕士学位论文 2 税收管理信息化状况及需求分析 2 1 税收管理信息化回顾 所谓税收管理信息化【8 j ,又称税收电子化,就是当代信息技术在税务管理中的 全面应用。包括税收征管中的信息技术应用与税务部门内部管理中的信息技术应用 两方面。税收管理信息化,是加强税收征管,提高税务管理效率的客观要求,是信 息技术应用日新月异的必然结果。 到目前为止,税收管理信息化己经经历了起步、初步应用和迅速发展三个阶段, 目前正处于发展的关键时期。 税收管理信息化的起步阶段f 9 】是从1 9 8 3 年到1 9 9 0 年4 月,主要应用于税务系 统的计会部门,计算机主要用来输入、产生向上报送的报表,基本不涉及征管其他 方面。 1 9 9 1 1 年4 月,全国税务系统第一次计算机应用工作会议的召开标志着税收管理 信息化进入第二阶段,即初步应用阶段。1 9 9 0 年,征管改革全面展开,在全国推行 征收、管理、检查三分离或征管、检查两分离和纳税人主动申报纳税的征管新模式。 征管模式的转换,客观上要求征管领域采用计算机技术,从此税收电子化的重心向 税收征管领域转移。这时的征管软件主要实现了税务登记、填开税票、做税收统计 报表和会计帐等功能,应用面有所扩大,但深度远远不够。 自1 9 9 5 年开始,为了保障新税制的顺利运转,我国又推行了新一轮的税收征 管改革,确立了“以计算机网络为依托”的新征管模式 1 0 l 。从此,税收管理信息化 进入第三阶段,即迅速发展阶段。这一阶段的主要特点是:一、计算机硬件和技术人 员规模迅速壮大;二、税收管理信息化向网络化方向快速发展;三、利用计算机和网 络技术加强税收征管是这一阶段税收管理信息化的中心;四、税务系统内部办公自动 化系统开始启动。并迅速展开。 7 华中科技大学硕士学位论文 2 2 税收管理信息化的主要特点 1 税收管理信息化与税收征管改革密不可分是当前税收管理信息化的最重要特 征 税收征管是税务部门的中心工作【1 1 】。当前税收征管改革的目标是建立“以纳税 申报和优化服务为基础,以计算机网络为依托,集中征收,重点稽查”的税收征管 新模式。税收征管的地位和“以计算机网络为依托”的征管模式决定了税收电子技 术应用与税收征管改革密不可分,贯穿于税收征管改革过程中。 1 ) 税收征管改革离不开税收管理信息化的支持 没有信息技术的应用。“集中征收,重点稽查”根本无法实现。由于经济的飞 速发展,纳税人的规模不断扩大,纳税人与税务人员之间的比例越来越大,以郑州 市某区国税局为例,目前该局管理纳税企业达3 万,而税务人员只有3 5 0 人左右, 平均每位税务人员至少要管理1 0 户纳税企业,如果用手工方式来实现“集中征收” 简直不可想象,更不要说“重点稽查”。所以,该局在进行税收征管改革中,首先 考虑应用计算机技术,建立了以计算机技术为支撑的纳税申报大厅,实现了“集中 申报,重点稽查”,提高了征管质量。 税收管理信息化是税收征管改革的重要内容 “以计算机网络为依托”是税收征管新模式的主要内容之一。只有在计算机网 络环境中,才能在税收征收、管理和检查职能分离的情况下真正实现税收管理信息 共享,从而使税收征收、管理和检查部门相互配合、相互制约;只有在计算机网络环 境中,上下级税务部门之间、各地区税务部门之问才能及时迅速地传递信息资料, 增值税交叉稽核体系、出口退税协查机制才能运转;也只有在计算机网络环境中, 才能实现与银行、海关、公安、工商管理等部门之间的信息沟通,建立起有效的协 税护税网络。 3 诫收管理信息化推动了税收征管改革发展 税收征管新模式的主要内容之一是建立纳税人自行申报制度。利用现代电子技 术的电子申报方式是重要的纳税申报方式之一,有利于健全纳税人自行申报纳税机 8 华中科技大学硕士学位论文 制。电子申报能完成增值税的计算,并对各种报表的数据关系作程序化逻辑处理审 核,不仅规范了纳税人的纳税行为,使纳税申报资料内容规范、数据准确、报送及 时,两且建全了纳税申报机制,使税务部门受理申报更加方便快捷,减少人为因素 造成的差错,较好地解决了手工作业时带来的工作量大、效率底、内部制约机制不 健全等问题,也减少纳税人的排队等候时间。 此外,税务管理信息化也拓宽了为纳税人服务的渠道,特别是互联网技术的应 用提供了一个为纳税人服务的崭新舞台,可以在互联网上提供税法宣传、税法咨询、 接受违法举报,甚至接受纳税申报等服务。 2 利用当代信息技术,建立一套监控税收征收全过程的多层监管体系是当前税 收管理信息化的中心工作 当前税收征管体制改革的实质是税收工作由传统的“分散征收,分兵把口”的 粗放型管理,向现代化的集中征收、重点稽查的集约型管理的转交。在这一转交过 程中,对税收管理全过程的监控不足不断暴露出来,偷税漏税案件,特别是增值税 专用发票案件时有发生,所以加强税收监控已成为税务部门工作的重中之重。为此, 各级税务部门也把税收电子化的重心转向了“利用当代信息技术,建立一套监控税 收征收全过程的多层监管体系”,包括税源分析监控系统、申报入库监控系统、发 票管理系统、登记申报监控系统和查补税款监控系统等。 3 计算机网络应用是当前税收管理信息化的工作重点 计算机网络是信息时代的基石,是计算机应用的高级阶段。税收管理信息化离 不开计算机网络,单机运行已远远不能满足税收管理信息化的需要。 1 1 计算机网络建设是税收管理信息化工作不可缺少的部分 1 9 9 4 年以来,我国进行了较大规模的财税体制改革,建立了以增值税为主体的 流转税体系,实行了分税制,国税系统实行了全国垂直管理。这一管理模式客观上 要求进一步加强上级对下级,特别是国家税务总局对各省市级税务部门的管理。此 外,增值税的管理,特别是增值税专用发票管理更需要加强各省市税务部门之问的 沟通和联系,形成全国范围的增值税专用发票监控体系。鉴于这些管理的需要,税 务部门一直把建设覆盖全国的税务系统广域网作为税收电子化的重要工作。目前, 9 华中科技大学硕士学位论文 税务总局到各省级税务部门的广域网已初具规模。 此外,为支持税收征管软件的应用推广和办公自动化的需要,各级税务部门也 一如既往地把建设计算机局域网当作税收电子化的重点工作。 加强计算机网络应用是当前税收管理信息化的重中之重 经过数年的建设,税务部门的计算机网络己具相当规模,充分利用计算机网络 资源为税收管理服务是当前税收管理信息化工作的重要内容。加强计算机网络应用 主要从两方面展开。 一方面是加强税务管理的网络应用。主要包括强化税收征管、支持税务稽查以 及优化服务等方面的计算机网络应用。强化税收征管就是利用计算机网络的数据共 享功能,建立一套监控税收征收全过程的多层监管体系:支持税务稽查就是利用计算 机网络和数据库技术从多方面提取收集各方面的涉税信息,以便及时全面掌握纳税 人的情况,加强对纳税人的检查和监控;优化服务就是利用计算机网络,特别是国际 互联网为纳税人提供税法咨询、接受网上举报、网上申报等服务。 另一方面是提高办公效率,实现办公自动化方面的网络应用。主要包括电子邮 件系统的应用、公文处理系统的应用、人事工资管理系统的应用以及其他管理系统 的应用。 2 3 当前税收管理信息化存在的问题 1 首要问题是人的问题 与整个1 1 r 行业一样,在税收管理信息化过程中,人始终是第一位的。税收管 理信息化过程中存在的人的问题主要包括两方面,首先是专业技术人员的缺乏,特 别是那些既懂计算机技术,又懂税收业务和管理豹复合型人才的缺乏;其次是税收管 理人员计算机应用水平不高,主要体现在税务人员的计算机应用的意识还不太高、 税务人员掌握的计算机操作技能还不够。 2 征管改革进度不一致造成的征管业务不规范与建设信息系统的规范化要求之 间存在一定的矛盾 华中科技大学硕士学位论文 税收征管计算机应用一方面以税收征管业务规范为前提,一方面又促进征管业 务的进一步规范。在实际工作中,各地税务部门的征管流程不尽相同,缺乏统一和 规范,这己成为推广统一征管软件的最大障碍。 3 计算机网络建设与计算机网络应用还不同步 这些年,税务部门的计算机网络建设速度很快,但计算机网络的应用,特剐是 广域网的应用却相对滞后,在网络上的应用软件还很少,网络资源没有充分利用, 在一定程度上造成了浪费。 4 税收专业管理软件各自为政,互不沟通,税收管理信息化缺乏整体性和系统 性 税收管理是一个完整系统,各个管理环节相互联系,密不可分。但目前我们在 开发税收管理软件时却过分强调专业化管理,开发了许多相互分离的税收专业管理 软件,如税收征管系统、出口退税管理系统、交叉稽核系统、稽查管理系统等,这 些系统的信息缺乏沟通,形成了许多“信息孤岛”,造成宝贵的信息资源无法利用 的局面。 2 4 税收管理信息化发展目标 1 在统一规范的税收征管流程的基础上,以计算机网络为依托,建立一套监控 税收管理全过程的监管体系1 1 2 1 ,是未来税收管理信息化的最终目标之一 以计算机网络为依托的监控税收管理全过程的监管体系主要包括三层监控系 统,即决策层税收监控系统、管理层税收监控系统和操作层税收监控系统。 1 ) 决策层税收监控系统 决策层税收监控系统1 1 3 】主要为各级税收决策部门服务,实行对本级税收的总体 分析监控和对下级税收的分析与监控,包括分析纳税人分布结构及变动情况、及时 了解纳税申报总体状况,严密监控各级税务部门的税收完成情况等。 决策层税收监控系统必须建立在全国税务系统骨干广域网和省市级骨干广域 网之上,利用计算机广域网将下级税务部门的税收征管信息及时收集汇总,由决策 1 1 华中科技大学硕士学位论文 层税收监控系统及时统计分析税收状况。这一监控系统在国家税务总局设立全国税 收监控中心,在各省市设立税收监控分中心,在各地区、县税务部门设立监控子中 心。 2 1 管理层税收监控系统 管理层税收监控系统【1 4 1 就是监控税收征管各环节之间关系的系统。税收征管从 税务登记到税务稽查的各个环节是一个有机整体各环节的业务有其不可分离的关 联性和不可颠倒的顺序性。对税收征管各环节之间的监控,不仅有利于提高税收征 管工作的质量,而且有利于各业务部门各司其责,协调配合高效率地开展税收征管 工作,管理层税收监控系统是基层税收征管系统的重要组成部分,应用的前提是税 收征管流程规范,税收管理各环节职责分明。 管理层税收监控系统主要完成两方面的监控,一方面是征管各环节的顺序监 控,即纳税事项的监控,纳税人要先办完某些事项后,才能办另一些事项,例如只 有先办理了增值税一般纳税人认定手续,才能购买增值税专用发票。另一方面是各 环节相关内容的监控。最典型的相关监控就是税务稽查环节及时获取申报征收环节 的信息,对纳税人的纳税情况进行分析。并按预设条件筛选可疑对象,为税务稽查 及时提供案源。 3 ) 操作层税收监控系统 操作层税收监控系统【坶也是基层税收征管系统的基本组成部分,主要完成税收 征管各环节内部的监控。这种监控主要包括两个方面,一方面是期限的监控,即对 纳税人是否按时办理有关涉税事宣进行监控,监控的主要目标是督促纳税人按时办 理涉税事宣,并对逾期办理涉税事宜的纳税入依法进行规范化处理;另一方面是逻辑 监控,即对纳税a 提供的资料进行逻辑审核,监控的主要目标是及时捕捉纳税人提 供的税收资料中的逻辑错误,并对其依法进行规范处理。 以上三层税收监控系统的关系是:管理层和操作层为决策层提供及时、准确、可 靠的信息,决策层及时指导管理层调整监控重点,他们组成为一个有机的严密税收 监控体系。 2 刑用当代信息技术,在税务部门建立包括各方面涉税信息的“信息仓库”,是 华中科技大学硕士学位论文 今后税务部门计算机网络应用的基础和核心 建立包括各方面涉税信息的“信息仓库”1 1 6 1 ,是税收管理的客观需要。第一, 加强税务稽查需要建立包括各方面涉税信息的“信息仓库”,及时、准确,全面掌 握纳税人的信息:第二,加强税收监控要求建立包括各方面涉税信息的。信息仓库 当发现纳税人在“信息仓库”的某一涉税指标异常时,及时加强对纳税人管理,防 止偷漏税;第三,对税收整体状况分析需要建立包括各方面涉税信息的“信息仓库”。 税收与其他经济活动密切联系,如果要客观分析税收情况,必须掌握全面的涉税经 济信息;第四,解决税务部门“信息孤岛”问题也需要建立包括各方面涉税信息的“信 息仓库”,利用计算机网络和数据库技术将“信息孤岛”的信息收集到“信息仓库”, 实现征管信息共享。 税务部门的“信息仓库”需要收集两方面的涉税信息。一方面是税务部门内部 掌握的税务登记信息、发票领用存信息、纳税申报信息、税款入库信息以及稽查历 史信息等另一方面是税务部门外的涉税信息,主要包括企业内部经营情况信息、工 商登记信息、金融部门的纳税入资金信息、海关的货物进出口信息以及公安部门的 有关信息等。 税务部门可以建设两级“信息仓库”,在国家税务总局设立国家级“信息仓库”, 在省市级或较大城市设立省市级“信息仓库”或跨省市按大区建立区域级“信息仓 库”。全国各级税务部门可以通过税务系统广域网共享这些“信息仓库”的信息资 源。在此之前可以在各区、县设立小型“数据仓库”作为尝试和准备。 建立税务部门“信息仓库”的前提有两个:一是建立税务部门内部商速稳定的骨 干广域网,二是实现税务部门与工商、银行、海关、企业以及其他部门的计算机联 网。利用当代信息技术,特别是计算机网络技术、数据库技术和软件开发技术等在 税务部门建立包括各方面涉税信息的。信息仓库”是税务部门计算机网络应用的基 础和核心。 通过以上两方面的建设,税收管理信息化就既有形式( 网络) ,又有内容借息) , 再加上税务系统内部办公自动化的全面运行,税收管理信息化就能迈上一个新台 阶,“以计算机网络为依托”的新征管模式真正得以建立,税务管理实现现代化, 华中科技大学硕士学位论文 税务管理的质量和效率得到全面提高。 2 5 河南国税数据仓库系统需求分析 要做好一个税收决策系统,首要任务是做好需求分析。我的做法是向省局和直 辖市局领导咨询,通过咨询和探讨,结合自己多年来的工作实际,总结出可以给领 导决策提供依据的几个重要问题: 下一时期的全局税收预测 分行业、分地区纳税人的税负情况 下一时期的分行业税收预测 重点税源户( 一年度缴纳税款达到一定数额的纳税人) 的税收监控 偷逃税户的发现和稽查 新税收增长点的发现 另外还有一些比较简单的,通过完善现有的征收管理软件就可以实现的功能, 这里不再一一罗列。 有了税收决策系统的需求,下面对征收管理数据进行分析从河南省国税系统 来说,征收管理软件的数据库系统,经历了两个阶段:第一脚介段是f o x p r o w 2 5 b 数据库管理系统,从1 9 9 5 年到2 0 0 0 年底;笫二个阶段是大型关系数据库s y b a s e 系 统,从2 0 0 1 年初至今下一步我们根据目前国税系统的从总局到县局和税务所的 四级主干广域网,征收管理数据将合并至一处,预计2 0 0 6 年底河南国税数据库管 理系统将统一转换为s y b a s e 数据库管理系统。 现阶段s y b a s e 数据库管理系统支持下的征收数据结构如图2 1 。 经过对税务信息系统源数据分析和数据层次结构的划分,税务信息系统中数据 的流程( 流向) 如图2 2 所示。 从图2 2 中可以看出,系统的数据流程分为数据迁移,数据汇总和数据分割三 个步骤。 华中科技大学硕士学位论文 图2 1 征收数据结构图 图2 2 数据仓库数据流程图 华中科技大学硕士学位论文 1 ) 数据迁移 数据迁移是指把各种数据源中的数据“车 移”到税收分析系统数据仓库中,产生 源数据、及元数据。 转移的过程依次包括: 抽取( e x 仃a c o ,即从各种数据源中抽取相关数据,以便将数据放到数据仓库中 转换( 仃a n s f o r m ) ,即必须将数据转换成数据仓库的数据库结构和内部格式。 清洗( c l e a n s o ,即确保数据有足够的品质为其所用于的决策服务。 加载( 1 0 a d ) ,即将净化后的数据加载到数据仓库数据库中。 数据汇总 数据汇总( s u m m a r i e s ) 是指根据某种需要( 如时间粒度不同) ,把数据仓库中的 原子数据作综合计算,预先计算出总额、平均数以及类似的经常使用的数据。这些 汇总数据存贮到数据仓库的汇总表中。数据汇总的方式与业务流程紧密相关。 3 ) 数据分割 数据分割有多种标准。例如,按时间、商业线、地理位置、组织单位、所有上 述标准分割。数据分割的标准严格由开发人员来选择。然而,在数据仓库中,按日 期来划分历史数据几乎总是数据分割标准中的一个必然组成部分。 2 6 小结 通过对现行税收管理信息化工作的分析,总结出其特点和主要问题所在并提出 解决问题的主要发展方向。然后结合当前税收征管系统的征收数据的基本数据结 构,作出详细的需求分析,描述出数据的流程。 华中科技大学硕士学位论文 3 数据仓库系统基础 数据仓库的目的是要建立一种体系化的数据存贮环境【”,将分析决策所需的大 量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、 统一的信息,企业内不同单位的成员都可以在此单一的环境之下,通过运用其中的 数据与信息,发现全新的视野和新的问题、新的分析与想法,进而发展出制度化的 决策系统,并获取更多经营效益。 3 1 什么是数据仓库 社会的需求和计算机技术的不断发展,人们开始尝试对原来数据库中的数据进 行再加工,形成一个综合的、面向分析的环境,以支持科学决策的产生。由此,数 据仓库的思想、技术、产品逐渐开始形成。对于什么是数据仓库,许多人提出了不 同的看法。数据仓库概念f l s , 1 9 , 2 0 的创始人w h i n l n o l l 在建立数据仓库一书中指 出:“数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持 经营管理中的决策制定过程。“ 虽然还没有形成统一的定义,但以上观点都或多或少地指出了数据仓库有以下 几个特点:数据仓库中的数据是面向主题的、集成的、不可更新的( 稳定的) 、随时间 不断变化的,建立数据仓库的目的是为了更好的支持决策的制定。 1 面向主题 主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类 并进行分析利用的抽象。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及 的分析对象,是针对某一决策问题而设置的。面向主题的数据组织方式,就是在较 高层次上对分析对象的数据的一个完整的、统一的、一致的描述,能完整、统一地 刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。 目前,数据仓库的实现主要是基于关系数据库,每个主题由一组关系表或逻辑 1 7 华中科技大学硕士学位论文 视图实现。这些表和视图的内容与原来各个运行系统数据源的数据本质上是一致 的,但为了方便支持分析数据处理,对数据结构进行了重组,其中还可能会增加一 些数据冗余。 2 集成的数据 数据仓库中存贮的数据是从原来分散的各个子系统中提取出来的,但并不是原 有数据的简单拷贝,而是经过统一、综合。其一,数据仓库的数据不能直接从原有 数据库系统中得到。原有数据库系统记录的是每一项业务处理的流水帐,这些数据 不适合于分析处理,在进入数据仓库之前必须经过综合、计算,抛弃分析处理不需 要的数据项,增加一些可能涉及的外部数据。其二,数据仓库每一个主题所对应的 源数据在原分散数据库中有许多重复或不一致的地方,必须将这些数据转换成全局 统一的定义,消除不一致和错误的地方,以保证数据的质量。否则,对不准确,甚 至不正确的数据分析得出的结果将不能用于指导企业作出科学的决策。对源数据的 集成是数据仓库建设中最关键,也是最复杂的一步。 3 数据不可更新 从数据的使用方式上看,数据仓库的数据不可更新,这是指当数据被存放到数 据仓库中以后,最终用户只能通过分析工具进行查询、分析,而不能修改其中存贮 的数据,也就是说,数据仓库的数据对最终用户而言是只读的。由于数据仓库的查 询数据量往往很大,所以对数据查询、查询界面的友好和数据的表示提出了很高提 出了更高的要求,因为对数据仓库进行查询分析的用户多是企业的高层领导,他们 是所在领域的专家,但对计算机却不一定熟悉。 从数据的内容上看,数据仓库存贮的是企业当前的和历史的数据,在一定的时 问间隔以后,当前的数据需要按一定的方法转换成历史数据,年代久远的、查询率 低的数据的需要从数据仓库脱离到廉价慢速设备( 如磁带) 上,对分析处理不再有用 的数据需要从数据仓库中删除。但这些工作是由系统管理员来做,或由系统自动完 成。因此,也可以说数据仓库在一定时间间隔内是稳定的。 4 数据随时间不断变化 数据仓库数据的不可更新是针对应用而言,即用户进行分析处理时不对数据进 华中科技大学硕士学位论文 行更新操作,但不是说,数据从进入数据仓库以后就永远不变。数据仓库中的数据 随时问变化而定期地被更新,每隔一段固定的时间间隔后,运作数据库系统中产生 的数据被抽取、转换以后集成到数据仓库中,而数据的过去版本仍被保留在数据仓 库中,如同“定期摄影术”,每隔一周、一月或适当的间隔就照一张像;随着时间 的变化,数据以更高的综合层次被不断综合,以适应趋势分析的要求;当数据超过 数据仓库的存储期限,或对分析不在有用时,这些数据将从数据仓库中删去 关于数据仓库的结构信息、维护信息被保存在数据仓库的元数据中,数据仓库 维护工作由系统根据元数据中的定义自动进行,或由系统管理员定期维护,用户不 必关心数据仓库如何被更新的细节。 5 使用数据仓库 建立数据仓库并不是要取代原有的运作数据库系统,建立数据仓库的目的是为 了将企业多年来已经收集到的数据按一个统一、一致的企业级视图组织、存贮,对 这些数据进行分析,从中得出有关企业经营好坏、客户需求、对手情况、以后发展 趋势等有用信息,帮助企业及时、准确地把握机会,以求在激烈的竞争中获得更大 的利益 3 2 运作型数据与分析型数据应分离 运作型数据1 2 1 , 2 2 ,有时又称为操作型数据、o l t p ( 联机事务处理) 数据、原始 数据,初始数据和联机数据;分析型数据有时也称为信息性数据、决策支持数据、导 出数据、提取数据和总结数据。 如表3 1 所示,运作型数据与分析型数据在使用方面有着显著的区别。 以上比较说明运作型数据和分析型数据之间存在着众多的差别,不应该保存在 一起。一个好的运作型数据库不能很好地支持分析决策,一个好的分析型数据库也 不能高效地为业务处理服务,因此,应将它们分开,分别组织起运作数据环境和分 析数据环境。 华中科技大学硕士学位论文 表3 1 运作型数据与分析型数据的区别 运作型数据 分析型数据 表示业务处理的动态情况 运作型数据分析型数据 在存取的瞬问是正确的代表过去的数据 可更新。由录入人员或经过专门培训的输 不可更新,终端用户的访问 入事务而更新 常常是只读的 受到更多关注的是结论性的数 处理细节问题 据,是综合的,或是提炼的 操作需求事先可知道,系统可按预计的工操作需求事先不知道,永远不知道下一步 作量进行优化 用户要做什么 有许多事务每个事务影响数据的- - + 部 有数目不多的一些查询。每个查询可访问 分 大量数据 对性能要求高对性能要求宽松 面向应用,支持日常操作 面向分析,支持管理需求 用户需要理解数据库,以从数据中得出有 用户不必理解数据库,他们只是输入数据 意义的结论 3 3 数据仓库基本体系结构 斯坦福大学“w h p s ”课题组提出的一个基本的数据仓库模型i 笛剀如图3 1 所 示。 为了能够将已有的数据源提取出来,并组织成可用于决策分析所需的综合数据 的形式,一个数据仓库的基本体系结构中应有以下几个基本组成部分: 数据源,指为数据仓库提供最底层数据的运作数据库系统及外部数据。 监视器,负责感知数据源发生的变化,并按数据仓库的需求提取数据。 集成器,将从运作数据库中提取的数据经过转换、计算、综合等操作,并 集成到数据仓库中。 数据仓库,存贮已经按企业级视图转换的数据,供分析处理用。根据不同 华中科技大学硕士学位论文 的分析要求,数据按不同的综合程度存储。数据仓库中还应存储元数据,其中记录 了数据的结构和数据仓库的任何变化,以支持数据仓库

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论