(通信与信息系统专业论文)基于xml的旅游酒店在线报税系统研究.pdf_第1页
(通信与信息系统专业论文)基于xml的旅游酒店在线报税系统研究.pdf_第2页
(通信与信息系统专业论文)基于xml的旅游酒店在线报税系统研究.pdf_第3页
(通信与信息系统专业论文)基于xml的旅游酒店在线报税系统研究.pdf_第4页
(通信与信息系统专业论文)基于xml的旅游酒店在线报税系统研究.pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着互联网络的迅速发展,现代信息技术已经广泛应用于经济、科学、文化、军事 以及生活的各个领域,旅游产业信息化程度已成为衡量地区旅游产业发展水平的重要标 志。目前,由于各旅游酒店使用不同的信息管理系统进行内部管理,使相关政府部门难 以及时掌握现有旅游酒店数据信息,这种状况尤其不利于政府税收工作。因此,如何利 用现代信息技术整合旅游酒店数据资源,提高旅游酒店管理与服务效率,提高政府在旅 游酒店业的税收管理水平,便是需要我们研究、探讨的问题。 本课题源于项目“基于x m l 的海口市旅游酒店在线税收系统研制”。该项目目标是 构建基于x m l 的海口市旅游酒店在线税收系统,而构建实时在线税收系统的前提是构建 基于x m l 的海口市旅游酒店在线报税系统,以此系统为平台,连接分散于我市各区域的 各个旅游酒店,对其相关信息进行汇总与分析,及时向政府部门、企事业单位提供高效 优质的服务。 本文提出了酒店税务信息网络电子申报的解决方案,该方案屏蔽了酒店行业数据的 异构性,满足了相关部门的信息需求。在系统设计过程中,研究和探讨了异构数据集成、 x m l 技术及应用,实现并测试了基于x m l 的旅游酒店在线报税系统,并分别对系统的各 个部分进行了相关技术探讨。 关键词:异构数据集成x m l 电子报税系统实时跨平台信息共享 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to ft h ei n t e m e t ,m o d e mi n f o r m a t i o nt e c h n o l o g yw a sa l r e a d y a p p l i e dw i d e l yi nt h ee c o n o m y , s c i e n c e ,c u l t u r e ,m i l i t a r ya n dm a n yf i e l d so fo u rl i f e t h e d e g r e eo ft h ea p p l y i n gi n f o r m a t i o nt e c h n o l o g yi nt o u r i s mi n d u s t r yh a sb e e nt h ei m p o r t a n ts i g n o fm e a s u r i n gt h ed e v e l o p m e n tl e v e lo ft o u r i s mi n d u s t r y b u tc u r r e n t l ym o s tt o u r i s mf i r m sa n d h o t e l su s ed i f f e r e n tm a n a g e m e n ti n f o r m a t i o ns y s t e m sf o rt h e i rm a n a g e m e n t ,w h i c hm a d et h e a d m i n i s t r a t i o nd e p a r t m e n th a r dt og e tt h ei n f o r m a t i o no ft h et o u r i s ma n dh o t e l s ,e s p e c i a l l y d i s a d v a n t a g e o u st ot h et a x m i o nm a n a g e m e n t t h e r e f o r e ,t h ep r o b l e mw en e e dt or e s e a r c ha n d d i s c u s si sh o wt om a k eg o o du s eo fm o d e mi n f o r m a t i o n t e c h n o l o g yt oi m p r o v et h e m a n a g e m e n ta n ds e r v i c ee f f i c i e n c yo ft h et o u r i s ma n dh o t e la n di n c r e a s et h eb u s i n e s st a x a t i o n f o rg o v e m m e n t t h i st h e s i si sb a s e do nt h ep r o j e c t t h eo n l i n er e v e n u es y s t e mo ft h eh o t e l sb a s e do n x m lt e c h n o l o g yi nh a i k o ur e g i o n ”t oc o n s t r u c tt h er e a l - t i m er e v e n u es y s t e mo fh o t e l s u s i n gx m lt e c h n o l o g yw a sp r o p o s e d t h ep r e m i s eo ft h es y s t e md e s i g n st h eo n l i n et a x d e c l a r a t i o ns y s t e mo fh o t e l su s i n gx m lt e c h n o l o g y , w h i c hc a ng a t h e ra n da n a l y z et h e i n f o r m a t i o no fh o t e l sa n dp r o v i d eg o o ds e r v i c ef o rg o v e m m e n ta n dc o m p a n y t h et h e s i sh a sd e s i g n e dt h eo n l i n et a xd e c l a r a t i o ns y s t e mf o rh o t e l st a x a t i o ni n f o r m a t i o n , w h i c hs o l v e dt h ep r o b l e mo fh e t e r o g e n e o u sd a t ao fh o t e l sa n dm e tt h er e q u i r e m e n t so f g o v e r n m e n ta b o u tt h eh o t e li n f o r m a t i o n i nt h ep r o c e s s e so fd e s i g n ,t h et h e s i sh a sf o c u s e dt h e r e s e a r c ho nt h ei n t e g r a t i o no fh e t e r o g e n e o u ss y s t e md a t aa n dx m l t e c h n o l o g y t h i st h e s i s h a sa l s ot e s tt h eo n l i n et a xd e c l a r a t i o ns y s t e mo fh o t e l su s i n gx m l t e c h n o l o g ya n dd i s c u s s e d t h ee a c hp a r to ft h es y s t e ma n dt h et e c h n o l o g y k e yw o r d s :h e t e r o g e n e o u sd a t ai n t e g r a t i o n ,x m l ,e l e c t r o n i ct a x a t i o ns y s t e m ,r e a l t i m e c r o s s - s y s t e mi n f o r m a t i o ns h e a r i n g n 海南大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重卢明:所旱交的学位论文,是本人在导师的指导下,独立进行研究工作所取 得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写 过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。 本声明的法律结果由本人承担。 论文作者签名: 私教 日期议哕“月口日 学位论文版权使用授权说明 本人完全了解海南大学关于收集、保存、使用学位论文的规定,e p :学校有权保留并向 国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权海南大 学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采h 3 影印、缩印或扫 描等复制手段保存和汇编本学位论文。本人在导师指导下完成的论文成果,知识产权归属海 南大学。 保密论文在解密后遵守此规定。 :械锄虢留香山 日期:及印年毒月o 日、日期:勿护 年参 f 矿日 赚二= 纛茅一二:研u论姗繇豳嗽新虢材彳山 日期:a 佃9 年月i o 日日期:伽6 忏6 角f d 日 1 1 课题背景 第一章绪论弟一早殖y 匕 随着互联网络的迅速发展,现代信息技术正以空前的规模和速度应用于经济、科学、 文化、军事以及生活的各个领域,已经成为事关国民经济、国防建设和人民生活的基础 性、战略性产业,成为推进社会信息化的重要力量。而旅游产业信息化程度已成为衡量 地区旅游产业发展水平的重要标志。 据不完全统计,海口市目前有近百家星级酒店。但是,这些旅游酒店使用各自不同 的信息管理系统进行酒店内部管理,跨越多种操作系统平台和数据库系统。这种状况使 得旅游管理部门难以及时掌握海口旅游酒店入住率、旅游酒店房价等数据,无法对相关 信息有效地收集、加工和分析改造,这种现状尤其不利于税收工作,从发展观点来看, 不利于海口市酒店业共享资源、互利互赢。因此,如何利用现代信息技术来整合现有的 旅游酒店资源,提高旅游酒店管理与服务效率,提高海口市旅游酒店的税收,是值得我 们去思考、研究和解决的问题。 1 2 税务电子化现状 1 2 1 国内税务电子化现状 随着现代科学技术的发展,信息技术在各方面都等到了广泛的应用,税收领域也不 例外。税收是国家财政的主要来源和国家宏观调控的重要杠杆j 。加快税务信息化建设, 就是要通过运用一系列先进信息技术,在加强税务管理的同时,强化为纳税人服务,逐 步将工作重心转到服务上,特别是怎样方便纳税人申报纳税信息、缴纳税款,通过网络、 电话等多种方式随时随地了解涉税信息及办税纳税事项,向税务机关通报企业纳税情 况,举报偷税行为,获取税收优惠、税收政策变化信息等。 我国的税务信息化起步于上世纪8 0 年代,其发展轨迹大致可划分为三个阶段: 1 第一阶段是模拟手工操作的税收电子化阶段。 2 第二阶段是步入面向管理的税收管理信息系统阶段。2 0 0 1 年全面实施的增值税稽 核、防伪税控系统、协查系统等。 3 第三阶段是目前正在建设中的实现并创造税收价值的全方位税收电子商务系统阶 段,即电子税务建设阶段。通过各级税务机关的不懈努力,税务信息化的建设已取 得了初步成效。 1 2 2 国际税务电子化状况 当前,西方发达国家的税务机关都设立了税收信息中心,形成了一套覆盖其全国的 税务信息系统,这极大地提高了这些国家的税收征管效率,促进了经济发展,每个国家 的税收信息管理系统也都有其自身的特点。 美国从上世纪6 0 年代起逐步在全国范围内建立了税收征管网络。全国共有4 个征 收中心,可以处理数以亿计的纳税申报表。实现了从税收预测、税务登记、纳税申报、 税款征收、税务稽查、税源控制、纳税资料的收集、存储、检索等一系列工作环节的信 息化。 澳大利业已在全国税务机关内部全面运用计算机系统管理纳税申报,办理出口退税 等日常工作,并实现了与政府相关部门如海关、工商、保险、金融及大企业的网络互联, 有效地对税源进行控制,有针对性地开展税务审计。同时,澳大利业丌发了大量的税收 征管应用软件,包括税款征收管理软件、办公自动化管理软件、纳税服务管理软件等。 特别是在纳税申报环节上,税务局提供了数十种表格,供用户下载,以完成申报工作。 另外,在安全方面,澳大利业税务系统也采取了一些措施,如为防止灾难性毁坏而设计 建立了数据库备份运行系统,以备不时之需。 在欧盟国家中,意大利拥有最成功、最大的税收信息管理系统- - i t i s ( i t a l yt a x i n f o r m a t i o ns y s t e m ) 。财政部通过i t i s 对全国税收工作进行管理,同时,通过意大利公 用数据网和欧洲公用数据网实现税收环节相关部门的信息交换和资源共享。 德国的税收信息化管理建设覆盖面广,数据准确性强,成效显著。到目前为止,德 国已将管理纳税人的基本业务全部纳入了信息技术集成处理范围中。纳税人通过网络可 方便、快捷地办理相关涉税事宜,税务部门也通过网络进行税源控制、税款征收等税收 管理。 1 2 3 学习和借鉴之处 尽管我国在税收信息化建设方面取得了一定的成果,但无论从深度上还是广度上, 税收信息化的潜能都没有得到充分的挖掘。所以,借鉴发达国家在税收信息化方面的成 功经验,有助于我国的税收信息化进程顺利、健康地发展。 首先,我国税收信息化建设始终处于一个认识上的误区之中,即认为只要通过税收 信息化就能实现税收征管的根本改革。这一错误的理解导致在推进信息化建设过程中, 单纯强调技术更新,而忽视了对征管体制的改革和创新。所以国家、财政部的高度重视, 是信息化建设成功的关键。例如美国税务信息化建设是联邦政府各部门中最大的信息化 建设项目,国会财政委员会亲自过问方案制定、资金预算及实施情况,并要求按期递交 实施情况报告,听取有关汇报。财政部对税务信息化建设始终高度重视,在资金等方面 给予大力支持。 2 其次,信息化建设中业务系统整合是信息技术实施的前提。近年来,我国的税务系 统初步建成了一定的规模,但是网络功能的低下使得已有的信息资源得不到系统管理、 集中处理,分析与监控的能力不够强。而发达国家的信息化建设首先完成了组织结构重 组,对业务系统进行了重新整合,然后才提出信息化建设规划。 再次,建立以纳税人为核心的服务系统。我国税收信息化虽然已进入电子化管理阶 段,但大多还局限于税务系统内部自我工作的一种封闭的状态,没有实现对相关部门以 及广大纳税人的有效服务,这制约了我国在电子商务环境下实现税收征管现代化的进 程。在美国,税务机关已利用互联网构建起与纳税人以及其他个人和组织之间的税收信 息通道。并强调信息化建设为纳税人和其他业务部门的服务功能,给纳税人和其他业务 部门提供高质、高效服务,把纳税人和其他业务部门当作自己的客户。 最后,信息化建设应重视战略与战术、远期与近期的关系。发达国家充分考虑到信 息化建设的困难,制定了长期规划,近期目标是建设电子申报系统,远期目标是建设综 合电子服务系统。因此,他们选择了电子申报系统、纳税人服务系统作为突破口,争取 在几年内取得明显成效,对于已有的信息管理系统,一边继续使用,一边进行技术更新, 对于全新开发的系统,纳入统一的信息化建设框架之内。 1 3 旅游酒店信息管理现状 1 3 1 国内酒店信息管理现状 目前,国内的旅游酒店已经发展成型了一些信息服务平台,这些平台主要由预订系 统、前台接待系统、团体会议系统、商务中心系统、通用收银系统、夜核系统、客房中 心系统、餐饮管理系统、总经理查询系统、前台维护系统、电话计费系统、一卡通管理 系统、娱乐管理系统、营销管理等系统组成。其中“客房中心系统”和“总经理查询系 统”可以提供旅游酒店的住房统计数据。但是,这些系统存在着局限性,其一,住房数 据无法在酒店之间进行交换,造成重要旅游数据资源的浪费。其二,旅游管理部门及税 收部门无法实时掌握各酒店客人入住信息,房价信息,旅游管理部门及税收部门无法对 酒店进行有效的监管。 1 3 2 国际酒店业信息化状况 发达国家大规模应用先进的信息化技术,变革传统意义上的酒店业竞争方式和经营 管理模式以赢得新竞争优势,在这方面国际上领先国家的酒店业一直在不遗余力地探 索、实施和推进。据美国酒店及旅游业财务与科技专业人员协会的调查报告显示,先进 的信息化技术已成为今后酒店及旅游业获得新竞争优势的重要工具,也是相关管理部门 有效管理酒店信息的必然手段。如何借鉴、应用国际先进的信息化技术来增强自身的经 营管理工作,避免掉陷阱、走弯路,也日益成为国内酒店业有识之士的焦点。 国际酒店业先进信息化应用的产生与发展大体上经过了以下五阶段: 1 电算化阶段 规模化经营的酒店宾馆作为集客房、餐饮、通讯、娱乐,商务文化及其他各种服务 与设施为一体化的消费场所,酒店宾馆组织庞大,服务项目多,信息量大,要想提高工 作效率,降低成本,提高服务质量和管理水平,必须借助计算机来对酒店运行过程中的 人流、物流、资金流和信息流进行计算机化的输入、存储、处理和输出。在这一阶段的 信息化应用并没有从深层次上改变传统酒店业的内部管理流程,还停留于表层,与目前 国内许多酒店业的实施应用现状类似。 2 自动化阶段 随着计算机在智能楼宇控制自动化和酒店设施设备管理监控的应用,酒店宾馆的设 备运行管理的自动化逐步走向高层次信息化应用,同时酒店信息化在这一阶段应用的另 一方向是酒店办公业务自动化,通过覆盖酒店管理主要业务部门的办公自动化系统,实 现文档信息方便、快捷、准确地传递和管理。 3 网络化阶段 网络化建设也已成为酒店业信息化建设应用中的重要组成部分,于是以宽带高速数 据网络为核心的“数字化酒店也应运而生。在这一阶段的应用重点是网络营销和网上 适时订房业务等。 4 集成化阶段 随着酒店信息化管理系统深入运用,为充分实现信息共享,酒店业信息化步入了酒 店流程再造的全新的集成化应用阶段。针对酒店经营管理全过程中的各个环节,电脑管 理系统都有相应的功能模块来方便、快捷和规范地运转。 5 协同化阶段 进入互联网新经济时代,酒店业信息化的新追求境界是在集成化基础上的协同化应 用,酒店通过互联网搭建统一的信息应用平台,将客户、酒店、员工、供应商、合作伙 伴、管理部门等各方联为一个整体,以实现纵览全局的跨行业、跨组织、跨地区,实时 在线的、端对端数据无缝交换的业务协同运作,其重点在于各方联为一体为政府管理部 门提供最佳的管理模式以及直接面向顾客提供个性化服务。 1 3 3 需要解决的问题 国税、银行、企业之间需要进行大量的信息交换【2 1 ,由于没有横向数据直接互联, 几个部f - 1 2 间不能实现信息共享,使得信息传递不通畅、数据重复采集、工作量大、工 作效率低、信息不一致。对于国税部门来说,由于信息不通畅,不能及时掌握税款征收 入库情况,税款在途时间过长,不利于税款监控;另外,综合征管软件的应用促使征管 4 数据实现了集中管理,但由于企业的业务信息仍以企业自身为单位处理,使得综合征管 软件的会计核算只能采用分布式,不能满足集中核算的要求,因此非常有必要进行企业 税务联网的探索。从我们目i j 推行电子申报缴税系统中反映了一些现象,值得我们去研 究解决。 所以作为税务电子化或数字化的最终目标是实现电子商务意义上的网上办税,它包 括网上报税和其它网上办税事宜。而作为网上办税系统的第一步,首先应当实现网上报 税。 因此,如何充分利用最新的x m l 技术,实现海口市星级酒店间数据整合与信息共 享,使海口市管理部门及税收部门实时掌握旅游酒店的住房信息、实时联机报税便成为 最需要解决的问题。 1 4 研究和实现酒店税务电子化的意义 1 4 1 税务电子化的意义 网络电子报税系统是通过计算机和网络通信技术,实现用网络传递信息以代替人工 申报和缴税的新型系统。实现网络电子报税必将是纳税形式的一次革命,电子报税就是 电子商务和电子政务的一个具体工作,网络电子报税系统通过互联网方式进行报税处 理,推动了企业计算机应用和电子商务的普及;网络电子报税系统为纳税人提供了完成 纳税义务的方便手段,减轻了纳税人的报税负担,加快了报税速度,使得“足不出户、 完成申报”成为可能;先进的计算机网络技术全面改善了税务机关的办公质量,提高了 税收征收管理效率,同时也确保了税款能及时入库;电子报税增强了信息采集能力,加 强了政府监管与控制功能,网络电子报税系统有效地提高了税务系统的工作效率、降低 了征收成本,具有明显的经济效益和社会效益。随着信息化、安全技术等各种条件的不 断成熟,通过i n t e r n e t 网上申报必然会成为未来电子申报的主流,成为以后报税的主推 方式p j 。所以实现税务电子化的意义可以归纳为以下几点: 1 实现税务部门、银行、纳税人、国库等部门信息共享与流通,提高了管理效率,节 约了纳税成本,消除了管理中人为的因素。而且在经济和信息全球化加快发展的情 况下,税务信息化已经成为一个国家或地区在全球竞争中的要求,也是提升国家和 地区全球竞争力,争得经济和社会发展“先机”的重要因素,也是投资人选择投资 区域的关键。 2 以方便纳税人缴纳税款,进一步优化了纳税服务,从科技上提高了效率。使纳税人 实现了“手不动笔做报表,足不出户就缴税”。申报、缴税不受时间、空间限制,既 方便,又省时、省钱,有力地推动了企业信息化工作。 3 电子缴税、电子报税的实施依法规范了纳税人行为,有效地提高了申报数据的质量, 减少了不法分子偷税现象,税务机关及时分析企业报税、缴税的准确性、及时性, 减少了税务人员的录入量,大幅度降低了输入审核错误率,避免了纳税人在征期排 长队,税务机关手忙脚乱,税务机关可以抽出时间来优化纳税服务,实现信息资源 共享。 4 税务征收部门可以严密监管,增强税务征管稽查的法制性、有效性,税务业务处理 实现阳光操作,促进税务干部的勤政、廉政建设,提高税务部门的管理水平和管理 效率。实现了扁平化管理,促进了依法治税,规范了征管质量,体现了组织体系集 约化、征管职能专业化、征管手段信息化、税源管理精细化、纳税服务优质化等具 体功能。 5 确保了国家收入的及时入库,减少了纳税人来回奔波于银行、税务之间,使得纳税 人更加方便,有效地解决因未及时入库加收滞纳金、处罚等问题。由于采用了现代 化计算机网络技术,实现了申报、缴款、入库等电子信息在纳税人、银行、国库之 间的传递,加快了票据的传送速度,缩短了税款在途时间和环节。从而全面加强税 务机关对税收的监管和提供高质量的服务。 1 4 2 本课题的研究意义 首先,本课题的研究,可以推动和加速海口市旅游产业信息化建设步伐,促进信息 技术的推广和应用。项目产品的成功研制和合理应用,使旅游酒店资源整合取得突破性 进展,填补我市目前旅游酒店综合数据空白,有效地提高旅游信息管理和利用,推动我 市旅游产业的发展。 其次,本课题的研究,可以增加政府在旅游酒店业的税收,有效的避免由于管理系 统漏洞,以及监管不到位而产生的偷税漏税情况。 最后,本课题的研究,有助于对跨平台,系统信息共享方案的完善,以及其他行业 的系统信息集成的促进;此外,结合我省其他地区的特点和需求,可以对该平台进行扩 展,辐射全省其他地区的旅游酒店,全面促进我省旅游产业和经济的快速发展,对我省 的经济和文化建设有着重要的意义。 1 5 论文主要工作 1 5 1 本文主要内容 目前,海口市旅游酒店报税方案由于标准不统一、不利于监管等问题,在真正实施 税务管理时是困难重重。针对这一系列问题,本文分析了针对酒店及税务部门网络电子 报税的行业报税模式,提出酒店税务信息网络电子申报的解决方案,并设计和测试了的 酒店电子化报税系统。在系统设计过程中,研究探讨了异构数据、x m l 技术及其应用、 基于x m l 的电子报税数据标准,并分别对系统的各个部分进行相关技术探讨。 6 1 5 2 本文创新点 1 本文分析了当前旅游酒店信息共享的情况,并结合异构数据集成技术模式以及x m l 技术的特点,探讨了在旅游酒店行业内部以及相关管理部门之间实现信息集成,从 而达到信息共享的可行性。 2 本文基于异构数据集成和x m l 技术,结合旅游酒店税务管理特殊性,研究了海口 市旅游酒店在线报税系统的实现方案。 3 提出了屏蔽酒店行业数据异构,满足相关部门信息需求的数据集成解决方案,并设 计实现了一种本地采集传输信息,异地接收并集成数据的系统架构,并针对某常用 酒店管理系统进行了数据信息集成测试。 1 6 论文安排 本论文的章节安排如下: 第一章绪论。该章节主要介绍了论文的选题背景、课题来源、课题研究意义研究现 状等等。 第二章异构数据及相关技术。该章节主要介绍了异构数据的定义,集成中面临的 问题,集成的策略方式和相关技术,以及实现的目标。 第三章x m l 技术。该章节主要介绍了本课题的核心技术- x m l 技术,以及x m l 技术与数据库应用的关系。 第四章系统框架设计。该章节根据对现实信息系统需求的分析,以及功能的需要, 设计系统总体框架,并对测试环境进行了分析。 第五章系统实现及测试。该章节给出了系统具体实现和应用的实例。 第六章结论与展望。总结了本论文的研究工作,并给出了展望。 7 第二章异构数据及相关技术 数据集成是对各种异构数据环境提供统一的表示、存储和管理的数据管理方式,这 些功能是异构数据集成系统必须实现的基本功能。数据集成屏蔽了各种异构数据源的异 构性,通过异构数据集成系统对不同数据源的数据进行统一操作。因此,集成后的异构 数据对用户来说是统一和无差异的。 2 1 异构数据介绍 2 1 1 引言 异构数据集成平台的研究始于七十年代中期,从开始的多数据库集成发展到现在的 多数据源集成p j ,数据集成的范围和作用都在不断扩大。 异构数据库之间的集成,基本上可以分为四类:第一类采用的是物理上分布、逻辑 上集中的系统结构,系统有个全局的数据模式。由于在这样的系统结构中,结点缺乏自 治性,难以管理,难以集成,所以产生了第二类多库集成。这是由m c l e o d 等人于 八十年代中期提出的联邦式数据库系统。它是一种物理、逻辑上都分布的结构,每个结 点有自己的联邦模式p j ,而不是唯一的全局模式,由于不再受制于全局模式,结点的自 治性得到加强,数据库系统的集成、扩充和重新配置也较为方便和自然。第三类则是 l i t w i n 等人提出的多库语言数据集成方法。这种系统结构既无统一的全局模式,也无局 部的联邦模式,结点自治性更强,但用户必须接受一种新的数据语言,且透明性较差。 第四类则是上世纪9 0 年代中期随着网络的普及,产生的数据仓库这种新的数据集成方 法。 而随着大量半结构化,非结构化的出现,传统的数据库集成方法已经无法满足人们 获取更多更新数据的需要。所以数据集成技术不仅要能集成数据库中的数据,也能集成 非数据库中的数据。 异构数据集成系统的目的是提供一个访问异构数据源的统一接口,让用户不必考虑 数据模型的异构性、数据抽取、数据合成等问题一j 。用户只需提交他们所需要的数据, 而不必描述该如何取得数据,减轻了寻找相关数据源或者访问每个数据源然后整理合并 查询结果的负担。 2 1 2 异构数据的来源 在一个大型的行业信息化过程中,可能由于各种历史条件的限制,各个部门或者地 区公司根据自身的信息需求和特定的应用选择了各自的软硬件环境【7 1 。从而使得在一个 大型企业内部存在多种不同类型的硬件平台、操作系统、数据库管理系统和网络协议等。 8 这种按功能和企业内部组织数据的方式必将导致行业领域数据资源与服务的分片,形成 了一个个的“信息孤岛 和各企业之间数据的异构。因此为了管理的需要和信息的共享, 数据集成是至关重要的。 许多企业信息系统用不同的语言建立,运行在不同的软件平台上,针对不同的硬件 等。拥有大规模而且各不相同的系统是很普遍的现象,而拥有统一的系统却很少见。随 着信息技术的快速发展,管理部门对所辖企业的管理就显得尤为重要,而这种管理并不 只意味着监控,更多的是促进信息的共享,资源的共享。诸多的因素促使人们对信息系 统提出更高的要求,这既是企业内部发展的需要也是企业适应外部环境的需要。因此需 要企业的信息系统更为灵活和开放,以便能够共享集成彼此的不同的信息。但由于原始 建设时这些信息系统的架构,数据源的结构不尽相同,使得这些系统间的数据交换和集 成遇到了障碍。 此外,系统采用的网络体系结构、通信协议等也可能各不相同,这些系统就是我们 所说的异构系统。而在这些异构系统中产生或运行的数据就是我们所说的异构数据p 1 。 所以,异构数据是一个含义丰富的概念,它是指涉及同一类型但在处理方法上存在各种 差异的数据。在内容上,不仅可以指不同的数据库系统之间的数据是异构的,而且可以 指不同结构的数据之间是异构的,如结构化的s q ls e r v e r 数据库数据和半结构化的 x m l 数据、非结构化的t x t 文本文件中的数据等。 而对于本课题而言,不同的酒店使用了不同的酒店管理系统,以及各异的数据库系 统,这就使管理部门对各酒店的信息掌控中出现了屏障。 2 2 异构数据的集成 2 2 i 需要解决的问题 随着x m l 技术的兴起,异构数据集成再次成为了研究的一个热点。单从集成角度 看,“酒店管理部门”的行业类异构数据集成,与普遍的异构数据集成问题没有本 质区别,具有同样的共性问题。然而,从为管理部门构建支撑系统的角度来讲,必须考 虑异构数据在集成过程中所遇到的特殊问题。总的来看,需要处理好以下几方面问题: 1 结构化数据向x m l 半结构化数据交换 以x m l 为基础的新一代w w w 环境是直接面对w e b 数据的,不仅可以很好的兼 容原有的w e b 应用,而且可以更好地实现w e b 中的信息共享与交换。x m l 可看作一种 半结构化的数据模型,可以很容易地将x m l 的文档描述与关系数据库中的属性对应起 来。 2 以x m l 作为公共数据表示,解决各种数据冲突的数据交换方案 数据的异构性是数据交换要解决的主要问题,总结其特点,分析数据的异构性对数 据交换的顺利实现具有重要意义。 9 数据的异构性主要包括系统异构、模式异构和逻辑异构三个方面p j 。系统异构,数 据源所依赖的应用系统、数据库管理系统乃至操作系统之间的不同构成了系统异构;模 式异构,数据源在存储模式上的不同,一般的存储模式包括关系模式、对象模式、对象 关系模式和文档嵌套模式等几种,其中关系模式为主流存储模式:逻辑异构,包括命名 异构,值异构等。 3 异构数据集成的完整性 异构数据集成的目的是为应用提供统一的访问支持。为了满足各种应用处理数 据的条件,集成后的数据必须保证一定的完整性,包括数据完整性和约束完整性两方面。 数据完整性是指完整提取数据本身;约束完整性,约束是指数据与数据之间的关联 关系,是唯一表征数据间逻辑的特征。保证约束的完整性是良好的数据发布和交换的前 提,可以方便数据处理过程,提高效率。 4 语义冲突 信息资源之间存在着语义上的区别。这些语义上的不同可能引起各种矛盾,从简单 的名字语义冲突( 不同的名字代表相同的概念) ,到复杂的结构语义冲突( 不同的模型表达 同样的信息) 。语义冲突会带来数据集成结果的冗余,干扰数据处理、发布和交换。所 以如何尽量减少语义冲突也是数据集成的一个研究热点。 5 权限问题 由于数据库资源可能归属不同的单位,所以如何在访问异构数据源数据基础上保障 原有数据库的权限不被侵犯,实现对原有数据源访问权限的隔离和控制,针对不同的管 理部门提供不同的数据,就成为连接异构数据资源库需要解决的问题。 6 方案设计 异构数据之间进行交换的核心问题是如何解决它们同构和异构冲突所带来的数据 转换问题。利用x m l 作为交换的公共数据表示,在表示数据的时候,将其结构信息和 值信息分开来描述,分别定义为数据结构文档和数据值文档。通过分析结构信息文档, 解决数据冲突,完成数据值文档的转换并最终完成数据交换。 以上列举了行业类异构数据源集成系统时所必须面对的几个主要问题。其中,数据 异构性、完整性、语义冲突问题为异构数据集成中的共性问题,权限瓶颈和方案设计的 限定则属于行业类异构数据集成的特性问题。但是对于本课题的酒店信息系统而言,行 业内有相近的标准可循。值得指出的是,尽管对这些问题进行了分类,但事实上,这些 问题是相互联系、相互制约的,不应该简单的孤立对待。 2 2 2 系统构造要求 根据上述分析所得异构数据库的特征,数据集成模块在其构造过程中必须满足一系 列要求: l o 1 全局数据模型 负责在用户与异构数据源之间提供一个中间部,实现数据操作的地域透明性。目标 是建立一个对用户而言统一和一致的数据源,它对各个子数据库系统而言是一对多的映 射模型。其中最重要的工作是建立全局数据字典【1 1 1 ,它负责对网络数据库中所有数据的 定义及分布进行描述,并对全局用户的设计进行局部转换,完成“透明部分”的初步工 作。 2 全局定位功能 在系统处于动态环境的情况下,必须有一种机制负责提供系统内各种数据库( 或信 息源) 的名字与位置的定位服务,负责记录系统成员的注册与撤销,满足系统各部分之 间必须的可知性要求。 3 不完整和不一致处理 由于语义异构的存在,必须提供一种更为全面的语义信息服务,补充全局信息描述 和定义,避免数据操作时产生数据信息的混乱和丢失。 4 多数据库查询语言 由于各个数据库所含数据的异构,所以不能采用其中某一数据库的数据操作语言作 为全局范围工作的语言,必须设计一种能够承担全局数据表达,同时又易于进行全局到 局部转换的多数据库操作语言,使全局任务转化为全局结果的一部分时保持信息的一致 性和可理解性【12 1 。 5 安全管理 由于不同数据库系统的加入,必须对用户授权进行灵活而严格的管理,不同子系统 的用户在操作其它系统时应当考虑对其的授权。系统必须避免为恶意用户提供服务承 诺。同时,分布式的系统环境促使在进行不同子系统间的数据传输时,应当充分考虑信 息的安全性。 6 扩容能力 随着基于网络的数据库的增加,集成系统的规模必然将不断发生变化,由于系统处 于一个动念的环境,因此必须考虑系统扩容的方式及安全性。同时,随着系统容量的增 加,传统的查询方法和工作流程己经不再适用,必须考虑新的查询优化算法以及数据复 用机制。 7 事务处理功能 由于不同的数据库系统采用的事务管理方式不尽相同,以及各个组成数据的自主 性,全局事务管理无法控制局部事务管理,因此很难实现全局数据的一致性。同时,并 发控制和数据恢复工作也因此而变得难以实现。如何将局部事务处理与全局事务处理结 合起来,是一个复杂的研究课题。 总之,对于异构数据集成系统,对多种异构数据源的访问要具有透明性、一致性和 实时性。透明性是屏蔽底层数据源的差异,让用户感觉数据来自一个数据源;一致性是 消除数据源之间存在的结构异构和语义异构;实时性则指访问到的数据是最新更新过 的。 2 2 3 常用解决方案 异构数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中, 从而为企业提供全面的数据共享。 在行业数据集成领域,已经有了很多成熟的集成模型可以利用u 川。目前通常采用 联邦式式集成、数据仓库和基于中间件集成模型等方法来构造集成系统。这些技术在不 同的着重点和应用上解决数据共享和为企业提供决策支持。在这里对这几种数据集成模 型做一个简要分析。 1 联邦数据库系统 由半自治数据库系统构成,相互之间分享数据、联盟各数据源之间相互提供访问接 口,同时联盟数据库系统可以是集中数据库系统或分布式数据库系统及其他联邦式系 统。如图所示: 图2 1 联邦数据厍模型图 在这种模式下有分为紧耦合和松耦合两种情况,紧耦合提供统一的访问模式,一般 是静态的,在增加数据源上有些困难:而松耦合则不提供统一的接口,但可以通过统一的 语言访问数据源,其中核心的是必须解决所有数据源语义上的问题。 2 数据仓库 在企业管理和决策中面向主题的、集成的、与时间相关的和不可更改的数据集合, 其中,数据被归类为广义的、功能上独立的、没有重叠的主题制。传统的数据仓库中 主要存储的是历史和汇总数据,用于决策支持,主要供数据分析人员使用,而且为避免 数据仓库与数据源中数据出现不一致,通常不允许用户对数据仓库进行更新。如图所示: 1 2 图2 2 数据仓厍模型图 3 中间件模式u 刈 通过统一的全局数据模型来访问异构的数据库、遗留系统、网络资源等。中间件在 异构数据源系统( 数据层) 和应用程序( 应用层) 之间,向下协调各数据源系统,向上为集 成数据的应用提供统一数据模式和数据访问的通用接口。各数据源的应用仍然完成各自 的任务,中间件系统则主要集中为异构数据源提供一个高层次检索服务u 。如图所示: 图2 3 中间价模型 2 2 4 解决方案的比较 上述几种方法在一定程度上解决了应用之间的数据共享和互通的问题,但每种方法 都有一定局限性i : 联邦数据库系统主要面向多个数据库系统的集成,其中数据源有可能要映射到每一 个数据模式,这样丌发者必须开发n 枣州1 ) 段代码来支持两两之间的查询访问,当集成 的系统很大时,对实际开发将会带来巨大的困难。而且这种互操作性是有局限性的交互, 并不能实现各数据库的灵活的集成。 数据仓库是把来自于几个数据源的数据副本都存储在单一的数据库中,它在另外一 个层面上表达数据之间的共享,主要是为了针对企业某个应用领域提出的一种数据集成 方法。因此这种也有它的不足l l 引:比如数据仓库中的数据在存储之前是经过一定的筛 选处理的,数据仓库中的数据还需要定期更新,并且通常不允许用户对数据仓库进行更 新,因为这些更新不能反映在基础数据源中。 中间件模式,它通过在中间层提供一个统一的数据逻辑视图隐藏底层的数据细节, 使得用户可以把集成数据源看为一个统一的整体。这种模型下的关键问题是如何构造这 个逻辑视图并使得不同数据源之间能映射到这个中间层。 所以从上述对三种常见集成模式的比较中,我们便可以得出这几种主流方式的适用 范围和特点州: 1 联邦数据库主要的弱点是需要大量的开发工作量,而且不利于以后数据源的添加; 2 数据仓库主要是面向主题的,需要进行数据分析处理,为管理层提供决策支持,因 此需要对大量的数据进行分析和综合,而且数据仓库中的数据是经过规范化处理的 “熟数据,不是原始数据,因此是不能修改,只能提供数据查询,数据仓库是随 时间不断变化的。 3 中间件模式则与数据仓库模式不同,数据仓库模式是面向主题的,为管理层提供决 策的,中间件模式可以通过中间层,提供一个统一的数据逻辑视图来隐蔽底层的数 据细节。 在本文中,根据酒店税务信息的特殊性,结合中问件模式和数据仓库模式的优点, 利用x m l 提供统一的全局数据模式,为数据集成搭建一个统一的数据集成平台。 2 3 相关处理技术 2 3 1 数据的转换方式 在异构数据库转换过程中,要实现严格的等价转换是比较困难的,这是因为在异构 的数据库中存在各种语法与语义上的冲突。因此异构数据的转换目标是能够将源数据库 中所有需要的信息都能转换到目标数据库中,而且这种转换不能包含冗余信息。目前主 要有如下几种数据转换方式k : 1 使用软件工具进行转换 一般情况下,数据库管理系统都提供将外部文件中的数据转移到本身数据库表中的 1 4 数据装入工具。综合利用现有的低成本的数据转换工具是易实现且成本低的集成方法。 但是,使用这些数据转换工具的缺点是它们不是独立的软件产品,必须首先运行该数据 库产品的前端程序才能运行相应的数据转换工具,通常需要几步才能完成,且多用手工 方式进行转换。此类工具一般都是各数据库的专用工具,与自身数据库的结合非常紧密。 如果目的数据库不是数据转换工具所对应的数据库,数据转换工具就不能使用。 2 利用第三方数据库的转换 如果是大型数据库,数据量就相对庞大得多,如果缺少工具软件的支持,这时就必 须借助其他较小的桌面数据库如a c c e s s ,e x c e l 等。实现两个具体数据库之间的转换时, 依据关系定义、字段定义,从原数据库中读出数据通过中间数据库灌入到目的数据库中。 这种利用中间数据库的转换办法,所需转换模块少,且扩展性强,但缺点是基本上 全靠人工参与,需要写很多的s q l 语句,非常麻烦。在实现过程中比较复杂,转换质 量不高,转换过程长。 3 通过数据库组件的转换 利用d e l p h i 等数据库应用程序开发技术,在配置完o d b c 后可以直接利用d e l p h i 自带的d a t ap u m p 工具来完成数据转换。源数据库与目的数据库通过组件来存取数据, 实现异构数据库之间的直接转换。通过组件存取数据,关键是数据信息的类型问题,如 果源数据库与目的数据库对应的数据类型不相同,必须先进行类型的转化,再进行数据 转换。 4 利用x m l 技术实现转换 x m l 作为一种与平台无关的信息描述语言,能广泛地表达各种信息,这就给用来 管理多媒体数据,复杂的合成数据的数据库提供了数据表示和处理的有效手段,利用 x m l 可把复杂的数据合理地分解,以适应j 下在使用的数据模型。利用x m ls c h e m a 可 以描述数据并且定义数据间的关系,使用户正确地使用数据。 x m l 可实现基于w e b 浏览的多样式可视化显示,而中间转换处理程序则用来访问 数据库管理系统中的数据和输出x m l 文档。为了在数据库和x m l 文档之间传递数据, 必须在文档结构和数据库结构之间建立映射。中间转换处理程序功能实现的关键就是完 成映射的建立卜“。 2 3 2 数据交换过程 数据交换方案,主要有数据提取、数据分析、数据转换和数据加载等步骤弘引: 1 数据提取是根据用户的指令将数据从关系数据库提取出来,并将提取出来的数据转 换成x m l 格式的过程。 2 数据分析是对源和目的数据的结构信息x m l 文档进行分析,并结合用户定义的转换 规则文件生成一个用于数据值x m l 文档转换的映射文件的过程。 3 数据转换是通过利用数据分析生成的映射文件协助完成数据值x m l 文档转换的过 程。 4 数据加载是数据提取的反过程,即将转换好的x m l 格式的数据按照要求加载到相应 的关系表中。 2 4 本章小结 一个实用的信息集成系统应该具有智能性、开放性和主动性弘j 。智能性是对来自 不同数据库的结构化的、半结构化的和非结构化的数据进行统一处理、过滤、缩减、抽 象、合并和归纳等工作。开放性是对于异构和分布的数据库

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论