8电子政务数据管理技术_第1页
8电子政务数据管理技术_第2页
8电子政务数据管理技术_第3页
8电子政务数据管理技术_第4页
8电子政务数据管理技术_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、电子政务理论与技术主讲:马国峰第八章电电子政政务数据据管理技技术学习重点点数据管理理技术的的发展阶阶段及各各个阶段段的特点点几种典型型的数据据库产品品多媒体数数据的特特点及管管理技术术多媒体数数据的检检索技术术数据仓库库的原理理及体系系结构XML技技术内容管理理的理念念及技术术第八章电电子政政务数据据管理技技术第一节数数据据管理概概念第二节数数据据库管理理技术第三节多多媒媒体数据据管理技技术第四节数数据仓仓库及商商务智能能技术第五节XML与内容容管理第一节数数据管管理概念念一、什么么是数据据管理数据:在在计算机机系统中中,各种种字母、数字符符号的组组合、语语音、图图形、图图像等统统称为数数据,

2、数数据经过过加工后后就成为为信息。数据处理理时将科科研领域域、生产产领域和和经济领领域等的的原始数数据运用用一定的的工具转转换成所所需的另另一种形形式的数数据,是是人们对对数据进进行收集集、组织织、存储储、加工工、传递递和利用用等一系系列活动动的总和和。第一节数数据管管理概念念数据管理理技术的的发展阶阶段数据管理理经历了了人工管管理、文文件管理理、数据据库管理理三个阶阶段。每每一阶段段的发展展以数据存储储冗余不不断减小小、数据独立立性不断断增强、数据操操作更加加方便和和简单为为标志,各有各各的特点点。在应应用的驱驱动下,在计算算机硬件件、软件件发展的的基础上上,有了了如下数数据管理理的三个个阶

3、段:人工管理理阶段文件系统统阶段数据库系系统阶段段数据冗余余:在一一个数据据集合中中重复的的数据称称为数据据冗余数据独立立性包括括数据的的物理独独立性和和逻辑独独立性。物理独立立性:物物理独立立性是指指用户的的应用程程序与存存储在磁磁盘上的的数据库库中数据据是相互互独立的的。逻辑辑独立性性逻辑独立立性是指指用户的的应用程程序与数数据库的的逻辑结结构是相相互独立立的,即即,当数数据的逻逻辑结构构改变时时,用户户程序也也可以不不变。(一)手手工管理理阶段财政部门门财政部门门数据集集工商部门门工商部门门数据集集财政部门门财政部门门数据集集(一)手手工管理理阶段(一)人人工管理理阶段特点1(1)数数据

4、不保保存,数数据最小小,数据据无结构构由于数据据是面向向应用程程序的,在一个个程序中中定义的的数据,无法被被其他程程序利用用,因此此程序与与程序之之间存在在大量的的重复数数据。(2)用用户直接接管理,且数据据缺乏逻逻辑组织织(3)没没有软件件系统对对数据进进行管理理数据管理理任务,包括存存储结构构、存储储方法、输入输输出方法法等完全全由计算算机自负负其责。这就给给应用程程序设计计人员增增加了很很大的负负担。(4)只只有程序序概念,没有文文件的概概念(5)一一组数据据对应一一个程序序,数据据是面向向应用的的,缺乏乏独立性性(6)数数据与程程序不具具有独立立性一组数据据对应一一组程序序。这就就使得

5、程程序依赖赖于数据据,如果果数据的的类型、格式或或者数据据量、存存取方法法、输入入输出方方式等改改变了,程序必必须做相相应的修修改。(二)文文件管理理文件系统统财政部门门工商部门门税务部门门财政部门门数据集集财政部门门数据集集财政部门门数据集集(二)文文件管理理阶段(二)文文件系统统阶段特点(1)数数据可以以长期保保存在计计算机外外存上,可以被被反复处处理,并并支持文文件的查查询,修修改、插插入和删删除等操操作(2)有有软件(文件系系统)对对数据进进行管理理,程序序和数据据有了一一定的独独立性(数据不不再属于于某个特特定的程程序,可可以重复复使用)(3)文文件的形形式多样样化(4)文文件系统统

6、实现了了记录内内的结构构化,数数据的存存取基本本上以记记录为单单位,但但从文件件的整体体来看确确实无结结构的(5)数数据共享享性仍然然不高,且数据据冗余度度大,管管理和维维护的代代价也很很大(三)数数据库管管理阶段段特点(1)面面向全组组织的复复杂的数数据结构构,具有有整体的的结构性性(2)用用综合的的方法组组织数据据(3)数数据具有有较高的的独立性性(4)可可控数据据冗余度度(5)数数据共享享性(6)统统一数据据控制功功能(三)数数据库管管理阶段段政府数据据库系统统财政部门门工商部门门税务部门门三个阶段段的区别别三个阶段段的区别别三个阶段段的区别别第二节数数据库库管理技技术一、什么么是数据据

7、库二、数据据库系统统三、数据据库的分分类四、数据据库技术术的研究究应用及及发展方方向五、电子子政务中中几种常常用的数数据库(政府网网站的构构建与运运作)数据库的的基本概概念:“型”和和“值值”的的概念型(Type)对某一类类数据的的结构和和属性的的说明值(Value)是型的一一个具体体赋值例:学生生记录为为(学号号、姓名名、性别别、系别别、年龄龄),称称为记录型,也称之之为字段段,而而(001101,张立,男,计计算机,20)称记录值,也称之之为记录录。第二节数数据库库管理技技术一、什么么是数据据库数据库是是存储数数据的仓仓库,很很明显它它不同于于一般意意义上的的仓库,它是按按一定格格式存储储

8、在计算算机存储储设备上上的相关关数据的的集合,简言之之就是统统一管理理的相关关数据的的集合。第二节数数据库库管理技技术二、数据据库系统统数据库系系统是实实现有组组织地、动态地地存储大大量关联联数据,方便多多用户访访问的计计算机化化软件、硬件和和数据资资源组成成的系统统,即采采用数据据库技术术的计算算机系统统。(一)数数据库管管理系统统数据库建建立数据库操操作数据库查查询数据库控控制数据库最终用户应用系统数据库管理员(DBA)应用程序员应用开发工具DBMS操作系统数据库系系统的组组成图图第二节数数据库库管理技技术(二)数数据库管管理数据库管管理员(DataBase Administrator,D

9、BA)管理内容容:(1)参与数数据库设设计的全全过程(2)决定数数据库的的存储于于读取策策略(3)定义数数据的安安全性和和完整性性(4)监督控控制数据据库的使使用和运运行,及及时处理理运行程程序中出出现的问问题(5)改进和和重新构构造数据据库第二节数数据库库管理技技术三、数据据库的分分类(一)层层次数据据库(二)网网状数据据库(三)关关系数据据库(四)面面向对象象的数据据库数据库的的历史 数据据库的历历史就是是数据模模型的发发展历史史,典型型的数据库模有有: 1969年年,层次次数据库库; 70年代初初,网状状数据库库;70年年代后,关系型型数据库库取代了了网状、层次; 80年代后后,数据据库

10、技术术与面向向对象技技术、多多媒体技技术,网网络技术术、人工工智能技技术相结结合,使使面向对对象的关关系型、数据库库、多媒媒体数据据库、分分布式数数据库成成为新的的发展趋趋势。第二节数数据库库管理技技术四、数据据库技术术的研究究应用及及发展方方向1)技术术研究:集中管管理和分分布管理理结合2)发展展方向:多模式式结合如如c/s,b/s等模模式结合合第二节数数据库库管理技技术五、电子子政务中中几种常常用的数数据库(政府网网站的构构建与运运作)(一)Oracle:甲骨文文公司出出品:大大型平台台(二)DB2:IBM公式出出品:大大型平台台(三)Sybase:Sybase出品:大型平平台(四)Mic

11、rosoftSQL Server:中中型平台台(五)informix:大大型平台台(六)MySQL:小小型平台台第三节多多媒体体数据管管理技术术一、什么么是多媒媒体数据据管理技技术二、常用用的多媒媒体数据据管理技技术三、高效效、实用用的多媒媒体数据据管理模模式四、多媒媒体数据据检索技技术第四节数数据仓仓库及商商务智能能技术一、什么么是数据据仓库二、数据据仓库的的体系结结构三、数据据仓库的的特征四、商务务智能技技术数据仓库库的概念念数据库是是一个装装数据(信息的的原材料料)的地地方。数据仓库库是一种种系统,这种系系统也是是用数据据库装东东西。数据仓库库系统(用数据据库装东东西)与与其他基基础业务

12、务系统(例如财财务系统统、销售售系统、人力资资源系统统等,也也是用数数据库装装东西)的区别别是:基基础业务务系统的的特点是是各管各各的,例例如财务务系统生生产了白白菜,那那么用一一个数据据库来装装,人力力资源系系统生产产了猪肉肉,再用用一个数数据库来来装。我我要做一一道菜,需要分分别到各各个数据据库去取取,比较较麻烦(现实的的情况是是大部分分时候让让种菜的的农民伯伯伯送过过来,但但送过来来的东西西不一定定是我想想要的,而且不不同的时时候我想想要不同同的东西西,经常常会被农农民伯伯伯骂,弄弄得双方方都不开开心)。另外一一方面,各个数数据库中中放的是是一些比比较原始始的东西西,我要要拿过来来做菜,

13、还需要要经过很很麻烦的的清洗过过程,一一不小心心里面可可能就藏藏着一条条大青虫虫。那么,数数据仓库库系统就就是建立立一个大大的超市市,将各各地农民民伯伯出出产的东东西收集集过来,清洗干干净,分分门别类类地放好好。这样样,你要要哪种菜菜的时候候,直接接从超市市里面拿拿就可以以了。第五节XML与内容容管理一、XML(一)XML简简介XML全全称为Extensible MarkupLanguage,即即可扩展展的标记记语言。(二)XML语语法(三)XML在在电子政政务中的的应用二、内容容管理(一)内内容管理理的基本本概念(二)内内容管理理体系的的基本功功能结构构(三)内内容服务务的关键键技术(四)内

14、内容管理理和知识识管理的的比较了解XML的原原因随着Web文件越来来越大,越来越越复杂,HTML暴露出几几个方面面的缺陷陷:扩展性性很差,不允许许用户设设定自己己文件的的标签或或者属性性;不支持持描述数数据库和和面向对对象层次次的深层层结构规规范;不支持持检查输输入数据据合法性性的语言言规范。这些特性性严重限限制了它它的应用用。所以以XML(extensible markuplanguage)应运而而生XML是SGML的一个子子集,其其设计目目标是使使SGML能够像HTML一样通过过Web发送、接接收与处处理,它它充分利利用SGML特征并且且简单易易用,保保留了SGML80的功能能,却使使复杂

15、度度降低了了20%. XML文件可以以独立于于Internet存在,其其平台无无关性将将对Web产生巨大大的影响响。XML保留了SGML在可扩展展性、结结构以及及数据确确认方面面的主要要优点,可支持持建立用用户定义义的Web文件类型型。XML文件与HTML相比,XML在以下3个方面都都予以改改进:信息提提供者能能根据需需要自行行地定义义新的标标识及属属性名;XML的描述具具有结构构性,文文件结构构的嵌套套可任意意复杂;应用程程序不用用外部定定义概念念就可以以检查XML文档结构构的正确确性和有有效性。XML文档由字字符数据据(characterdata)和标记记(markup)组成。一方面面,利

16、用用XML可以生成成各种用用于不同同目的的的元数据据:导航航图、内内容评价价、流路路径、定定义、著著者等。另一方方面XML被广泛应应用于文文件及元元数据格格式的编编码,成成为众多多元数据据格式的的基础,如“频频道定义义格式”(CDF),“源内容框框架”(MCF),“资源描述述框架”(RDF),“因特网内内容选择择平台, (PICS), Web集合”(Web collections)。XMLGMLSGMLHTMLXML很难懂的语言,能对数据进行约束比较容易懂,提供了大量的预定义标记,对数据无法约束结合HTML和SGML,能对数据进行约束,可自定义标记数据交换换Web服务内容管理理Web集成系统配

17、置置.XMLXMLXML的的应用背背景信息孤岛岛问题所谓“信信息孤岛岛”,就就是指相相互之间间在功能能上不关关联,信信息不共共享、不不交换,以及存存在信息息资源与与业务流流程和应应用相脱脱节的计计算机应应用系统统,又称称为烟囱囱式系统统。有各各种各样样的信息息孤岛,如企业业内部的的信息孤孤岛、政政府内部部的信息息孤岛、行业内内或行业业间的信信息孤岛岛等。必须建立立一种跨跨平台、能打破破信息孤孤岛的内内容管理理系统(或平台台),无无论企业业有多少少个应用用系统和和多少内内容,也也无论这这些内容容存放在在何处,谁在更更新或使使用这些些内容,都可以以借助这这个平台台对所用用内容进进行转换换、重新新定

18、向和和提供。这样,企业才才能真正正有效地地利用自自己内部部的所有有信息和和数据,这对于于大企业业集团尤尤其重要要。内容管理理的含义义内容管理理是指对对各种非非结构化化或半结结构化的的信息资资源的采采集、加加工、传传递和利利用,并并集成到到结构化化数据的的商业智智能环境境中。它它包括记记录管理理、文档档管理、数据管管理、网网站内容容管理等等,突破破了传统统的办公公自动化化、MIS,ERP,CRM以及工作作流管理理等系统统的应用用范围、使用效效果,覆覆盖了内内联网、外联网网和因特特网上的的资源和和应用。内容管理理就是要要在使用用端建立立一个跨跨系统、跨平台台的系统统,让各各种操作作系统、应用系系统、数数据库(如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论