版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1数据库系统与技术(9)
--协同数据库及综合应用信息科学与技术学院计算机科学系协同软件研究开发中心第一页,共四十页。2协同数据库与综合应用什么是协同?信息集成技术信息交换与发布综合应用第二页,共四十页。3协同数据库与综合应用什么是协同?协同——就是指协调两个或者两个以上的不同资源或者个体,协同一致地完成某一目标的过程或能力。协同范围——不仅包括人与人之间的协作,也包括不同应用系统之间、不同数据资源之间、不同终端设备之间、不同应用情景之间、人与机器之间、科技与传统之间等全方位的协同。
协同软件——有助于协同的软件第三页,共四十页。4协同数据库与综合应用协同软件技术:角色协同信息协同流程协同计算协同数据库中的协同技术(信息协同)第四页,共四十页。5信息集成数据集成——把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。信息集成解决的问题是把位于不同的异构信息源上的数据合并起来,以便为用户提供一个统一的视图。
信息集成的数据源可能是传统数据库,也可能是其他类型的信息,如网页的集合。第五页,共四十页。6信息集成“Informationintegration”一词有信息集成、整合、融合的涵义,常见的表述有:信息集成是一种使相关的多元信息有机融合并优化使用的理念。信息集成不是信息的堆积或信息载体的物理堆积。信息集成是一种多针对某个目标或面向某项特定服务对信息进行组织和管理的理念,集成的核心是资源作为大系统,采取技术手段进行整合,实现资源共享。信息集成不是简单地从技术上实现各部门之间的信息共享,而是要从系统运行的角度,保证系统中每个部分、在运行的每个阶段,都能将正确的信息、在正确的时间、正确的地点、以正确的方式、传送给需要该信息的人。针对某一特定领域某一特定用户的需求,以信息为对象,信息资源为本体,服务为动力,网络技术为手段,协同作业为方法,把信息资源诸要素有机融合并使之优化的动态过程,是一个优化要素、体系重构的过程。第六页,共四十页。7信息集成信息集成涉及到很多基础问题的研究,如集成系统的逻辑框架、全局模式与局部模式的映射方法、异构信息源上的查询推理和优化、中间件/包装器技术、半结构化数据等研究。目前通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统,这些技术在不同的着重点和应用上解决数据共享和为企业提供决策支持。第七页,共四十页。8信息集成信息集成涉及到很多基础问题的研究,如集成系统的逻辑框架、全局模式与局部模式的映射方法、异构信息源上的查询推理和优化、中间件/包装器技术、半结构化数据等研究。目前通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统,这些技术在不同的着重点和应用上解决数据共享和为企业提供决策支持。第八页,共四十页。9信息集成联邦数据库系统(FDBS)由半自治数据库系统构成,相互之间分享数据,联盟各数据源之间相互提供访问接口,同时联盟数据库系统可以是集中数据库系统或分布式数据库系统。
第九页,共四十页。10信息集成中间件模式通过统一的全局数据模型来访问异构的数据库、遗留系统、Web资源等。中间件位于异构数据源系统(数据层)和应用程序(应用层)之间,向下协调各数据源系统,向上为访问集成数据的应用提供统一数据模式和数据访问的通用接口。各数据源的应用仍然完成它们的任务,中间件系统则主要集中为异构数据源提供一个高层次检索服务。中间件模式是目前比较流行的数据集成方法,它通过在中间层提供一个统一的数据逻辑视图来隐藏底层的数据细节,使得用户可以把集成数据源看为一个统一的整体。这种模型下的关键问题是如何构造这个逻辑视图并使得不同数据源之间能映射到这个中间层。
第十页,共四十页。11信息集成数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的和不可修改的数据集合。其中,数据被归类为广义的、功能上独立的、没有重叠的主题。这几种方法在一定程度上解决了应用之间的数据共享和互通的问题,但也存在以下的异同:联邦数据库系统主要面向多个数据库系统的集成,其中数据源有可能要映射到每一个数据模式,当集成的系统很大时,对实际开发将带来巨大的困难。数据仓库技术主要针对企业某个应用领域提出的一种数据集成方法,是面向主题并为企业提供数据挖掘和决策支持的系统。
第十一页,共四十页。12信息交换信息交换是信息协同的基础,也是所有协同工作的基础。数据交换——指数据在不同的信息实体之间交互的过程。数据交换的目的是屏蔽企业之间或部门之间的业务系统在硬件平台、操作系统、网络协议和数据源方面的差异,为企业提供一个通用的数据交换平台。
第十二页,共四十页。13信息交换数据交换要解决的关键问题信息的统一表示——信息交换系统的最终目标是实现不同应用系统间透明的信息交换,但是在不同的应用系统中,数据的存储、表示方式可能完全不同。要解决这一问题的关键是要找到数据的统一表示方式,XML标准的出现,使基于统一的规范格式的信息交换系统在实现技术上已经成为可能。第十三页,共四十页。14第十四页,共四十页。15信息交换数据交换主要技术传统的方法:专门开发数据交换接口总线和适配器技术——各个应用系统通过适配器与总线相连,从而实现相互之间的数据交换。但是,由于企业或政府部门都是用已有的工具或系统设计表格、填写表格、审批表格,所以信息的格式、描述方法、传递方式都是不一样的,在这样的异构数据源环境下,要进行信息交换还是十分困难的。第十五页,共四十页。16第十六页,共四十页。17信息交换XML用于数据交换的优势简单性。XML文档是能进行文件结构合法性验证的纯文本文档,对于系统间集成、交换数据来说,最简单的格式就是文本。跨平台性。XML可以在多种平台上使用,可以用多种工具进行解释,而且对于几种主要的字符编码标准都支持,因而可在全世界许多不同的计算环境中使用。各系统只要装有相应的XML解析工具,便可以理解以XML为中介由其它系统传递过来的信息并加以利用。可扩展性。即允许用户根据需要定义新的标签的能力。例如可以使用XML制定应用领域的集成、交换标准。由于XML是可扩展的、平台独立、可支持国际化及地区化格式,它可以通过标记灵活地描述数据,是天生的信息共享与信息交换的数据格式,从而可以建立基于XML的共享信息系统,实现任意应用系统之间的信息集成与交换。第十七页,共四十页。18信息发布信息发布是指信息的所有者以一定的方式提供自己的全部或一部分信息,以供其他用户访问使用的行为。第十八页,共四十页。19第十九页,共四十页。20信息发布 根据发布信息的不同方式,Web信息发布分成自主发布和代理发布两类。前者是信息提供者直接发布信息,其他用户无需第三方的参与就可以直接访问所发布的信息;后者则是信息提供者通过一些代理发布信息,信息在代理服务器上注册/注销,而用户需要向代理服务器发出访问请求,由代理处理请求并返回用户所需要的信息。第二十页,共四十页。21信息发布在第一代的WEB中,静态HTML主页是用的比较多的一种静态信息发布方式。HTML表示超文本标记语言(Hyper
Text
Markup
Language),使用它可以使页面内容不仅仅包括文字,还有声音、图片、视频等,使得信息变得多样化。任何人想要发布信息,只需要购买一个域名,然后开一个WEB服务器或者租用一个网上空间,就可以把制作好的主页放上去,供别人浏览获取信息。随着Internet的发展,越来越多的人加入到网络使用者的行列,他们也都需要向外发布信息。但是自己建设HTML主页的费用比较大,所以这种方式并不适合所有人。而blog的兴起,促成了一个廉价的解决方案。Blog,中文译名博客,也叫网络日志,是一种适用于个人用户的出版工具,具有低成本、低技术和方便易用的特点。用户只需要去blog提供商那里注册一个帐号,就可以马上拥有一个个人的网上空间。而且blog非常容易使用,用户不需要懂任何的web技术,只要在它提供的写作页面里面输入信息,然后这些信息就可以发布出来了,并按照时间的顺序排列起来,别人就可以总是获取到新的信息。第二十一页,共四十页。22信息发布数据库:由传统的数据库管理系统组成,可以是各种异构的数据库系统和文件系统,或者数据仓库。它们存储了要发布的所有信息,是一个信息的仓库。服务器:服务器响应用户的请求。在用户每次查询时,服务器查询数据库,并动态的组织成一定形式,比如网页或XML,供用户使用。用户端:主要为各种浏览器,或者胖客户端的程序,它们能够发起查询请求,并把服务器返回的结果显示出来给用户查看。显而易见,动态发布的方式具有很大的优点,因为它能够提供实时的数据,以支持协同应用。不过它的缺点就是技术比较复杂,开发维护的费用比较大。第二十二页,共四十页。23数据库综合应用现代信息系统是:基于网络平台的有知识处理能力的支持多维数据(时间维等)的具有强数据模型、具有高效的信息处理能力的综合应用难以以单一的数据库技术建模,需要综合应用多种数据库技术、及相关技术,往往换需要研究新的技术。电子政务、电子商务,现代信息服务系统即时通信系统,,,,
第二十三页,共四十页。24传统的工资确定和变更是人事部门工作人员根据工资政策和员工的人事信息完成的。由于工资上报是人事部门日常性工作,加上我国现行的工资政策具有复杂性、时间性、地域性等主要特点,该项工作工作量大、容易出错。工资时态知识数据库系统,也称为工资智能决策支持系统(SIDSS),目标是将各单位的人事部门从繁琐的工资调整工作中解放出来,不再陷于成堆的工资政策中;同时也可以避免许多人为造成的错误,使工资管理规范化。SIDSS是一个综合多种数据库技术的应用系统,主要涉及面向对象技术、时态数据库技术、主动数据库、知识库技术和数据库协同工作等。综合应用实例1—基于时态知识库的工资协同管理系统第二十四页,共四十页。25综合应用实例1—基于时态知识库的工资协同管理系统第二十五页,共四十页。26综合应用实例1—基于时态知识库的工资协同管理系统第二十六页,共四十页。27综合应用实例1—基于时态知识库的工资协同管理系统工资的时态数据模型
SIDSS中含有三类信息:第一类是不影响工资的信息,如人员编号、姓名、身份证号等;第二类是影响工资但不受时间影响的信息,如参加工作时间等;第三类是影响工资也受时间影响的信息,如学历、职务晋升、工资标准等。
一个教师的工资历史记录(时态数据)职务待遇工资档次变动原因
执行时间
助教
2
转正定级
1995/7
助教
3
正常晋升
1998/10讲师
2
职务晋升
1999/3
讲师
3
正常晋升
2000/10第二十七页,共四十页。28综合应用实例1—基于时态知识库的工资协同管理系统工资政策时态知识模型工资政策是一种典型的时态知识,其有效性与时间紧密相关,人们最常见的是:“某某政策从XX年XX月XX日开始执行”。
规则“TKRule_工资晋升”内容如下:
Rule: TKRule_工资晋升
While_Event:MGet_上一次晋升年份(ID)
When:TC_Exp
If: True
Then:M_确定晋升一档表6-12晋升政策描述第二十八页,共四十页。29综合应用实例1—基于时态知识库的工资协同管理系统
表6-12晋升政策描述对象结构结构内容STK_IdTK_晋升STK_Description工资档次晋升ValidTime[1993-10-1,+∞]Priority1TK_TriggerValidNomination(ID)TK_RuleTKRule_工资晋升MethodMGet_上一次晋升年份M_确定晋升一档第二十九页,共四十页。30综合应用实例1—基于时态知识库的工资协同管理系统
表6-12晋升政策描述主动事件机制为了保障系统的正常运行和工资业务的正常管理,SIDSS系统中设计了时态事件处理器实现工资变更事务。(1)事件形式化表达事件主要由两个表达式描述:状态表达式和时间表达式。状态表达式通过人员的现状态和变动条件组合而成。如:新职务工资待遇>原职务工资待遇。时间表达式主要是判断工资的可变动性,如:职务变动时间>原任职时间And职务变动时间>原工资变动时间
第三十页,共四十页。31综合应用实例1—基于时态知识库的工资协同管理系统
表6-12晋升政策描述(2)事件处理器事件处理器主要分为事件生成器、事件排队器、事件调度器和事件处理子模块。第三十一页,共四十页。32综合应用实例1—基于时态知识库的工资协同管理系统
表6-12晋升政策描述事件排队器对事件进行排队的工作流程如下:step1:接收新事件,根据新事件的身份参数判断该事件应该进入哪个队列。Step2:将新事件插入队列头,如果该队列为空,转第6步;否则转第3步。Step3:将新事件的时间参数与其队列后面的事件的时间参数作比较,如果新事件的时间=旧事件的时间,转第4步;如果新事件的时间>旧事件的时间,将新事件与旧事件在队列中的位置互换,转第5步;如果新事件的时间<旧事件的时间,转第6步。Step4:将新事件的优先级与旧事件的优先级作比较,如果新时间的优先级>=旧事件的优先级,转第6步;否则将新事件与旧事件在队列中的位置互换,转第5步。Step5:如果新事件当前位置是队列的尾部,转第6步;否则转第3步。Step6:事件排队结束。第三十二页,共四十页。33中小型数据中心实现信息的智能采集与自动分类、提供用户一个信息使用的协同交流平台。该信息需要综合应用Web数据库、协同数据库、数据仓库、数据挖掘、主动数据库、实时数据库等技术。
综合应用实例2—中小型数据中心系统
第三十三页,共四十页。34综合应用实例2—中小型数据中心系统
数据中心系统功能:信息采集信息定期更新用户之间的协作交流协同信息检索数据中心的协同特点主要包括:支持信息共享支持用户异步交流支持协同信息检索。第三十四页,共四十页。35综合应用实例2—中小型数据中心系统
第三十五页,共四十页。36综合应用实例2—中小型数据中心系统
1)信息智能采集与自动分类。搜索引擎自动从互联网搜索信息,所搜索到的资源通过信息封装、版本控制、自动分类与建立本地索引才能放进数据中心内部。2)信息使用。用户可进行协同信息检索、信息查阅、信息发布、信息评分、信息评论、信息审核等操作。对于感兴趣的信息,还可以订阅、收藏该信息,或把该信息推荐给相关用户。授权用户可以设置信息的访问权限。此外,授权用户可配置数据中心的基础设置。3)数据中心。由数据库跟文件系统组成,存放用户相关信息、互联网上下载下来的资源及其相关信息、用户之间的协同信息等等数据。第三十六页,共四十页。37综合应用实例2—中小型数据中心系统
4.系统实现技术(1)搜索引擎搜索引擎的相关信息配置在XML文档中,在搜索的初始阶段,通过XMLParser读取相关的配置信息,对搜索引擎进行初始化。搜索引擎设计程多线程模式。因为互联网是一个巨大的数据库,Internet上的页面数以亿计,信息量非常巨大,而建立一个搜索连接通常要花费一定的时间,为了加快搜索速度,本模块设计成多线程模型,同时为了提高系统的性能,采用线程池技术,每一线程负责一个搜索任务,当该线程完成一个任务或者连接超时的时候,则提供给下一个搜索任务使用。第三十七页,共四十页。38综合应用实例2—中小型数据中心系统
(2)自动分类智能分类采用最大熵模型来实现。最大熵模型就是拟合所有已知事实,保持对未知事件的未知状态。换而言之,就是给定一些事实集,选择一种模型与现有事实一致,对于未知事件则尽可能使其分布均匀。例如,现在有四个信息分类分别是交通、教育、卫生、经济。而关于“
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- JJF 2181-2024塑料薄膜和薄片氧气透过率测试仪校准规范
- 2024年版简易个人向公司借款合同模板
- 2024年版权授权费用协议
- 杞县特色小镇投资建设研究报告
- 硫酸盐项目申请报告可行性研究报告
- 中秋节假日作文大全10篇
- 水浒传每章读书笔记
- 双十一促销活动策划方案8篇
- 保护树木的建议书模板汇编十篇
- 法律执法课程设计
- 普外科医疗组长竞聘演讲
- 北京市朝阳区2022-2023学年三年级上学期英语期末试卷
- 哔哩哔哩MATES人群资产经营白皮书【哔哩哔哩】
- 【历史】第一、二单元测试题2024~2025学年统编版七年级历史上册
- 婚姻家庭规划
- 认识实习报告(10篇)
- 【MOOC】内科护理学-中山大学 中国大学慕课MOOC答案
- 2024年商业地产买卖合同样本
- 2023-2024学年广东省深圳市福田区七年级(上)期末英语试卷
- 双碳全景系列培训第一章碳达峰、碳中和
- 【企业盈利能力探析的国内外文献综述2400字】
评论
0/150
提交评论