




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章绪论基础知识绪论(第一章)物流企业网络技术(第三章)物流数据库及其管理技术(第二章)物流信息系统物流信息技术物流管理信息系统的实施与维护(第十章)物流管理信息系统的分析与设计(第九章)物流管理信息系统的开发(第八章)物流电子商务技术(第七章)GPS与GIS技术(第六章)电子数据交换技术(第五章)五六条码技术与射频技术(第四章)知识目标·掌握物流信息的概念、特点及作用·掌握信息系统的概念、类型;·掌握物流信息技术的构成及其在物流中的作用;·了解信息系统和物流信息系统的概念及作用。技能目标·灵活运用所学知识分析案例;·具备运用理论知识进行物流信息系统分析的基本技能。信息是有价值的资源,只有在得到充分开发时才能发挥其作用。因此,利用信息技术和信息系统深入研究信息的采集、加工处理、存储以及传输的规律,并利用它去实现管理的目标,已引起人们越来越多的重视:作为全书的基础,本章重点介绍物流信息技术与信息系统的相关基础知识。 第一节信息与物流信息一、信息(一)信息的概念英文信息(Information)一词的含义是情报、资料、消息、报道以及知识。长期以来人们把信息看作是消息的同义语,简单地把信息定义为能够带来新内容、新知识的消息。信息系统中通常将信息定义为关于客观事实的可通信的知识。这个定义由三个部分构成:信息是客观世界各种事物特征的反映;信息是可以通信的;信息形成知识。1.信息与消息、信号的关系在日常生活中,人们常把信息与消息和信号等同起来,这样的认识并不确切。信息、消息和信号之间有密切联系,信息常以消息形式表现出来,并通过信号来传递,但是三者之间是有区别的。消息有可能包含非常丰富的信息,但也可能包含很少的信息,若这种信息并未给人们带来新知识的话,那么这种消息所包含的信息实际等于零。所以信息是给人们带来新知识的消息,消息是外壳,信息是消息的内核。信息与信号也是有区别的,信号是携带信息的载体,信息则是这个载体所携带的内容。同一种信息可用多种信号来表示,一种信号也可能用来传递多种信息。因此,信息是消息和信号所表示的内容,用以消除对客观事物认识的不确定性,并实现对系统的控制。2.信息与数据的关系数据(Data)是对客观事物属性、状态及相互关系等进行记载的物理符号或是这些物理符号的组合。它是可识别的、抽象的符号。例如,书架上有四本书,可以用多种符号来描述或记载,如用4,四,肆,Ⅳ,等等。当然,也可以认为这些符号所表示的不是四本书,而是其他任何四个客观事物,这是因为它们仅仅只是物理符号而已。这些符号中,不仅有熟悉的数字,也有字符、文字、图形等。现实生活中接触到的数据很多,它们不仅仅是那些参与数学计算的数据,随着信息技术的发展,也可以是那些符号、图片,甚至声音等。(二)信息的分类信息从不同角度可以分为以下几类:按照管理的层次可分为战略信息、战术信息和作业信息;按照应用领域可分为管理信息、社会信息和科技信息等;按照加工顺序可分为一次信息、二次信息和三次信息等;按照反映形式可分为数字信息、文字信息、图像信息和声音信息等。当然,信息还可以从其他不同角度进行分类。(三)信息的属性(1)真伪性(2)时效性(3)不完全性(4)层次性。(5)可变换性。(6)价值性。(7)可压缩性(四)信息的作用人们将信息、物资和能源作为人类社会发展的三大资源。在工业革命时期,由于对物质和能源应用的巨大成功,从而创造了工业化时代。目前,随着现代科技的进一步发展,信息在人类社会发展中的地位越来越突出,它的作用表现在以下几个方面:(1)认识。人们可以运用信息来学习知识,进行研究与创新工作,了解并掌握世界的脉动。(2)管理。对人与组织执行状态信息的掌握与分析,是现代管理水平的重要标准,也是企业要管理的主要内部资源之一。(3)控制。对生产活动、经济活动的控制都离不开信息的及时回馈。通过对这些活动的控制,可以使信息转化为财富。(4)交流与娱乐。人们生活中的交流、各种大众传播媒体以及娱乐活动都要通过信息来传递。二、物流信息现代物流是将物流信息、采购、运输、仓储、保管、装卸搬运以及包装等物流活动综合起来的一种新型的集成式管理,其任务是尽可能降低物流的总成本,为客户提供最好的服务。其中物流信息是指物流活动中所涉及的必要信息,它和运输、仓储等各个环节都有密切关系,在物流活动中起着神经系统的作用。
(一)物流信息的组成
1.物流系统的内部信息物流系统的内部信息是指伴随物流活动而发生的信息,包括物料移动信息、物流作业信息、物流控制信息和物流管理信息等。2.物流系统的外部信息物流系统的外部信息是指在物流活动以外发生但对物流活动有用的信息,包括供货人信息、顾客信息、订货信息、交通信息、市场信息、政策信息以及物流企业内部与物流活动有关的信息等。(二)物流信息的特点
(1)分布性。分布性是指物流信息分布在不同的地点。信息流是物流的共生物,它伴随着物体的位移而流动。随着物流活动的扩展,需要在全球范围内对物流信息进行收集、处理和加工。(2)动态性。动态性是指物流信息的内容、价值变化较快,从而对物流管理的快速反馈能力提出了较高要求。(3)复杂性。除了内部复杂性以外,物流活动与其他系统的关系也很复杂,使得对物流信息的处理难度增加。从物流管理的角度来看,物流信息则有如下特点:(1)可得性。(2)准确性。(3)及时性。(4)灵活性。(5)支持异常处理。(三)物流信息的分类1.按信息产生和作用领域的不同划分按信息产生和作用领域的不同,物流信息分为以下两类:物流活动所产生的信息和由其他信息源产生而提供给物流使用的信息。2.按信息的作用划分 按信息的作用划分,物流信息分为计划信息、控制及作业信息、统计信息、支持信息。3.按信息的加工程度划分按信息的加工程度划分,信息分为原始信息和加工信息。4.按物流管理功能划分按物流管理功能划分,物流管理大概可以分为四个层次,相应的物流信息也可以分为四个层次:战略计划层信息,决策分析层信息,管理控制层信息,业务层信息5.按物流活动环节划分由于不同物流环节中的物流活动性质存在差异,因此,物流信息的内涵和特点也不尽相同。按物流活动环节分类,可以分为运输信息、仓储信息、装卸信息等,或进一步细分为集装箱信息、托盘交换信息、库存量信息、汽车运输信息等三、物流信息技术在一般的信息技术基础上,根据物流的功能和特点,物流信息技术主要包括传统的电子数据交换(ElectronicDataInterchange)、条形码(BarCode)、射频技术、多媒体技术(Multimedia)、地理信息技术(GeographicalInformationSystem),全球卫星定位技术(GlobalPositioningSystem)、智能标签技术、数据库(DB)及数据仓库技术(DW)、数据挖掘技术(DM)等。在这些信息技术的支撑下,形成了以移动通信、资源管理、监控调度管理、自动化仓储管理、业务管理、客户服务管理、财务管理等多种业务集成的一体化现代物流信息管理系统,本书的后续部分将对上述一些技术作详细的介绍。
第二节系统与信息系统一、系统(一)系统的概念系统是由处于一定的环境中相互联系和相互作用的若干组成部分结合而成,并为达到整体目的而存在的集合。系统按其组成可分为自然系统、人造系统和复合系统三大类。自然系统是自然形成的系统,如天体系统、生态系统、生物系统等。人造系统是指人类为了达到某种目的而对一系列的要素作出有规律的安排,使之成为一个相关联的整体,如计算机系统、生产系统和运输系统等。复合系统是由自然系统和人造系统相结合而构成的系统,实际上大多数系统属于复合系统,如信息系统。(二)系统的特征系统的特征主要表现在以下几个方面:1.整体性一个系统要由两个或更多可以相互区别的要素或子系统组成,它是这些要素或子系统的集合。2.目的性所谓目的性就是系统运行要达到的预期目标。系统目的或功能决定着系统的构成要素和结构。3.相关性系统内的各要素既相互作用,又相互联系。系统各要素的联系是构筑一个系统的基础,这里的联系包括结构联系、功能联系、因果联系等,这些联系决定了整个系统的运行机制。4.环境适应性任何系统都要在一定的环境中运转。环境是一种更高层次(更大的)的系统,当环境发生变化时必然对系统有影响。系统要想生存,就必须适应环境的变化,不能适应环境变化的系统是没有生命力的。二、信息系统(一)信息系统的概念在一个组织(系统)的全部活动中存在着各式各样的信息流,而且不同的信息流用于控制不同的活动。若几个信息流互相联系并组织在一起,服务于同类的控制和管理目的,就形成信息流的网,称之为信息系统。信息系统从构成看是一个复合系统,它由人、硬件、软件和数据资源组成,目的是及时、正确地收集、加工、存储、传递和提供信息,实现组织中各项活动的管理、调节和控制。信息系统包括信息处理系统和信息传输系统两个方面。信息处理系统对数据进行处理,使它获得新的结构与形态或者产生新的数据;信息传输系统不改变信息本身的内容,作用是把信息从一处传到另一处。
(二)信息系统的类型
组织的信息系统一般分为作业信息系统和管理信息系统两大类。第三节管理信息系统与物流管理信息系统一、管理信息系统(一)管理信息系统的概念管理信息系统的概念包括管理、信息和系统,它绝不只是信息,更不只是计算机的应用。它是由管理出发或以管理为目的,通过信息手段来实现计划和控制的系统。(二)管理信息系统的构成管理信息系统通常由以下几个子系统构成(1)统计子系统(2)数据更新子系统。(3)状态报告系统。(4)数据处理子系统。(5)知识工作子系统。(6)决策支持子系统二、物流管理信息系统(一)物流管理信息系统的概念综合有关物流、信息和管理信息系统的定义,可以得出物流管理信息系统(LogisticsManagementInformationSystems)的一个基本定义:以采集、处理和提供物流信息服务为目标的系统。即可以采集、输入、处理数据;可以存储、管理、控制物流信息;可以向使用者报告物流信息,辅助决策,使其达到预定的目标。(二)物流管理信息系统的组成物流管理信息系统的基本组成要素有硬件、软件、数据库与数据仓库以及人员等。1.硬件硬件包括计算机、服务器、网络通信设备等。硬件是物流管理信息系统的物理设备,是实现物流管理信息系统的基础,它构成了系统运行的平台。2.软件软件主要包括系统软件和应用软件两大类。系统软件主要用于系统的管理、维护、控制及程序的装入和编译等工作。应用软件是指挥计算机进行信息处理的程序或文件,它包括功能完备的数据库系统,实时的信息收集和处理系统,实时的信息检索系统,报告生成系统,经营预测、经营监测及规划系统,审计系统及资源调配系统等。3.数据库与数据仓库数据库技术将多个用户、多种应用所涉及的数据,按一定数据模型进行组织、存储、使用、控制和维护管理。数据库系统是面向一般管理层的事务性处理;数据仓库则是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理中的决策制定过程。基于主题而组织的数据便于面向主题进行分析决策,它所具有的集成性、稳定性及时间特征使其成为了分析型数据,为决策层提供决策支持。数据仓库系统也是一个管理系统,它由数据仓库、数据仓库管理系统和数据仓库工具三部分组成。4.人员人员包括系统拥有者、系统分析人员、系统设计人员、系统实施和操作人员,以及系统维护人员、系统管理人员、数据准备人员与各层次管理机构的决策者等。三)物流管理信息系统的结构由于物流系统中存在不同的物流活动环节,以及不同的物流管理部门和人员,对物流信息的需求和处理也有所不同。因此,一个完善的物流管理信息系统应具有以下几个层次:1.业务操作层2.管理控制层3.决策分析层4.战略计划层 (四)物流管理信息系统的功能 物流系统运动的各个环节通过信息流紧密地联系在一起。因而在物流系统中,对物流信息进行采集、储存、传播、处理、显示和分析的物流管理信息系统具有重要地位。它的基本功能可以归纳为以下几个方面: 1.数据的采集和录入 2.信息的储存 3.信息的传播 4.信息的处理 4.信息的输出 建立物流管理信息系统的目的之一是为各类与物流相关的人员提供信息。为了便于人们理解,系统输出的形式应力求易懂、直观醒目。这是评价物流管理信息系统好坏的重要标准之一。本章小结本章首先简单介绍了信息的概念、分类、属性、作用;物流信息的组成、特点、分类以及物流信息技术;接着简单介绍了系统的概念、特征及信息系统的概念、类型;最后详细介绍了管理信息系统的概念、构成以及物流管理信息系统的概念、组成、结构和功能。思考题(1)什么是信息?它的属性有哪些?为什么说管理的艺术在于驾驭信息?(2)什么是管理信息系统?它有哪些基本功能?它与一般的计算机应用有什么不同?(3)管理信息系统包括哪些子系统?子系统之间是如何联系的?(4)物流管理信息系统包括哪些基本组成要素?案例分析
海尔作为世界著名的跨国家电企业,它的产品每天要通过全球5.8万个营销网点,销往世界160多个国家和地区,每月采购26万种物料,制造1万多种产品,每月接到6万个销售订单。对于海尔集团来说,高效率的现代物流信息系统就意味着企业内部运作的生命线,为此,海尔开始了与SAP公司的合作。根据海尔的实际情况,SAP公司先与其合作伙伴EDS为海尔物流本部完成了家用空调事业部的物料管理(MM)模块和仓库管理(WM)模块的硬件实施。2000年3月开始为海尔设计实施基于协同化电子商务解决方案mySAP.com的电子采购平台(BBP)项目。经过双方七个月的艰苦工作,使mySAP.com系统下的MM(物料管理)、生产计划与控制(PP)、财务管理(FI)和BBP正式上线运营。至此,海尔的后台企业资源计划(ERP)系统已经覆盖了整个集团原材料的集中采购、原材料库存及立体仓库的管理与19个事业部PP模块中的生产计划、事业部生产线上工位的原材料配送、事业部成品下线的原材料消耗以及物流本部零部件采购公司的财务等业务,构建了海尔集团的内部供应链。由于海尔物流管理系统的成功实施和完善,构建和理顺了企业内部的供应链,为海尔集团带来了显著的经济效益。采购成本大幅降低,为订单信息流的增值提供支持。“一流三网”的同步模式实现了四个目标:为订单而采购,消灭库存;通过整合内部资源、优化外部资源,使原来的2,336家供应商优化到了840家,建立了更加强大的全球供应链网络,有力地保障了海尔产品的质量和交货期;实现了三个即时(JIT),即JIT采购、JIT配送和JIT分拨物流的同步流程;实现了与用户的零距离。目前,海尔100%的采购订单由网上下达,使采购周期由原来的平均10天降低到3天;网上支付已达到总支付额的20%。以上分析可以发现,物流信息系统在海尔集团取得了很大的成功,这方面的成功案例还有很多,比如沃尔玛、联想集团的物流信息系统等。因此,大力推广物流信息系统是可行的。问题(1)物流管理信息系统的实施对海尔集团的生产经营有什么好处?(2)海尔集团的物流管理信息系统包括哪些子系统?实训设计物流管理信息系统在企业物流中的应用。【实训目标】(1)了解物流管理信息系统包括哪些组成部分;(2)了解物流管理信息系统中用到哪些信息技术;(3)了解物流管理信息系统中各子系统对企业生产经营管理的作用。【实训内容与要求】实训目的:根据物流管理信息系统在某企业的实际应用,分析其各子系统在企业生产及经营的各环节上为企业带来的好处。实训内容:针对上述目的,归纳管理信息系统、物流管理信息系统在企业中的应用方案和应用效果。实训要求:(1)每个同学根据自己对实训目的的理解,自行设计调查方案和调查内容;(2)为深化对实训项目的理解,可在老师的引导下先进行课堂讨论;(3)实训中,要注意了解本章介绍的信息技术在企业生产环节中的具体应用。【成果与检验】每位同学的成绩根据调查报告评定。第二章 物流数据库及其管理技术基础知识绪论(第一章)物流企业网络技术(第三章)物流数据库及其管理技术(第二章)物流信息系统物流信息技术物流管理信息系统的实施与维护(第十章)物流管理信息系统的分析与设计(第九章)物流管理信息系统的开发(第八章)物流电子商务技术(第七章)GPS与GI技术(第六章)电子数据交换技术(第五章)物流条码技术与射频技术(第四章)知识目标·了解数据库的历史、概念及系统构成;·了解数据库发展的新技术、新方向及数据挖掘基础知识;·掌握数据模型、数据设计理论与技术。技能目标·能够熟练运用常用的SQL语句;·掌握数据库设计技术。数据库技术是信息系统的核心和基础,它的出现对物流信息的应用管理有极大的促进作用。物流数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家物流信息化水平的重要标志。本章重点介绍物流数据库及其管理技术,以方便信息的分类、组织、编码储存、检索和维护。第一节数据库基础知识一、数据库概述随着计算机技术的发展,计算机应用从早期的数值计算扩展到数据处理领域。数据库系统是对数据进行组织、存储、管理的系统;数据库技术是一门研究数据库的结构、存储、设计管理和使用的综合软件学科:随着数据库技术的发展,数据库的应用越来越广泛,已经深入到生活的各个领域。(一)基本概念和术语1.数据(Data)数据是描述事物的符号记录,是数据库中存储的基本对象。它可以是数字、文字、图形、图像、声音、语言等。2.信息(Information)由原始数据经加工提炼而成的,用于决定行为、计划或具有一定意义的数据称为信息。信息与数据在概念上是有区别的,不是所有数据都能成为信息,只有经过加工之后,具有新的事实知识的数据才能成为信息。数据经过加工处理之后成为信息,仍然以数据形式表现,此时数据是信息的载体。3.数据库DB(DataBase)数据库是指长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各个用户共享。
4.数据库管理系统DBMS(DataBaseManagementSystem)DBMS是位于用户与操作系统之间的系统软件,是用以管理、维护、访问数据库的程序,其目的是提供一个可以方便、有效地存取数据库信息的环境。常见数据库管理系统有Oracle、Access、SQLServer、DB2、Sybase、Infomix。5.数据处理数据处理是指对数据进行收集、储存、加工和传播,目的是从大量原始数据中推导出有价值的信息,利用计算机科学地管理这些数据。6.数据管理数据管理是指对数据的分类、组织、编码储存、检索和维护。它是数据处理的中心问题,主要围绕提高数据独立性、降低数据的冗余度.提高数据共享性、提高数据的安全性和完整性等方面来进行改进,帮助使用者有效地管理和使用数据资源。(二)数据库技术发展历史数据库技术是应数据管理任务的需要而产生的。人们借助计算机进行数据处理是近30年的事。研制计算机的初衷是利用它进行复杂的科学计算,随着计算机技术的发展,现在其应用已远远超出了这个范围。在应用需求的推动下,在计算机软硬件发展的基础上,数据管理技术经历了人工管理、文件系统、数据库系统三个阶段。各个阶段的背景与特点如表2—1所示。人工管理文件系统数据库系统背景时间:20世纪50年代中期以前,计算机用于科学计算硬件:磁带、纸带,无磁盘软件:无操作系统和管理软件数据处理方式:批处理时间:20世纪50年代后期到60年代中期,计算机用于科学计算和数据处理硬件:有了磁盘、磁鼓软件:有了操作系统和专门的数据管理软件(文件系统)数据处理方式:批处理、联机实时处理时间:20世纪60年代后期硬件:大容量磁盘、硬件价格下降软件:软件价格上升,为编制和维护系统软件及应用程序所需成本增加数据处理方式:联机实时处理、批处理、分布处理特点1)数据不保存(2)无数据管理软件,数据的管理由应用程序完成(3)一组数据对应一个应用程序,数据冗余大且不共享(4)数据不具有独立性(1)数据可以长期保存在外存上(2)由文件系统管理数据,文化多样性(3)数据与程序有了一定的独立性,但独立性差(4)数据存取以记录为单位,共享性差,冗余大(1)数据结构化(2)数据的共享性高,冗余度低,易扩充数据共享,可以避免数据之间的不相容性与不一致性(3)数据独立性高(物理独立性和逻辑独立性)(4)数据由DBMS统一管理和控制三)数据库发展历史和现状数据库开始出现后发展非常迅速,到目前为止已经经历了三代。第一代:层次和网状数据库IBM公司于1968年研制成功层次数据库IMS,它是世界上第一个DBMS系统。第二代:关系数据库系统(RelationalDBMS,RDBMS)1970年,E.F.Codd提出关系数据理论,开创了数据库系统的新纪元,后来又发表了多篇论文,奠定了关系数据库的理论基础。30多年来,关系数据库的研究取得了辉煌的成就,涌现了许多性能良好的商品化关系数据库管理系统,如DB2、Oracle、Ingres、Sybase、Informix等,关系数据库的应用领域也不断扩大。第三代:面向对象的数据库系统(ObjectOrientedDBMS,OODBMS)第三代数据库主要研究内容为以下几个方面:(1)对象关系数据库(ObjectRelationDBMS,ORDBMS);(2)面向对象的关系数据库;(3)数据仓库,数据挖掘;(4)Internet(支持Web的异构数据库互连)。(四)数据库发展方向数据库系统已从第一代的网状、层次数据库系统,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数据库系统。数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等互相渗透,互相结合,成为当前数据库技术发展的主要特征。
在数据库管理系统和数据库应用领域,都有新的研究与应用方向。在数据库管理系统上,主要表现在以下四个方面:(1)面向对象数据库;(2)对象一关系数据库;(3)并行数据库;(4)分布式数据库。在数据库应用方面,主要表现在以下四个方面:(1)数据仓库;(2)数据挖掘;(3)OLAP;(4)时态数据库。图2-1从数据模型、其他计算机技术、应用领域三个方面,通过一个三维空间的视图阐述了新一代数据库系统及其相互关系。二、数据模型数据库系统中,现实世界数据的抽象、描述以及处理等是通过数据模型来实现的。数据模型是数据库系统设计中用于提供信息表示和操作手段的形式架构,是数据库系统实现的基础。根据模型应用的不同目的,可将模型分为两个层次:概念模型(也称语义模型)和数据模型(如网状、层次及关系模型)。(一)概念模型(语义数据模型)1.概念模型概述概念模型也称信息模型,它是按用户的观点来对数据和信息建模,主要用于数据库设计。概念模型独立于具体的机器和DBMS,它是现实世界的抽象描述,是现实世界到机器世界的一个中间层次,反映现实世界所涉及的对象及对象间的联系。概念模型的表示方法很多,其中最为著名的是实体一联系方法。该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。1976年,P.P.Chen提出E-R模型(Entity-RelationshipModel),用E-R图来描述概念模型,把世界抽象为一组称做实体的基本对象和这些对象之间的联系。现实世界的信息要经过概念模型抽象转换后才结构化为数据模型。
信息转化过程2.E-R模型(Entity-RelationshipModel)的相关概念 实体:客观存在的可相互区分的事物。例如,一个职工、一个部门、一门课。 属性:实体所具有的某一特性。例如,对于实体“学生”的属性有:学号、姓名、性别、出生年份、系、入学时间(94002268,张三,男,1976,计算机系,1994)等。关键码:唯一标志实体的属性集。如学号是学生实体的关键码,94002268代表学生张三。域:属性的取值范围。如,性别:(男,女),学号:8位整数。实体型:对同类实体的抽象和刻画。用实体名和属性集合来表示,如顾客(编号,姓名,性别,住址,年龄),学生(学号,姓名,性别,出生年份,系,入学时间)。实体集:同类型实体的集合,如全体顾客、全体学生。联系:实体内部的联系,组成实体的各属性之间的联系。实体之间的联系:不同实体之间的联系,该联系主要有以下三种。一对一的联系(1:1)。如,班级与正班长,指一个班级只有一个正班长,一个正班长对应一个班级。一对多的联系(1:n)。如,班级与学生,指一个班级可以有多个学生组成,一个学生只能属于一个班级。多对多的联系(m:n)。如,课程与学生,指一门课程被多个学生选修,一个学生也可以选修多门课程。 两个实体之间的联系如图2-3所示,三个实体之间的联系如图2-4所示。图中的数字标明了实体之间联系的类型是一对一、一对多或多对多中的一种 3.E-R图数据库的E-R图常用以下图形表示:矩形,表示实体型,矩形框内写明实体名。菱形,表示联系,菱形框内写明联系名,并用无向边与有关实体连接起来,同时在无向边旁标上联系的类型。圆形,表示属性,椭圆形内写明属性名,并用无向边与相应的实体连接。------------连线(无向边),连接实体属性及关系等。 假如一个学生选修课程,则学生与课程之间是选修关系。对于实体学生和课程,其各有自己的属性。将学生和课程的属性及其之间的联系用如图2-5所示的E—R图表示。图中联系“选修”也有属性,它的属性是学生选修某门课程的“成绩”。
(二)数据模型(结构化数据模型)1.相关概念数据结构:描述系统的静态特性,即组成数据库的对象类型。包括数据本身的类型(如内容、性质)和数据之间的联系。数据操作:描述系统的动态特性,即对数据库中对象的实例允许执行的操作的集合,包括操作及操作规则。一般有检索、更新(插入、删除、修改)操作。数据模型要定义操作含义、操作符号、操作规则,以及实现操作的语言。数据的约束条件:是完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确、有效、相容。2.三种数据模型介绍数据模型按计算机系统的观点对数据建模,主要用于DBMS的实现,包括层次模型、网状模型、关系模型等。(1)层次模型。用树状结构表示实体之间联系的模型叫层次模型,是最早使用的一种模型。在层次模型中,每个节点表示一个记录类型,描述的是实体,如图2-6所示,该模型的优点是结构简单,易于实现。缺点是不能表示两个以上实体型之间的复杂联系和实体型之间的多对多的联系,数据操作不方便。(2)网状模型。网状数据模型是以记录为节点的网状结构,是一个有向图,如图2-7所示。该模型的优点是表达的联系种类丰富,性能良好,存取效率高。缺点为结构复杂,语言复杂。
图2-6层次数据模型
图2-7网状数据模型(3)关系模型。关系模型是用二维表格结构来表示实体及实体之间的联系的
模型。其数据结构就是一张二维表,如图2-8所示。表中每一行叫做一个元组,每一列叫一个属性。学号姓名年龄性别系号S01张军21男D01S02李红22女D02S03王伟19男D03学号姓名年龄性别系号S01张军21男D01S02李红22女D02S03王伟19男D03学号姓名年龄性别系号S01张军21男D01S02李红22女D02S03王伟19男D03元组属性【例2-1】描述图2-9所示的学生选课关系模型。【例2-1】描述图2-9所示的学生选课关系模型。图2-9学生选课实体关系图学生(学号,姓名,年龄,性别,系别)课程(课程号,课程名,学分)选课(学号,课程号,成绩)关系模型中的数据操作是对集合的操作,操作对象和操作结果都是关系,即若干元组的集合,而不像非关系模型中是单记录的操作方式。另一方面,关系模型把存取路径向用户隐蔽起来,用户只要指出“干什么”,不必说明“怎么干”,大大提高了数据的独立性。在数据库的物理组织中,表以文件形式存储。三、数据库系统组成
数据库系统是指带有数据库的整个计算机系统,包括硬件、软件、数据以及人员,如图2-10所示。
从数据库体系结构上,数据库系统通常分成三种模式:内模式、概念模式和外模式。内模式(存储模式)是最接近物理存储的,也就是数据的物理存储方式;外模式(用户模式)是最接近用户的,也就是用户所看到的数据视图;概念模式(公共逻辑模式,或有时称逻辑模式)是介于前两者之间的间接的层次。三种关系模式及其组成部分之间关系如图2-11所示。 四、关系数据库介绍关系数据库系统是支持关系模型的数据库系统,是基于严格数据模型的一种数据库系统。1970年,E.F.Codd提出关系数据模型:“ARelationalModelofDataforLargeSharedDataBanks”,1970年之后,提出了关系代数和关系演算的概念,1972年提出了关系的第一、第二、第三范式,1974年提出了关系的BC范式,1980年后,关系数据库系统成为最重要、最流行的数据库系统。典型实验系统有SystemR、UniversityINGRES,典型商用系统有ORACLE、SYBASE、INFORMIX、DB2、SQLServer等。五、SQL语言(一)SQL语言的概念SQL语言(StructuredQueryLanguage)是处理关系数据库的标准语言,并且市场上的任何数据库产品都支持SQL。SQL是20世纪70年代早期在IBM公司的研究所开发的SystemR中实现的,随后又在IBM公司的其他商品和其他公司的商品中实现。SQL原先是作为特殊的“数据子语言”出现的,然而,随着持久存储模块(PSM)在1996年成为了标准,SQL已经变成了计算上完全的语言。T-SQL(TransactStructureQueryLanguage)是一种增强的SQL,它在SQL语言的基础上扩充了许多新的内容。(二)SQL语言的特点SQL语言的特点主要表现在以下几个方面:(1)综合统一。SQL语言集数据定义语言DDL、数据操纵语言DML、数据控制语言DCL的功能于一体。(2)高度非过程化。用户只需提出“做什么”,而不必指明“怎么做”,存取路径的选择以及SQL语句的操作过程由系统自动完成,大大减轻了用户负担,而且有利于提高数据独立性。(3)面向集合的操作方式。SQL语言采用集合操作方式,操作对象、查找结果可以是元组的集合,一次插入、删除、更新操作的对象可以是元组的集合;非关系数据模型采用的是面向记录的操作方式,操作对象是一条记录。(4)同一种语法结构提供两种使用方式。一是自含式语言“,能够独立地用于联机交互的使用方式;二是作为嵌入式语言,能够嵌入到高级语言(例如C++,JAVA,Delphi)程序中,供程序员设计程序时使用。在这两种不同使用方式下,SQL语言的语法结构基本一致。
(5)语言简洁,易学易用。soL语言主要功能如表2-2所示,学习起来比较
简单。SQL功能动词数据定义CREATE,DROP,ALTER数据查询SELECT数据操纵INSERT,UPDATE,DELETE数据控制GRANT,REVOKE小贴士 基本表:本身独立存在的表,一个关系对应一个表;存储文件:存储文件的逻辑结构组成了关系数据库的内模式,存储文件的物理结构是任意的,对用户是透明的;视图:从一个或几个基本表或视图导出的表是虚表,只存放视图的定义而不存放对应数据。(三)常用SQL语言SQL语言由四部分组成,包括DDL(DataDefinitionLanguage)、DML(DataManipulationLanguage)、DCL(DataControlLanguage)和其他,主要功能如表2-2所示。注:本章不作特别说明,语句格式按SQL2000格式书写。在讲解SQL语言时,假定已经存在学生课程库,内含以下三个基本表:学生表:Student(Sno,Sname,Ssex,Sage,Sdept)课程表:Course(Cno,Cname,Cpno,Ccredit)学生选课表:SC(Sno,Cno,Grade)下面的操作介绍均以这三张表为基础。1.SQL数据定义语言(DDL)DDL主要有以下几方面的功能:(1)定义表,如创建表,删除表,修改表定义;(2)定义视图(外模式或外部视图),如创建视图、删除视图、间接修改视图定义(删除十创建视图);(3)定义索引(内模式或内部视图),如创建索引、删除索引、间接修改索引定义(删除十创建索引)。 SQL的数据定义语句如表2-3所示。
表2-3SQL的数据定义语句操作对象操作方式创建删除修改表CREATETABLEDROPTABLEALTERTABLE视图CREATEVIEWDROPVIEW
索引CREATEINDEXDROPINDEX
【例2-2】建立基本表建立一个“学生”表Student,它由学号Sno、姓名Sname、性别Ssex、年龄Sage、所在系Sdept五个属性组成。其中学号不能为空值,取值是唯一的,并且姓名取值也唯一。CREATETABLEStudent(SnoCHAR(5)NOTNULLUNIQUE,SnameCHAR(20)UNIQUE,SsexCHAR(1),SageINT,SdeptCHAR(15》; 【例2-3】修改基本表 向Student表增加“入学时间”列,其数据类型为日期型。ALTERTABLEStudentADDScomeDATE;小贴士 不论基本表中原来是否已有数据,新增加的列一律为空值。如果基本表中原来已有数据,新增列不可有NOTNULL约束。【例2-4】删除表删除Student表。DROPTABLEStudent:【例2-5】创建索引为学生数据Student表按学号升序建唯一索引。CREATEUNIQUEINDEXStusnoONStudent(Sno);2.SQL数据操纵语言(DML)SQL数据操纵语言提供了select,insert,delete和update命令,完全覆盖关系各种运算。【例2-6】查询表查询全体学生的姓名、学号、所在系。SELECTSname,Sno,SdeptFROMStudent; 在执行查询语句时,常用where关键字来限定查询条件,常用的查询条件如表2-4所示
表2-4where子句常用查询条件查询条件谓词比较=,>,<,>=,<=,!=,<>,!>,!<;NOT+上述比较运算符号确定范围BETWEENAND,NOTBETWEENAND确定集全IN,NOTIN字条匹配LIKE,NOTLIKE空值ISNULL,ISNOTNULL多重条件AND,OR 【例2-7】条件查询 查询年龄不在20~23岁之间的学生姓名、系别和年龄。 SELECTSname,Sdept,SageFROMStudentWHERESageNOTBETWEEN20AND23; 【例2-8】多级查询 查询选修了课程名为“信息系统”的学生学号和姓名。 嵌套查询SELECTSno,Sname③最后在Student关系中FROMStudent取出Sno和SnameWHERESnoIN(SELECTSno②然后在SC关系中找出选FROMSC修了3号课程的学生学号WHERECnoIN(SELECTCno①首先在Course关系中找出‘‘信FROMCourse息系统”的课程号,结果为3号WHERECname=‘信息系统’)); 【例2—9】插人数据、 操纵学生一课程数据库,对每一个系,求学生的平均年龄,并把结果存人数据库。 第一步:建表CREATETABLEDeptage(SdeptCHAR(15),/*系名*/AvgageSMALLINT);/*学生平均年龄x/ 第二步:插人数据INSERTINTODeptage(Sdept,Avgage)SELECTSdept,AVG(Sage)FROMStudentGROUPBYSdept; 【例2-10】修改表 将计算机科学系(系名用‘CS’表示)全体学生的成绩置零。UPDATESCSETGrade=OWHERE'CS’=(SELETESdeptFROMStudentWHEREStudent.Sno==SC.Sno);【例2-11】删除记录删除计算机科学系所有学生的选课记录。DELETEFROMSCWHEERE‘CS’==(SELETESdeptFROMStudentWHEREStudent.Sno=SC.Sno);3.SQL数据控制语言(DCL)、数据控制亦称为数据保护,包括数据安全性控制、完整性控制、并发控制和数据恢复。(1)数据库的安全性控制是指保护数据库,防止不合法的使用所造成的数据泄露和破坏。数据库系统保证数据安全性的主要措施在于进行存取控制,即规定不同用户对于不同数据对象所允许执行的操作,并控制各用户只能存取其有权存取的数据。DBMS实现数据安全性保护的过程为:①用户或DBA把授权决定告知系统,这是由SQL的GRANT和REVOKE语句来完成的;②DBMS把授权的结果存人数据字典;③当用户提出操作请求时,DBMS根据授权情况进行检查,以决定是否执行操作请求。(2)数据库的完整性控制是指对于数据库中数据的正确性与相容性,SQL语言定义完整性约束条件。(3)并发控制指的是当多个用户并发地对数据库进行操作时,对他们加以控制、协调,以保证并发操作正确执行,并保持数据库的一致性。SQL语言提供了并发控制能力。(4)数据恢复指的是当发生各种类型的故障,使数据库处于不一致状态时,将数据库恢复到一致状态的功能。SQL语言提供了恢复的功能,支持事务、提交以及回滚等功能。【例2-12】授权把对Student表和Course表的全部权限授予用户U2和U3。GRANTALLPRIVILIGESONTABLEStudent,CourseTOu2,U3;【例2-13】插入授权把对表SC的INSERT权限授予U5用户,并允许他再将此权限授予其他用户。GRANTINSERTONTABLESCTOU5WITHGRANTOPTION;【例2-14】回收权限把用户U5对SC表的INSERT权限收回。REVOKEINSERTONTABLESCFROMU5:;4.存储过程和触发器存储过程是为了完成特定功能汇集而成的一组命名了的SQL语句集合,该集合编译后存放在数据库管理系统中,可根据实际情况重新编译,该过程可直接运行,也可以远程运行。触发器是一种特殊的存储过程。,它的优点是不管什么原因造成的数据变化都能自动响应,对于每条SQL语句,触发器仅执行一次,事务可用于触发器中。触发器仅在当前DB中生成,触发器有三种类型,即插入、删除和更新。触发器常用于保证参照完整性。5.嵌入式SQL语言
SQL的表达能力相比高级语言有一定的限制,有些数据访问要求单纯使用
SQL无法完成,因此,有时候要将SQL语言嵌入到高级语言中使用。嵌入式SQL
语言的执行过程如图2-12所示。图2-12嵌入式SQL执行过程第二节数据库技术及设计数据库是信息系统的核心组成部分,数据库设计在信息系统的开发中占有重要的地位,数据库设计的质量将影响信息系统的运行效率及用户对数据使用的满意度。如何根据企业中用户的需求及企业的生存环境,在指定的数据库管理系统上设计企业数据库逻辑模型,建成企业数据库,是从现实世界向计算机世界转换的过程。一、数据库设计理论(一)基本概念1.关系模式关系模式(RelationSchema)是对一个关系的描述,用来定义关系。关系模式的形式化表示为:R(U,D,dom,F)其中,R—关系名;U—属性集合;D—属性来自的域;Dom—属性向域的映射;F—属性间数据的依赖关系。关系模式R(U,D,dom,F)可简化为一个三元组:R(U,F)2.数据依赖数据依赖是通过一个关系中间属性值的相等与否体现出来的数据间的相互关系。它是现实世界中属性间相互关联的抽象,是数据内在的性质,是语义的体现。数据依赖在关系数据库设计中起着核心的作用。数据依赖分为函数依赖和多值依赖。对于一个三元组R(U,F),当且仅当U上的一个关系r,满足数据依赖关系F时,r称为关系模式R(U,F)的一个关系。关系模式R对应的当前值r是元组的集合,r称为关系或关系实例。 例如,在某个关系中存在两个属性,一个为“学生”,一个为“班长”,可以看出,“班长”是“学生”中的一员,所以“班长”对“学生”属性的依赖为平凡函数“依赖”;还有一个关系中的两个属性为“学号”和“姓名”,这两个属性之间本身没有包含关系,所以“姓名”对“学号”属性的依赖为非平凡函数依赖。4.码设K为R(U,F)中的属性或属性组,若K→U,则K为R的候选码(CK),若候选码多于一个,则选定其中的一个作为主码(PK)。5.范式满足不同程度要求的约束集称为不同的范式。6.规范化一个低一级范式的关系模式,通过模式分解(投影运算)可以转化为若干个高一级范式的关系模式的集合,这个过程叫做规范化。(二)范式按照规范化理论,范式共有六种,其关系为:
表2-5不符合第一范式的关系教师代码姓名工资基本工资附加工资001小王50070002小李78960003小张40050表2-6符合第一范式的关系教师代码姓名基本工资附加工资001小王50070002小李78960003小张400502.第二范式(2NF) 第二范式(假定只有一个候选码,且该候选码是主码):当且仅当一个关系变量属于1NF,且该关系变量的每一个非码属性都完全函数依赖于主码时,该关系变量属于2NF。进一步分解的作用是消除传递函数依赖,也正是消除了这种传递函数依赖才解决了更新异常问题。例如,表2-7中所示关系满足1NF,但不满足2NF,因为它的非主属性不完全依赖于由“教师代码”和“研究课题号”组成的主码,“姓名”和“职称”只依赖于主码的一个分量“教师代码”,这种关系会引起数据冗余和更新异常。表2-7不符合第二范式的关系
教师代码姓名职务研究课题号研究课题名解决上述问题的方法是将一个非2NF关系分解为多个2NF的关系。例如,表2-7所示的关系可分解为如下的三个关系:·教师关系:教师代码,姓名,职称;·课题关系:研究课题号,研究课题名称;·教师与课题关系:教师代码,研究课题号。经过上述规范化后的这些关系都符合2NF的要求。3.第三范式(3NF)第三范式(假定关系变量只有一个候选码,且该候选码是主码):当且仅当一个关系变量属于2NF且该关系变量的所有非码属性都不依赖于主码传递时,该关系变量属于3NF。规范化过程的第二步可以归纳为利用投影消除非码属性间的传递函数依赖。例如,表2-8中所示产品关系属于2NF,但不是3NF。这是因为“生产厂名”依赖于“产品代码”,“生产厂地址”又依赖于“生产厂名”,因而“生产厂地址”传递依赖于“产品代码’’。这样的关系同样存在高度冗余和更新异常的问题。表2-8不符合第三范式的关系产品代码产品名生产厂名生产厂地址消除表2-8中传递依赖的方法,是将原关系分解为如下几个3NF关系:产品关系:产品代码,产品名,生产厂名;生产厂关系:生产厂名,生产厂地址。4.BC范式(BCNF)如果一个关系变量的所有非平凡的、完全的函数依赖的决定因素是候选码,则该关系变量属于Boyce/Codd范式(BCNF)。函数依赖图中唯一的一个箭头是从候选码中出来的。前面已经说过,每一个候选码总有箭头出来,而BCNF认为这里没有其他箭头,也就是说,在规范化过程中已没有箭头可消除。关系规范化的步骤如图2-13所示关系规范化的目的是使结构合理,使数据冗余尽量小,清除插入,删除和更新异常。规范化的方法是:将关系模式投影分解成两个或两个以上的关系模式(关系模式的分解不是唯一的),但是分解后的关系模式集合应当与原关系模式“等价”,既具有无损连接性,又保持函数依赖特性。当一个关系模式达到BCNF,说明在函数依赖的范畴内,已实现了彻底分离,可消除“异常”,但在实际应用中,并不一定要求全部模式都达到BCNF。数据库设计是一个相当复杂而且是具有很强应用性的工作,规范化理论仅仅从一个侧面提供了改善关系模式的理论和方法。规范化程度是衡量一个关系模式好坏的标准之一,但不是唯一的标准。在实际设计中,并不是规范化程度越高越好,这取决于应用。因为对规范化程度高的关系模式进行查询时,可能要做更多的连接操作。对原数据模式进行分解后,所带来的问题是对某些查询需要进行开销很大的连接操作,可能影响数据库的性能。因此,在实际应用设计时,根据企业应用要求,既要考虑分解符合要求,又要考虑数据库的性能。二、数据库设计技术 二、数据库设计技术(一)数据库设计概述数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)。在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。它具有数据量大、保存时间长、数据关联复杂、用户要求多样化的特点。数据库是信息系统的核心和基础。数据库把信息系统中大量的数据按一定的模型组织起来提供存储、维护、检索数据的功能,使信息系统可以方便、及时、准确地从数据库中获得所需的信息。数据库设计是信息系统开发和建设的重要组成部分。(二)数据库设计的特点数据库的设计具有以下特点:(1)数据库建设是硬件、软件和数据的结合,常有“三分技术,七分管理,十二分基础数据”的说法。(2)数据库设计应该与应用系统设计相结合,即数据库设计应包含两方面的内容。结构(数据)设计:设计数据库框架或数据库结构。行为(处理)设计:设计应用程序、事务处理等。设计时,要重视对应用中数据语义的分析和抽象,同时要重视对行为的设计。
对结构和行为设计的过程如图2-14所示。(三)数据库设计方法数据库的设计方法有以下几种,不同的设计人员根据系统特点和自身特点选择最适合自己的方法。1.手工试凑法这种方法直观性强,设计质量与设计人员的经验和水平有直接关系。缺乏科学理论和工程方法的支持,工程的质量难以保证,数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护成本。对于简单较小的系统,可以使用这种方法。2.规范设计法它是一种用过程迭代和逐步求精的方法。典型方法有新奥尔良(NewOrleans)方法、S.B.Yao方法和I.R.Palmer方法。3.计算机辅助设计使用一些数据库工具来进行设计,如ORACLEDesigner2000、SYBASEPowerDesigner等。目前许多计算机辅助软件工程(ComputerAidedSoftwareEngineering,CASE)工具已经把数据库设计作为软件工程设计的一部分,如ROSE、UML(UnifiedModelingLanguage)等。在设计数据库时,应遵循以下设计准则:(1)数据库必须正确反映现实世界,能为某个DBMS所接受;(2)应用系统有良好的性能,有利于实施和维护;(3)数据库能满足当前和今后相当长时期内的数据需求,使数据库有较长的使用寿命,(4)当软件和硬件环境发生变化时容易修改和移植;(5)能满足安全性要求,当系统发生故障时,容易恢复数据库;(6)数据库存取效率、查询效率要高。(四)数据库设计过程 按照规范化设计方法,从数据库应用系统设计和开发的全过程来考虑,将数据库及其应用软件系统的生命周期的三个时期又可以细分为六个阶段:需求分析、概念结构设计、逻辑结构设计、物理结构设计、实施及运行维护,如图2-15所示。第三节数据仓库与数据挖掘随着信息技术的不断推广和应用,许多企业都已经在使用管理信息系统处理管理事物和日常业务。这些管理信息系统为企业积累了大量的信息。企业管理者开始考虑如何利用这些信息对企业的管理决策提供支持。因此,产生了与传统数据库有很大差异的数据环境要求和从这些海洋数据中获取特殊知识的工具的需要。一、数据仓库概述(一)数据仓库的产生及发展随着市场竞争的加剧,信息系统的用户已经不满足于仅仅用计算机去处理每天所发生的事务数据,而是需要信息的决策支持,能够将日常业务处理中所收集到的各种数据转变为具有商业价值信息的技术。传统数据库系统无法提供决策分析支持,主要表现在决策处理中的系统响应、决策数据需求和决策数据操作方面。由于在上述方面,传统数据库不能提供用户的要求,因而近年来出现了数据仓库。数据仓库DW(DataWarehouse)是支持决策支持系统的、面向主题的、集成的、稳定的、带有商业应用软件的数据库系统。它研究如何从不同的数据源中抽取、综合和加工数据,以适当的形式存储和管理数据,从而为数据的分析处理提供好的环境。表2-9数据库与数据仓库对比对比内容数据库数据仓库数据内容当前值历史的、存档的、归纳的、计算得到的数据数据目标面向业务操作程序,重复处理面向主题域、管理决策分析应用数据特性动态变化,按字段更新静态不能直接更新,只定时添加数据结构高度结构化、复杂、适合操作计算简单,适合分析使用频率高中到低数据访问量每个事物只访问少量记录有的事物可能要访问大量记录对响应时间的要求以秒为单位计量以秒、分钟、小时为计量的那位(二)数据仓库的体系结构 数据仓库系统是多种技术的综合体,它由数据仓库(DW)、数据仓库管理系统(DWMS)、数据仓库工具三个部分组成。数据仓库、OLAP和数据挖掘是作为三种独立的信息处理技术出现的。数据仓库用于数据的存储和组织,OLAP集中于数据的分析,数据挖掘则致力于知识的自动发现。它们都可以分别应到信息系统的设计和实现中,以提高相应部分的处理能力,数据仓库的体系结构如图2-16所示。备注:表示关系型数据最终用户可视化工具数据挖掘工具多维分析工具3表示多维数据高度综合级轻度综合级当前细节级早起细节级数据仓库工具层数据仓库管理系统二、数据挖掘概述(一)数据挖掘的产生与发展 与数据仓库不同,数据挖掘DM(DataMining)研究如何利用各种技术从数据仓库中存储的大量历史和现实数据中发现隐含的、有效的、以前未知的,并有潜在使用价值的信息的过程。数据挖掘技术涉及数据库技术、人工智能技术、机器学习和统计分析等多种技术,它使DSS系统跨入了一个新阶段。目前,人们将数据挖掘分为四代,如表2-10所示。表2-10数据挖掘四代的划分代特征数据挖掘算法集成分不计算模型数据模型第一代数据挖掘作为一个独立应用支持一个或者多个算法独立的系统单个计算机向量数据第二代和数据库以及数据仓库集成多个算法,能够挖掘一次不能放进内存的数据数据管理系统包括数据库和数据仓库同质/局部区域的计算机群集有些系统支持对象,文本和连接的媒体数据第三代和预言模型集成多个算法数据管理和预言模型系统Intranet/网络计算支持半结构化数据和Web数据第四代和移动数据/各种计算数据联合多个算法数据管理、语言模型、移动系统移动和各种计算设备普遍存在的计算模型数据挖掘技术和预言模型系统与数据仓库合并,正朝着集成化的方向来管理日常的商业过程(二)数据挖掘过程
数据挖掘是从数据到知识的过程,包括确定挖掘对象、准备数据、建立模型、数据挖掘结果分析、知识应用,如图2-17所示。(三)数据挖掘工具介绍 数据挖掘设计数据库系统、统计学、机器学习、可视化技术、信息技术以及神经网络、模糊/粗糙集理论、知识表示、归纳技术与高性能计算等方面的知识。数据挖掘工具按照使用方式,可以分成决策方案生成工具、商业分析工具和研究分析工具三大类。数据挖掘工具根据其功能特点不同,分为一下四代。 (1)第一代数据挖掘软件:CBA。基本关联规则的分类算法,能从关系数据或者交易数据中挖掘关联规则,使用关联规则进行分类和预测。 (2)第二代数据挖掘软件,其特点表现为:与数据库管理系统(DBMS)集成;支持数据库和数据仓库;具有高性能的接口,具有高的可扩展性;能够挖掘大量数据集以及更复杂的数据集;通过支持数据挖掘模式和数据挖掘查询语言增加系统的灵活性。典型的系统如DBMiner、SASEnterpriseMiner,能通过DMQL挖掘语言进行挖掘操作。 缺陷:只注重模型的生成。 (3)第三代软件,SPSSClementine。 特点:和预言模型系统之间能够无缝地集成,使得由数据挖掘软件产生的模型的变化能够及时反映到预言模型系统中;由数据挖掘软件产生的预言模型能够自动地被操作型系统吸收,从而与操作型系统中的预言模型相联合提供决策支持的功能;能够挖掘网络环境下(InternetlExtranet)的分布式和高度异质的数据,并且能够有效地和操作型系统集成。 缺陷:不能支持移动环境。 (4)第四代数据挖掘软件。目前移动计算越发显得重要,将数据挖掘和移动计算相结合是当前的一个研究领域。第四代软件能够挖掘嵌入式系统、移动系统和普遍存在计算设备产生的各种类型的数据。第四代数据挖掘原型和商业系统尚未见报导。三、数据挖掘的应用 大多数数据挖掘工具需要在集成的、一致的、经过清理的数据上进行挖掘。数据挖掘过程中所需要的数据处理与分析工具完全可以在数据仓库的数据处理与数据分析工具中找到,数据仓库中的OLAP完全可以为数据挖掘提供有关的数据操作支持。数据挖掘技术在数据仓库中的应用,正好弥朴了数据仓库只能提供大量数据,而无法进行深度信息分析的缺陷。 (一)传统的数据挖掘技术 传统的数据挖掘技术包括统计与数据挖掘、统计类数据挖掘技术两类,具体的技术应用包括以下几种方法: (1)数据的聚集与度量技术。常用的聚集函数有:count()、sum()、avg()、max()、min()等。(2)柱状图数据挖掘技术。这种方式简单,从图形看可一目了然。(3)线性回归是最简单的回归形式。双变量回归将一个随机变量Y(称做响应变量)看做为另一个随机变量x(称为预测变量)的线性函数,即Y=α+βx。(4)非线性回归数据挖掘技术。通常包括双曲线模型、二次曲线模型、对数模型、三角函数模型、指数模型、幂函数模型、修正指数增长曲线模等数学模型。(5)聚类数据挖掘技术。(6)最近邻数据挖掘技术。相互之间“接近”的对象具有相似的预测值。如果知道了其中一个对象的预测值后,就可以用它来预测其最近的邻居对象。常用的统计类数据挖掘工具是SPSS。(二)现代数据挖掘技术与发展现在的数据挖掘技术主要有神经网络型现代挖掘技术、遗传算法型现代挖掘技术、粗糙集型现代挖掘技术和决策树型现代挖掘技术。(三)应用实例数据挖掘技术已经在商业、科技等领域有广泛的应用,为决策制定提供科学的依据,在不同的行业,具体的应用目的也有相应差别。银行:美国银行家协会(ABA)预测数据仓库和数据挖掘技术在美国商业银行的应用增长率是14.9%,分析客户使用分销渠道的惰况和分销渠道的容量;建立利润评测模型;客户关系优化;风险控制等。电子商务:网上商品推荐;个性化网页;自适应网站等。生物制药、基因研究:DNA序列查询和匹配;识别基因序列的共发生性。电信:欺诈甄别;客户流失等。 另外,在保险、零售等方面,也有较广泛的应用。本章小结第一节首先介绍了数据库的基本概念、发展历史及发展方向,接着介绍了数据模型、数据库系统,并对常见的关系数据库作了介绍;最后介绍了SQL语言。第二节讲述了数据库设计理论与技术。首先介绍了数据库设计理论;接着介绍了数据库设计技术。第三节讲述了数据仓库与数据挖掘的概念、数据仓库的体系结构及数据挖掘的工具软件,并对数据挖掘的应用作了介绍。思考题(1)什么是数据、信息、数据库?(2)简述数据库管理系统体系结构。(3)数据模式有哪几种,每种特点是什么?(4)请举出现实世界中两个实体集之间为1:1、1:n、m:n关系的实例。(5)SQL语言有哪些功能?包括哪几部分?(6)什么是数据仓库?什么是数据挖掘?数据挖掘与知识发现过程是什么?第三方物流企业数据库设计第三方物流企业是为企业事业单位或者个人从事物流服务的现代化企业。业务包括货物运输、仓储、配送、装卸搬运、包装和信息处理等环节。数据库系统设计按照结构化设计方法,分为需求分析、概念设计、逻辑设计、物理设计和系统实现。1,第三方物流企业数据库系统需求分析(1)用户需求,包括以下内容:车辆资料管理;驾驶员人事、考勤、收入等资料管理;车辆调度;货物配载管理;派车单管理。(2)仓储管理,包括以下内容:库存货物信息管理;入、出库管理;安全库存管理。案例分析(3)配送管理,包括以下业务:配送路线的管理;配送车辆的业绩管理;配送任务单的管理客户关系管理。(4)费用管理,主要包括以下业务:应收/应付账管理;运输费用结算;仓储费用结算。第三方数据库数据流图如图2-18所示。2.第三方物流企业数据库系统概念结构设计为了将用户需求抽象为数据库概念模型,根据概念模型中的实体、实体的属性,确定实体之间的联系及类型,绘制各分E-R图,再集成全局E-R图。根据图2-22中的WL1得到E-R图2-23;根据图2-22中的WL2得到E-R图2-24;根据图2-22中的WL3得到E-R图2-25;根据图2-22中的WL4得到E-R图2-26;将WL1、WL2、WL3、WL4合并得到全局E-R图2_27。3.第三方物流企业数据库系统逻辑结构设计 逻辑结构设计是在选择支持关系数据模型的DBMS产品后进行的,将概念结构的模型转换为DBMD支持的关系数据模型。转换的结果如下:图2-19WL1转化为E-R图
图2-20WL1转化为E-R图入库订单客户
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校校服厂管理制度
- 学校配电间管理制度
- 学生对班级管理制度
- 学院各科室管理制度
- 安全品牌部管理制度
- 安息堂人员管理制度
- 安装充电桩管理制度
- 完善总资产管理制度
- 实验室收费管理制度
- 客户更衣区管理制度
- 胸痛健康教育课件
- 2025年合肥城建发展股份有限公司及所属子公司招聘17人(二批次)笔试参考题库附带答案详解
- 【上料机械手结构中的真空系统的设计计算案例1100字】
- 西方美术史试题及答案
- 七年级数学下学期期末测试卷(1)(学生版+解析)-2025年七年级数学下学期期末总复习(北师大版)
- 医院员工手册管理制度
- 校园短剧创作与演出指导行业跨境出海项目商业计划书
- 泉州水务集团有限公司招聘考试真题2024
- 东航客运岗位面试题目及答案
- 【7历期末】安徽省合肥市包河区2023-2024学年部编版七年级下学期期末历史试卷
- 2025年人教版小学数学三年级下册期末考试卷(带答案)
评论
0/150
提交评论