管理信息系统:第3章 数据库与数据仓库_第1页
管理信息系统:第3章 数据库与数据仓库_第2页
管理信息系统:第3章 数据库与数据仓库_第3页
管理信息系统:第3章 数据库与数据仓库_第4页
管理信息系统:第3章 数据库与数据仓库_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 第三章 数据库与数据仓库 学习目标 数据管理的发展 数据库系统的产生与构成 描述商务智能及其在企业中的作用 关系数据库的主要特征 数据库管理系统的五个软件组成 数据仓库的主要特征 2 3.1 数据管理的发展数据管理的发展 文件系统阶段 数据数据1 1 数据数据2 2 数据数据n n 存取方式存取方式 程序程序1 1 程序程序2 2 程序程序n n 3 补贴补贴系别系别姓名姓名学号学号 劳资科劳资科 住址住址系别系别性别性别姓名姓名学号学号 房产科房产科 学位学位学分学分系别系别姓名姓名学号学号 学籍科学籍科 学位学位学分学分年龄年龄系别系别性别性别姓名姓名学号学号 人事科人事科 籍贯籍贯

2、4 存在问题:存在问题: 1、数据冗余与数据不一致性 2、数据联系弱 3、缺少数据字典,缺乏灵活性 传统文件处理系统传统文件处理系统 5 数据库系统阶段 数据数据1 1 统一存取统一存取 数据数据2 2 数据数据n n 程序程序2 2 程序程序1 1程序程序n n 6 学号学号姓名姓名 性别性别 系别系别 年龄年龄 住址住址 籍贯籍贯 学位学位 学分学分 补贴补贴 学籍科学籍科 房产科房产科 人事科人事科 劳资科劳资科 7 对比方面对比方面文件系统文件系统 数据库系统数据库系统 特 点 数据的管理者文件系统数据库管理系统 数据面向的对象某一应用程序整个应用系统 数据的共享程度共享性差,冗余度大

3、共享性高,冗余度小 数据的独立性独立性差 高度的物理独立性和逻辑独立 性 数据的结构化记录内有结构整体结构化,用数据模型描述 数据控制能力应用程序自己控制 由数据库管理系统提供数据安 全性、完整性、并发控制和恢 复能力 两种数据管理方式的对比 8 数据库是统一管理的相关数据的集合。 3.2 数据库系统的产生与构成 数据库不仅存放数据,而且还要存放数据和数据 之间的联系。 表示数据和数据之间的联系的方法称为。 9 数据库系统的诞生(数据库系统的诞生(20世纪世纪60年代末和年代末和70年代初)年代初) 1)IMS(Information Management System) 1968年研制成功、

4、1969年形成产品的。 10 层次模型用树形结构表示客观事物之间联系的模型。 A BC DEF 11 2)DBTG 美国数据系统语言协会(Conference On Data System Language)下属的数据库任务组(Database Task Group)发 表了若干个报告,奠定了数据库的很多概念、方法和技术。 12 网状模型 (Network Model)用网络结构表示客观事 物之间联系的数据模型。 13 3) 1970年, IBM公司的研究员E.F.Codd发表了论文 “大型共享数据库的关系模型”,为关系数据库的 发展奠定了理论基础。 14 关系模型 (Relational M

5、odel)用二维表表示实体与实体之间 联系的模型。 仓库号城市面积 WH1北京370 WH2上海500 WH3广州200 仓库 器件号器件名称 P1显示卡 P2声卡 P3解压卡 P4散热风扇 器件 器件器件仓库仓库 15 仓库号城市面积 WH1北京370 WH2上海500 WH3广州200 仓库 器件号器件名称 P1显示卡 P2声卡 P3解压卡 P4散热风扇 仓库号仓库号器件号器件号数量数量 WH1P2675 WH1P3250 WH1P4340 WH2P1280 WH2P2200 WH2P4270 WH3P2500 WH3P1330 器件 器件器件仓库仓库 16 仓库号仓库号 城市城市 面积面

6、积 仓库仓库 仓库号仓库号 器件号器件号 数量数量 库存库存 仓库号仓库号 职工号职工号 工资工资 职工职工 职工号职工号 供应商号供应商号 订购单号订购单号 订购日期订购日期 订购单订购单 17 关系数据结构 5 5)外部关键字(外部码)外部关键字(外部码) 设设F F是基本关系是基本关系R R的一个或一组属性,但不是关系的一个或一组属性,但不是关系R R的码,如果的码,如果F F 与基本关系与基本关系S S的主码的主码KsKs相对应,则称相对应,则称F F是基本关系是基本关系R R的外部码,的外部码, 简称简称外码外码。 并称基本关系并称基本关系R R为参照关系(为参照关系(Referen

7、cing relationReferencing relation),或从表,),或从表, 基本关系基本关系S S为被参照关系(为被参照关系(Referenced relationReferenced relation)、目标关系)、目标关系 (Target relationTarget relation)或主表。)或主表。 关系关系R R和和S S不一定是不同的关系,但是不一定是不同的关系,但是KsKs与与F F是定义在同一域中是定义在同一域中 的。的。 18 学号学号 饭卡号饭卡号 姓名姓名 性别性别 学院学院 012005020000 25685234 王俊王俊 F 管理学院管理学院 0

8、12005020001 25685236 李伟李伟 M 管理学院管理学院 012005023852 35862578 陈文陈文 M 软件学院软件学院 012005024583 56987435 张钰张钰 F 环境学院环境学院 列、属性列、属性 行、元组行、元组 主码主码( (PRIMARY KEY) ) 学生基本信息表学生基本信息表 关系数据结构 域域(DOMAIN) 关系名关系名 19 3.3 数据库设计 现实世界现实世界 观念世界观念世界 数据世界数据世界 人们头脑之外的客观世界,它包含客观事物及其相互联系人们头脑之外的客观世界,它包含客观事物及其相互联系 信息世界,是现实世信息世界,是现

9、实世界在人们头脑中的反映界在人们头脑中的反映 现实世界中的事物及其联现实世界中的事物及其联系,在数据世界中用数据模型描系,在数据世界中用数据模型描 20 现实世界 观念世界 数据世界 用户需求分析 概念结构设计 逻辑结构设计 物理结构设计 E-R图图 数据模型数据模型 21 客观 事物类: 事物 相关性质集合 人 实体 实体集合 及 实体 联系 相关属性集合 加工、转换 数 文件 据 记录 库 相关数据项集合 加工 转换 存储 二进制数据集合 结构 计算机世界计算机世界DBMS数据世界数据世界 DBMS 的数据 模型 信息世界信息世界认识选择描述认识选择描述现实世界现实世界 E-R模型 22

10、3)实体联系模型)实体联系模型(E-R模型模型) 实体联系模型反映的是现实世界中的事物及其 相互联系。 图书 作者 写作 出版社 类别 页数 ISBN* 书名 姓名 出生地 身份证号* 定稿时间 价格 23 (1)实体(Entity) 描述客观事物的概念 实体名称实体名称 表示方法:表示方法: 24 (2)属性 指实体具有的某种特性。 表示方法: 属性 实体名称 属性1属性2属性n 25 (3)联系 现实世界的事物总是存在着这样或那样 的联系 表示方法:表示方法: 26 联系的类型联系的类型 设A,B为两个包含若干个体的总体 一对一联系一对一联系 如果对于A中的一个实体,B中至多有一个实体与其

11、发生 联系,反之,B中的每一实体至多对应A中一个实体,则称A 与B是一对一联系。 系 系主任 任职 1 1 病区 科室主任 任职 1 1 27 一对多联系一对多联系 如果对于A中的每一实体,实体B中有一个以上实体与 之发生联系,反之,B中的每一实体至多只能对应于A中的 一个实体,则称A与B是一对多联系。 AB联系 1n 教研室教研室 教师教师 联系联系 1 n 28 多对多联系多对多联系 如果A中至少有一实体对应于B中一个以上实 体,反之,B中也至少有一个实体对应于A中一个 以上实体,则称A与B为多对多联系。 AB 联系 mn 教师教师 学生学生 教学教学 m n 29 出版社 类别 页数 I

12、SBN* 书名 姓名 出生地 身份证号* 定稿时间 价格 1、利用分类、聚集、概括等方法抽象出实体,并一一命名。 2、描述实体之间的联系 3、实体属性和联系属性的说明 30 1 1、注意标识实体属性中的、注意标识实体属性中的关键字关键字; 2 2、如果所处理的对象是一个比较大的系统,则应该先、如果所处理的对象是一个比较大的系统,则应该先 画出各个部门的子画出各个部门的子E-RE-R图,然后再合并同类实体,消除图,然后再合并同类实体,消除 冗余。冗余。 3 3、对于一个特定的应用处理对象,所构造的、对于一个特定的应用处理对象,所构造的E-RE-R模型模型 可能不是唯一的。可能不是唯一的。 31

13、实例 S(SNO,SNAME,DEPT) 学生学生 姓名姓名学号学号系别系别 32 实例 厂长号厂长号 姓名姓名 年龄年龄厂号厂号厂名厂名地点地点 管理管理 11 厂长(厂长(厂长号厂长号,厂号厂号,姓名,年龄),姓名,年龄) 工厂(工厂(厂号厂号,厂名,地点),厂名,地点) 工厂工厂 厂长厂长 33 仓库(仓库(仓库号仓库号,地点,面积),地点,面积) 产品(产品(货号货号,品名,价格,品名,价格,仓库号仓库号,数量),数量) 仓库号仓库号地点地点面积面积 仓库仓库 货号货号品名品名价格价格 产品产品存放存放 1n 数量数量 实例 34 学生(学生(学号学号,姓名,年龄),姓名,年龄) 课程

14、(课程(课程号课程号,课程名,学时数),课程名,学时数) 学习(学习(学号学号,课程号课程号,成绩),成绩) 实例 学号学号姓名姓名年龄年龄课程号课程号课程名课程名学时数学时数 nm 成绩成绩 学生学生课程课程学习学习 35 u在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆 在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量 双双增加了。这不是一个笑话,而是发生在美国沃尔玛连 锁店超市的真实案例,并一直为商家所津津乐道。 u沃尔玛拥有世界上最大的数据仓库系统,为了能够准确 了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行 为进行购物篮分析,想知道顾客经常一起购买的商品有哪 些。沃尔玛数据仓

15、库里集中了其各门店的详细原始交易数 据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘 方法对这些数据进行分析和挖掘。 3.4 数据仓库与商务智能数据仓库与商务智能 36 u一个意外的发现是:“跟尿布一起购买最多的商品竟是 啤酒!经过大量实际调查和分析,揭示了一个隐藏在”尿 布与啤酒“背后的美国人的一种行为模式:在美国,一些 年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中 有30%40%的人同时也为自己买一些啤酒。产生这一现 象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小 孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的 啤酒。 u按常规思维,尿布与啤酒风马牛不相及,若不是借助数 据

16、挖掘技术对大量交易数据进行挖掘分析,沃尔玛是不可 能发现数据内在这一有价值的规律的。 3.4 数据仓库与商务智能数据仓库与商务智能 37 案例Krispy Kreme美国人每年人均7个甜面圈 Krispy Kreme Doughnuts 是美国甜面圈行业中最负盛名的公司,它 的总部座落于北卡罗莱纳州的温斯顿-塞伦,在全美33个州拥有218家分 店和特许经营连锁店。每天出售5百万个甜面圈,每年累计20个亿,或 者说美国人每年人均7个甜面圈。 对Krispy Kreme来说,信息的集中与分散同等重要。公司总部的决策 者需要获取整个组织的信息,包括分店的销售、营销和供应商的数据。 各分店的管理者与经

17、营者则需要能够很容易地存取自己本店的信息,同 时能和其他分店在运营绩效方面进行比较。 在分店层面上, Krispy Kreme搭建了一个名为MY Krispy Kreme的 网站门户。一旦分店的管理者或经营者通过登录进入自己在MY Krispy Kreme上的门户界面,他们就能够访问自己的全部信息,也可以访问那 些被专门设计以帮助分店更好的进行运营的涉及整个组织的信息和应用 程序。管理者和经营者可以分析各店的运营绩效,获取POS数据,回顾 顾客并追踪相关的计数,进而对现金余额和每星期的收益及亏损有全面 的了解。 38 Krispy Kreme依靠多种技术来管理、存储和分析信息。位于组织核心位

18、置的是存储着大量事务信息的数据库(记录每一次POS交易的数据)。 应用数据仓库及数据挖掘工具。数据仓库存储着汇总信息的特殊数据库, 数据仓库的范围涵盖整个组织,包含了各分店的汇总信息。(销售、营 销、供应、库存、财务和其他一些类型信息,这对决策者来说至关重要。 39 商务智能 涉及客户、竞争对手、合作伙伴、竞争环境 和企业内部运作的知识。 创建BI 数据和信息 IT技术定义和分析信息内部的各种关系 DB DBMS DM data warehouse 40 IT解决的两类信息处理 联机事务处理 联机分析处理(OLAP) 输入信息的收集、处理,并利用收集到河经 过处理而得到的信息去更新已存在的信息

19、。 41 产品数据库 广告数据库 顾客数据库 更新产品的 单价、销售 统计 更新广告时 间表,广告 费用分类统 计 扩大顾客的 信誉范围, 拖欠债务的 统计 数据仓库 需要采取什么广告战 略来影响能够接受高 价位产品的顾客 如果库存以 10%的速度下 降,那么新库 存担负的成本 是什么? 制定决策 时使用的 信息 联机事务处理 (OLTP) 联机分析处理 (OLAP) 42 关系型数据库模型 利用一系列存在着逻辑关系的二维表或文件 来存储信息 一个关系模型的数据库包括: 信息的具体内容( 表、文件或关系) 信息的逻辑结构 43 信息的收集 数据库包括几个文件? 文件之间的关联? 每个数据库中有

20、哪些信息(数据项)? 逻辑结构 数据字典的建立:数据的重要信息或逻辑特征 信息内部的逻辑联系 主关键字:文件中的一个字段,唯一表示一条记录。 外部关键字:来自另一个文件的主关键字。 44 讨论主关键字、外部关键字和完整性约束 学校要跟踪某节课的情况,一节课安排一门课程。有一门课 程:FIN 2100国际金融市场导论。学校将在秋季开设该 课程,那么它变成一类课程。在下面的表格中,提供了一些 学校考察该类课程所涉及的信息。 请确定主关键字,对每条信息标出它的外部关键字,列出完 整性约束。例如:是否为空值?是否存在多条记录的重复? 数值的取值范围? 45 教学内容(FINA) 课程编号 课程名 课程

21、说明 先决条件 学分时数 实习费 教师姓名 教室编号 授课节次 授课时间 信息 主关键字 外部关键字 完整性约束 46 数据库管理系统工具 DBMS的组成: DBMS引擎 数据定义子系统 数据操作子系统 应用程序生成子系统 数据管理子系统 47 创建及更新 数据库的逻辑结构 查询及编辑信息 生成菜单、数据输入屏幕 格式、报表及应用软件 数据使用的权限和范围 信息备份和恢复的方法 通过查询查看 结构变更的影响 数据定义 数据操作 应用程序生成 数据管理 D B M S 引 擎 数据库 数据字典 DBMS 的软件子系统 48 数据仓库与数据挖掘 数据仓库:信息的逻辑集合,来自不同的业务数 据库,用

22、于创建BI,可以支持企业的分析活动和 决策任务. 数据挖掘工具: 查询与报表工具 智能代理 多维分析工具 统计工具 49 查询与报表工具 SQL 和QBE 智能代理 神经网络、模糊逻辑 多维分析工具 MDA 统计工具 各种数学模型将信息存储到数据仓库中,进而挖掘 出新的信息 时间序列分析预测未来、回归分析确定变量间的影 响 50 3.5 数据集市 是数据仓库的子集 商品 信誉 分销商 销售额 市场 产品 服务 应收帐户 数据仓库 51 在数据仓库和数据集市中,信息是多维的,立方体是表示 多维信息的常用术语。下图所示的立方体通过时间、地理 位置、产品类型三个维度描述产品的销售情况。 童装 成人服

23、装 产品产品 武汉广州青岛北京 南方 时时 间间 男装 女装 女童装 男童装 第一季度 第二季度 第三季度 第四季度 上半年 下半年 2235284221023041 2860198425002930 1965246031022760 2356274318922830 北方 地区地区 52 信息立方体建立后,用户就可以使用多维数据集, 采用旋转(Pivot)、上钻(Roll_up)和下钻 (Drill_down)、切片(Slice)和切块(Dice)等 技术,从多个角度、多侧面地观察数据库中的数据, 从而深入理解包含在数据中的信息。 53 1)旋转 旋转 客户维 时间维 产 品 维 产品维 时间维 客 户 维 54 2)钻取 年 季 月 日 下 钻 上 钻 较高维度 较低维度 55 3)切片和切块 时间维 客户维 产 品 维 时间维

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论