数据库概论 数据库系统简介_第1页
数据库概论 数据库系统简介_第2页
数据库概论 数据库系统简介_第3页
数据库概论 数据库系统简介_第4页
数据库概论 数据库系统简介_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库概论数据库系统简介什么是信息在数学上是确定性的度量,两次不定性之差,与随机对立猜猜32只球队谁是冠军?折半查找,猜5次,log232按夺冠概率高低划分组,可以用更少次数找到谁是冠军最大熵原理当对一个随机事件的概率分布进行预测时,预测应当满足全部已知的条件,而对未知的情况不要做任何主观假设。这种情况下,概率分布最均匀,熵最大,预测的风险最小对一个一无所知的骰子,其各面朝上的概率均为1/6;如果一个面朝上的概率为1/3,则其余五个面朝上的概率分别是2/15不要把所有的鸡蛋放在一个篮子里,当遇到不确定性时,就要保留各种可能性,将风险降到最小谁是黑桃A?三张扑克牌,猜中黑桃A为赢当你选定一张牌后,对方从剩余的两张牌中打开一张不是黑桃A的给你看,问你此时是否应该改变选择?猜背面颜色三张卡片,A两面红色,B两面黑色,C一面红一面黑。随机抽出一张,如果看到的一面是红色,另一面也是红色的概率是多少?思考:卡片不可能是B,是A或C的概率相同,是A则另一面是红色,是C则另一面是黑色,所以背面是红色的概率是1/2。对否?A1A2B1B2C1C2已知某酒鬼有90%的日子都会出去喝酒,喝酒只去固定三家酒吧。今天警察找了其中两家酒吧都没有找到酒鬼。

问:酒鬼在第三家酒吧的几率?已知某家庭有两个孩子,其中老大是女孩。

问:另外一个是女孩的几率?已知某家庭有两个孩子,其中一个是女孩。

问:另外一个是女孩的几率?贝叶斯定理:月晕而风础润而雨事件A:这水果是苹果;事件B:这水果是圆的一座别墅在过去20年里一共发生过2次被盗,别墅的主人有一条狗,狗平均每周晚上叫3次,在盗贼入侵时狗叫的概率为0.9,问在狗叫时发生入侵的概率是多少?律师也需要数学!肇事车颜色假设某城市80%出租车是黑色的,20%是黄色的,当肇事车是黄色的,目击者有80%的概率声称它是黄色的;当肇事车是黑色的,目击者有80%的概率声称它是黑色的;当目击者声称是黄色的时,它是黄色的可能性有多大?(50%)当目击者声称是黑色的时,它是黑色的可能性有多大?(16/17)某种疾病发病率为1/%,化验的准确率95/%,当化验结果为阳性时,患病几率多大?A:阳性B:患病贝叶斯定理应用:医疗诊断我只不过说了一个大家都知道的事实一个岛上有100个人,其中有5个红眼睛,95个蓝眼睛。这个岛有三个奇怪的宗教规则他们不能照镜子,不能看自己眼睛的颜色他们不能告诉别人对方的眼睛是什么颜色。一旦有人知道了自己是红眼睛,他必须在当天夜里自杀某天,有个旅行者到了这个岛上。由于不知道这里的规矩,所以他在和全岛人一起狂欢的时候,不留神就说了一句话:【你们这里有红眼睛的人。】假设这个岛上的人足够聪明,每个人都可以做出缜密的逻辑推理。请问这个岛上将会发生什么?信息级联:依次决策的误区集群实验设置:依次猜球颜色装有3个小球的小罐,两红一蓝(多数红色)和两蓝一红(多数蓝色)的可能性相同,都是50%每个学生依次背向大家拿出一个球,看清颜色后放回,猜测罐中是多数红色还是多数蓝色,并向大家宣布他的猜测后面的同学看不到前面同学抓到的球的颜色,但能听到他的猜测结果信息是一种能量热力学第一定律:热功转换开啤酒瓶口有白气信息是一种能量热力学第二定律:熵增加热寂说,时间之矢最大熵:分子运动论Maxiwell精灵It’sallfrombit!1比特信息操作最少增加kBln2的熵两次google搜索的碳排放等于烧开1壶水S=klog百变精灵:信息面面观信息是不确定性的消除信息是负熵

信息是有序性的度量信息是系统组织程度的度量信息是事物之间的差异信息是使概率分布发生变动的东西信息是被反映的物质属性信息是通讯传输的内容信息是人与外界相互作用过程中所交换的内容社会熵佛渡有缘人生物熵什么是数据对现实世界中客观事物的符号表示数字、文本、声音、图像计算机中数据能输入计算机,并能为其处理的符号序列数据项是数据记录中最小的、不可分的有名数据单位(姓名,性别)数据元素由若干个数据项组成学生(学号,姓名,系别…)羽毛学者信息与数据的联系数据是信息的符号表示,或称载体信息是数据的内涵,是数据的语义解释数据是符号化的信息信息是语义化的数据例,一幅黑白图象数据——黑白点阵信息——脸谱Data的拉丁解释:已知、事实数据语义语言:形式语义:内涵1101081980010100x?庄子与惠子游于濠梁之上,庄子曰:“鲦鱼出游从容,是鱼之乐也。”惠子曰:“子非鱼,安知鱼之乐?”,庄子曰:“子非我,安知我不知鱼之乐?”惠子曰:“我非子,固不知子矣;子固非鱼也,子之不知鱼之乐,全矣。”庄子曰:“请循其本。子曰‘女安知鱼乐’云者,既已知吾知之而问我,我知之濠上也。”如何共享数据?知识:薪火相传“行动的能力”,“知识就是力量”“可以辅助我们作出决策或采取行动的有很高价值的一种信息形态”

知识管理学习型组织、知识共享悖论:教会徒弟,饿死师傅感知信息学习知识信息:刚才吃了五彩麻辣烫知识:色彩鲜艳的昆虫有毒大数据之矢:知识发现知识普惠万物生灵Why?:数据管理艺术的必然What?:数据模型How?:数据库模式tripleV(veni,vidi,vici)我来、我见、我征服triple?:Why?What?How?提纲回溯——数据管理的发展阶段数据模型数据库模式数据库系统构成数据库发展方向资治通鉴:似曾相识燕归来Turnpoint飘战争与和平悲惨世界日瓦戈医生静静的顿河英雄:峥嵘岁月显身手芸芸众生:大历史河流上泛起的小浪花信息系统的原始雏形结绳记事那么,数据管理的内涵是什么?假定你要开发一个图书馆信息管理系统,你首先需要搞清楚的最基本的事实是:加工对象是谁?加工流程如何运转?对象:图书、学生、管理员……操作:入库、借阅、预约、催还…所以你的任务是:如何定义一个对象?如何实现一项操作?数据结构隆重出场按照逻辑关系组织起来的一批数据,按一定的存储方法把它存储在计算机中,并在这些数据上定义了一个运算的集合逻辑结构数据之间存在的逻辑关系表、树、图、数组…物理结构数据在计算机内的存储方式顺序方式、链接方式…编程起点:声明变量的数据类型具有相同数据结构的数据属同一类,同一类数据的全体称为一个数据类型数据类型说明了数据在数据分类中的归属,用以限定该数据的变化范围有何问题?恒定与绑定的量子纠缠良好的数据结构加上糟糕的代码远胜于糟糕的数据结构加上良好的代码信息系统开发的普世之道圭臬:数据结构+算法=程序孜孜以求之:数据独立性数据独立性当数据的结构发生变化时,通过系统提供的映象(转换)功能,使应用程序不必改变数据的物理独立性当数据的存储结构发生变化时,使应用程序不必改变数据的逻辑独立性当数据的逻辑结构发生变化时,使应用程序不必改变开发信息系统需要哪些数据管理功能?数据定义逻辑结构+物理结构数据操纵查询:事物自身的属性+事物之间的联系更新:插入、删除、修改数据约束对客观事物的合理反映,数据一致性死亡日期不早于出生日期数据独立性的实现视角:

将数据管理从应用程序中剥离出来数据管理:信息系统的心脏作业层管理层决策层信息收集系统数据管理系统决策支持系统原始信息数据决策信息形式化归纳信息系统数据管理对数据的分类、组织、编码、存储、检索和维护数据管理的发展阶段考察要点各阶段的技术及应用背景计算机应用范围外存储设备数据管理软件各个阶段的差别体现谁管理数据数据面向谁数据与应用的独立性应运而生雏凤清于老凤声数据管理征途的星辰大海人工管理文件系统数据库系统人工管理阶段计算机主要用于科学计算数据量小、结构简单,如高阶方程、曲线拟和等外存为顺序存取设备磁带、卡片、纸带,没有磁盘等直接存取设备没有操作系统,没有数据管理软件用户用机器指令编码,通过纸带机输入程序和数据,程序运行完毕后,由用户取走纸带和运算结果,再让下一用户上机操作人工管理阶段访问访问访问数据1数据2数据n程序1程序2程序n人工管理阶段的特点用户完全负责数据管理工作数据的组织、存储结构、存取方法、输入输出等数据完全面向特定的应用程序每个用户使用自己的数据,数据不保存,用完就撤走数据与程序没有独立性存取数据的子程序随着存储结构的改变而改变磁带的特点优点:廉价地存放大容量数据缺点:顺序访问;1%所需,100%访问文件系统阶段计算机不但用于科学计算,还用于管理外存有了磁盘、磁鼓等直接存取设备直接存取设备(DASD)无须顺序存取由地址直接访问所需记录产生了操作系统管理和控制计算机软硬件资源的计算机程序文件系统的功能文件存储空间的管理目录管理文件读写管理文件保护向用户提供操作接口文件系统解放了用户对外存的访问数据1数据2数据n存取方式程序1程序2程序n文件系统提供了一定的物理独立性补贴系别姓名学号劳资科住址系别性别姓名学号房产科学位学分系别姓名学号学籍科学位出身年龄系别性别姓名学号人事科学校的文件系统文件系统的数据定义独立性数据与程序紧密结合,数据的逻辑结构改变则必须修改应用程序数据分散管理,许多文件,许多数据格式数据的语义信息只能由程序来解释,数据怎么组织,以及数据取出来之后按什么含义应用,只有全权管理它的程序知道一个应用若想共享另一个应用生成的数据,必须同另一个应用沟通,了解数据的语义与组织方式信息孤岛信息集成文件系统的数据完整性独立性由于数据存在很多副本,给数据的修改与维护带来了困难,容易造成数据的不一致性数据完整性难于维护性别必须是男或女员工工资不能超过其经理每门课选修人数不能超过100…文件系统的数据操作独立性数据查询困难记录之间无联系用户自己编程实现对每个查询都重新编码本质困难:面对一串字符流,要从中找到目标对象,你需要对其解析、遍历、匹配……文件系统眼中的数据:字符流示例

S(SNO,SNAME,STATUS,CITY) P(PNO,PNAME,COLOR,WEIGHT,CITY) J(JNO,JNAME,CITY) SPJ(SNO,PNO,JNO,QTY)S表示供应商,各属性依次为供应商号,供应商名,供应商状态值,供应商所在城市;P表示零件,各属性依次为零件号,零件名,零件颜色,零件重量,零件存放的城市;J表示工程,各属性依次为工程号,工程名,工程所在城市;SPJ表示供货关系,各属性依次为供应商号,零件号,工程号,供货数量。供应商项目零件供应忆苦思甜查询供应红色零件给北京的工程的供应商姓名供应零件数量最多的供应商使用了三种不同零件的工程……维护约束不允许供应不存在的零件单一工程使用零件的总数量不超过100……青铜世纪——基于文件系统查询分别组织几个文件,存储各类对象的记录CreateFile(S,P,J,SPJ)ScanFile(P)找到红色零件的号码ScanFile(J)找到北京的工程的号码ScanFile(SPJ)找到对应以上两号码的SNOScanFile(S)找到对应以上SNO的供应商姓名adhocquery基于文件系统维护数据完整性如果InsertFile(SPJ)ScanFile(P)判断欲插入的零件号是否在P中如果DeleteFile(P)ScanFile(SPJ)判断欲删除的零件号是否在SPJ中数据库系统阶段计算机管理的数据量大,关系复杂,共享性要求强(多种应用、不同语言共享数据)外存有了大容量磁盘,光盘软件价格上升,硬件价格下降,编制和维护软件及应用程序成本相对增加,其中维护的成本更高,力求降低专门的数据管理软件呼之欲出斯人不出如苍生何数据库的上帝视角数据的本质是什么?数据不是依赖于处理过程的附属品,而是现实世界中独立存在的对象数据1统一存取数据2数据n程序2程序1程序n见,或者不见我就在那里不悲不喜学号姓名性别系别年龄住址出身学位学分补贴学籍科房产科人事科劳资科学校的数据库系统数据库系统阶段的特点有了数据库管理系统面向全组织,面向现实世界独立性较强由DBMS统一存取,维护数据语义及结构面向全组织的数据结构支持全企业的应用而不是某一个应用数据反映了客观事物间的本质联系,而不是着眼于面向某个应用,是有结构的数据文件系统只是记录的内部有结构,一个文件的记录之间是个线性序列,记录之间无联系数据库系统眼中的数据:结构化数据数据的冗余度小,易扩充冗余度小:数据面向整个系统,而不是面向某一应用,数据集中管理,数据共享集中管理的优点:节省存储空间,减少存取时间,避免数据之间的不相容性和不一致性易扩充性:每个应用选用数据库的一个子集,只要重新选取不同子集或者加上一小部分数据,就可以满足新的应用要求数据库的高数据独立性举措一:把数据库定义和描述从应用程序中分离出去举措二:数据描述是分级的(全局逻辑、局部逻辑、存储)举措三:数据存取由系统管理,用户不必考虑存取路径等细节,从而简化了应用程序统一的数据控制功能安全性控制(Security)保护数据以防止不合法的使用所造成的数据泄露和破坏措施:用户标识与鉴定,存取控制完整性控制(Integrity)数据的正确性、有效性、相容性措施:完整性约束条件定义和检查统一的数据控制功能并发控制(Concurrency)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论