版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章数据思维
数据的组织数据的管理02
数据的价值0301本章目录01数据的组织数据的组织011、数据的逻辑结构数据的组织012、数据的存储结构数据在内存中存放有两种形态:一是存放数据的内存单元地址是相邻的,二是存放数据的内存单元地址不相邻。因此,当数据元素存放在地址连续的存储单元中,其数据之间的逻辑关系和存储关系是一致的,这样的存储结构称为顺序存储结构。当数据元素存放在任意的存储单元中,这组存储单元可以是连续的或不连续的,数据元素的存储关系并不能反映其逻辑关系,通常使用地址指针来表示数据与数据之间的关系,这种存储结构称为链式存储结构。此外,数据的存储结构还有索引存储结构和散列(Hash)存储结构,这两种存储结构并不是一种“全新”的存储结构,而是在前两种存储结构的基础上扩展定义出的存储结构。数据的组织013、数据结构定义数据是计算机处理符号的总称,数据是由数据元素构成的,数据元素之间存在关系,数据的存储需要根据内存的特点选择适当的方式进行存储,由此,数据结构DS可用一个三元组描述为:DS=(E,R,M)其中,E表示数据元素的集合,R表示数据元素之间关系的集合,M表示存储数据元素的存储单元的集合。数据的组织01线性表数据的组织01树(1)度。一个结点的子树个数称为此结点的度,树中所有结点的度的最大值称为树的度。(2)树的高度。树中的结点有层次之分,从根结点开始定义,根结点的层次为1,根的直接后继的层次为2,依次类推,树中所有结点的层次的最大值称为树的高度,亦称深度。(3)叶子结点和分支结点。根据结点的度,树中的结点可以分为两类,一类是度为0的结点称为叶子结点或终端结点;一类是度不为0的结点称为分支结点或非终端结点。(4)双亲结点、孩子结点和兄弟结点。一个结点的直接前驱称为该结点的双亲结点。一个结点的直接后继称为该结点的孩子结点。同一双亲结点的孩子结点之间互称兄弟结点。(5)祖先结点和子孙结点。从根结点到某一个结点的路径上的所有结点称为该结点的祖先结点,以某结点为根的子树中的任一结点都称为该结点的子孙结点。树是指在n(n≥0)个结点构成的有限集合T中,当n=0时,称为空树;当n>0时,称为非空树,且满足如下条件:(1)树有一个称为根(Root)的结点,即根结点,该结点没有直接前驱,但有零个或多个直接后继。(2)除根结点之外的其余n-1个结点可以划分成m(m≥0)个互不相交的有限集T1,T2,T3,...,Tm,其中子集Ti又是一棵树,称为根结点的子树。数据的组织01树在一棵树中,如果各子树之间是有先后次序的,则称为有序树,否则称为无序树。二叉树(BinaryTree)是一棵除叶子结点外,每个结点至多只有两棵子树的有序树,即结点的度都不大于2。与此同时,二叉树的这两棵子树有左右之分,其次序不能任意颠倒,位于左边的子树称为左子树,位于右边的子树称为右子树。数据的组织01图图由顶点和顶点之间的边的集合组成,设V为图G顶点的非空有限集合,图G中每一条边的两个顶点互为邻接点,E是图G边的有限集合,则图G可形式化描述为:G=<V,E>若图中的每条边没有方向,则称该图为无向图,无向图中的边均为顶点的无序对。若图中的每条边是有方向的,则称该图是有向图,有向图中的边也称为弧,是由两个顶点构成的有序对02数据的管理02数据的管理一、数据库系统DBMS管理数据库的一种系统软件DBA完成某一功能的应用程序1应用程序2应用程序nDBAP1DBAP2DBAPn相互有关联关系的表形式数据的集合数据库//DatabaseDBMS如何支持用户操纵数据库?数据库(DB):Database数据库管理系统(DBMS):DatabaseManagementSystem数据库应用(DBAP):DataBaseApplication数据库管理员(DBA):DataBaseAdministrator计算机软硬件02数据的管理二、数据模型数据模型是一组严格定义的概念集合,是对现实世界中的事物特征、联系和行为的抽象。数据模型精确地描述了系统的数据结构、数据操作和数据完整性约束条件。02数据的管理概念数据模型简称概念模型,是对现实世界的第一层抽象,用户和数据库设计人员之间进行交流的工具。概念模型是整个数据模型的基础,侧重于对客观世界复杂事物的结构及它们内在联系的描述,与具体的计算机平台和数据库管理系统无关的。目前常用概念模型是实体-联系模型(Entity-RelationshipModel,E-R模型)课程学生选修学号姓名年龄性别系别课程号学分课程名成绩mn用矩形表示实体型;用椭圆表示属性;用菱形表示联系,并标示出联系的类型02数据的管理逻辑数据模型简称逻辑模型,是客观世界的抽象描述到信息世界的转换。逻辑模型直接与DBMS有关,概念模型只有在转换成逻辑模型后才能在数据库中得以表示。目前成熟的逻辑模型有层次模型(HierarchicalModel)、网状模型(NetworkModel)、关系模型(RelationalModel)以及面向对象模型(ObjectOrientedModel)。02数据的管理物理数据模型简称物理模型,是面向计算机物理表示的模型,是信息世界模型在机器世界的实现,即将信息世界的实体及其联系抽象为便于计算机存储的二进制格式。物理模型给出了数据模型在计算机上真正的物理结构的表示。02数据的管理三、关系数据库市场上常见的关系数据库产品包括Oracle、SQLServer、MySQL、DB2等关系数据库按照结构化的方法存储数据,每个数据表的结构都事先定义好(比如表的名称、字段名称、字段类型、约束等),然后根据表的结构,数据以行和列的方式进行存储,读取和查询都十分方便,可靠性和稳定性都比较高02数据的管理02数据的管理基本动作对基本动作的抽象【并】操作
【差】操作
【积】操作
【选择】操作
【投影】操作
解释这种组合,并按次序调用基本动作予以执行程序执行机构程序指令基本动作SelectSnameFromStudent,SCWhereStudent.S#=SC.S#andSC.C#=‘001’OrderByScoreDESC;
Sname(student.s#=sc.s#(StudentSC))关系模型基本运算关系模型基本运算的各种组合SQL语言数据库管理系统复杂动作=基本动作的各种方式的组合02数据的管理02数据的管理关系数据库(按行存储数据,按列按类型区分)第一种NoSQL数据库(按“属性名:属性值”对存储数据,均为字符串数据)第二种NoSQL数据库(按文档存储数据,一行是一个文档)第二种NoSQL数据库(按文档存储数据,一行是一个文档,文档中还可能嵌入文档)与关系数据库相比,最大的优点:(1)可扩展性—可随时增加新属性列和减少属性列,而无须改变以前存储的数据。(2)无需事先定义模式,可直接操纵数据(3)并行/分布处理—可适应大规模并行/分布计算。【NoSQL】“不仅是SQL,而不是NO-to-SQL”,不仅能管理结构化数据,而且能管理半结构化甚至非结构化数据的数据库。为处理大数据,多数都采用分布式存储技术<标记>文本</标记>“标记”:“文本”02数据的管理抽象理论设计理论支持设计:设计正确性、完备性判定方法先抽象再设计:从管理一个具体的表,到可管理所有的表抽象:区分并命名表的每一个形式要素理论:数学化逻辑严密化各种概念;设计:语言/实现/系统理论指导下的抽象:抽象更为严密E.F.Codd,基于对“表(Table)”的理解:
提出了“关系”及关系模型,提出了关系数据库理论开创了数据库的时代,当前普遍应用的数据库管理系统的奠基者获得了计算机领域最高奖“图灵奖”03数据的价值03数据的价值1、大数据的概念大数据由巨型数据集组成,这些数据集的大小常超出人们在可接受时间内的收集、应用、管理和处理能力。大数据具有数据量大(Volume)、数据类型多样(Variety)、处理速度快(Velocity)和价值密度低(Value)的特点。03数据的价值2、思维转变由于数据已经具备了资本的属性,可以用来创造经济价值,因此,大数据时代思维方式也在发生转变。维克托·迈尔·舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中明确指出,大数据时代最大的转变就是思维方式的3种转变,即全样而非抽样、效率而非精确、相关而非因果。03数据的价值3、大数据的应用03数据的价值4、数据挖掘数据挖掘,又称为数据库中知识发现,它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。简单地讲就是从大量数据中挖掘或抽取出知识。03数据的价值数据对超市经营有无帮助呢?客户购买习惯商品组合方式及策略……营销策略价格策略货源组织03数据的价值数据挖掘之关联规则挖掘商品的关联规则“尿布”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 餐厅服务质量提升-个性化服务与培训趋势
- 小学生心理健康教育实施方案
- 山东省 胶州市2024~2025学年 七年级上学期 第一次月考英语试卷(无答案)
- 《带着诚信考试 力争理想成绩》期中考试诚信教育及心理调适指导班会课件
- 2024至2030年中国号码随意组合式导线标志烫印机数据监测研究报告
- 2024至2030年中国侧边锁头数据监测研究报告
- 新疆2017年中考化学真题(含答案)
- 集团客户策略
- 2024年中国圆锥破市场调查研究报告
- ASME标准讲解4ASME具体材料
- 智慧体育行业商业计划书
- 旅行社与餐厅合作协议模板
- 《老年人中医养生》课件
- 境外汇款申请书(完成)
- 2023年-2024年中国电力系统同步时钟行业专项调研及产业调查研究分析报告
- 小学三年级、三班家长会
- 五年级主题班会 家长会 课件(共28张PPT)
- 沪教版英语七年级上册第一二单元Unit1-2月考完整试卷(含听力和答案)
- 中学生学习策略量表(LASSI)
- 华师大版八年级上册数学全册配套ppt教学课件
- 幼儿园建筑调研报告
评论
0/150
提交评论