版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据库原理与系统课程简介
1、课程研究对象和研究内容(1)
数据库技术是计算机科学领域中应用最广也是发展最快的技术之一,它已成为计算机信息系统与应用系统的核心技术和重要基础。《数据库原理与系统》是计算机有关专业(指本科生)的必修课程。1、课程研究对象和研究内容(2)本课程的任务是使学生在正确理解数据库原理的基础上,熟练掌握数据库的基本概念和基本理论,熟悉主流数据库管理系统(SQLServer2012)的应用技术,同时具备一定的数据库应用系统的设计、开发能力。
2、本课程在整个课程体系中的地位
“数据库原理与系统”是计算机有关专业学生的必修课,也是学习物理、数学、电子、电子商务等专业主修课程。学习这门课程的先行课程是
《C语言》或《VFP数据库程序设计》及《数据结构》
,后续课程是《大型数据库系统》和《软件工程》。
数据库原理与系统的重要性
数据库技术产生于六十年代末,是数据管理的最新技术,是计算机科学的重要分支。
数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透。
数据库的建设规模、数据库信息量的大小和使用频度已成为衡量一个国家信息化程度的重要标志。可以说,只要有计算机的地方,就在使用着数据库技术。因此,数据库技术的基本知识和基本技能正在成为信息社会人们的必备知识。
本章目录
1.1
数据管理技术的发展阶段与数据库技
术概念1.2
数据库技术的新发展1.3本章小结习题1.1
数据管理技术的发展阶段与数据库技术概念随着数据处理实际应用的需要,引发了数据库技术不断发展,数据处理需要存储大量数据,在计算机中,存储数据的硬件是存储器。在20世纪50年代末,存储器容量只能存储5-10MB的的信息容量,到60年代末才达到近100MB的容量,初步具有了存放大量数据信息的条件,数据管理技术这时候才真正开始发展,所以说,数据管理技术的发展是与计算机中外部存储器的发展密切有关。从70年代开始,存储器的存储容量得到飞速发展,到现在为止,几百GB的硬盘随处都可以买到,数据库中存储数据的困难完全解决,数据管理新技术也不断出现。下面介绍数据管理技术的三个发展阶段和目前使用的数据库技术的基本概念
1.1数据库系统概述
1.1.1
数据管理技术的三个发展阶段1.1.2数据库系统阶段产生的3大新技术1.1.3数据库系统的主要特点1.1.4数据库技术中的几个主要名称
数据管理技术的产生和发展
从20世纪50年代开始至70年代初,数据管理技术的发展经历了人工管理、文件管理和数据库管理三个阶段。人工管理阶段文件系统阶段数据库系统阶段结论
人工管理阶段(1)
20世纪50年代中期以前,计算机主要用于科学计算。硬件设施方面:外存只有纸带、卡片、磁带,没有磁盘等直接存取设备;软件方面:没有操作系统和管理数据的软件;数据处理方式是批处理。人工管理数据具有以下几个特点:(1)数据不能长期保存在计算机内。人工管理阶段(2)(2)数据不共享。数据是面向应用的,一组数据只能对应一个程序。如果多个应用程序涉及某些相同的数据,则由于必须各自进行定义,无法进行数据的共享,因此程序间有大量的冗余数据。(3)数据不具有独立性。数据的独立性包括了数据的逻辑独立性和数据的物理独立性。当数据的逻辑结构或物理结构发生变化时,必须对应用程序做相应的修改。在人工管理阶段,程序与数据之间的对应关系可用下图表示。人工管理阶段应用程序与数据之间的对应关系
文件系统阶段(1)
20世纪50年代后期到60年代中期,这时计算机已大量用于数据的管理。硬件方面:有了磁盘、磁鼓等直接存取存储设备;软件方面:操作系统中已经有了专门的管理软件,一般称为文件系统;处理方式有批处理、联机实时处理等。特点如下:(1)数据以“文件”形式可以长期保存在外部存储器的磁盘上。(2)数据的逻辑结构与物理结构有了区别,但比较简单。文件系统阶段(2)(3)文件组织已有多样化。有索引文件、链接文件和直接存取文件。(4)数据不再属于某个特定的程序,可以重复使用,即数据面向应用。(5)对数据的操作以记录为单位。由于文件系统阶段中设计的文件相互独立,本质上存在许多缺陷,主要是数据冗余大、各文件中数据的不一致性不可避免、数据之间联系弱。在文件系统阶段,程序与数据之间的对应关系可用下图表示。
文件系统阶段应用程序与数据之间的对应关系倒排文件系统阶段(1)产生背景:在20世纪60年代中期,数据管理规模一再扩大,数据量急剧增加,为了提高系统处理数据能力,人们开始对文件系统加以扩充,研制成倒排文件系统(InvertedFile)。(2)特点:倒排文件是索引文件的推广,对每个字段都提供单独的索引。这些文件很适合于信息检索系统。(3)缺点:要占用许多内存,而当时内存昂贵。倒排文件系统阶段应归属于文件系统阶段.数据库系统阶段20世纪60年代后期以来,计算机用于管理的规模更为庞大,数据量急剧增长,硬件已有大容量磁盘,硬件价格下降;软件价格则上升,使得编制、维护软件及应用程序成本相对增加;处理方式上,联机实时处理要求更多,分布处理也在考虑之中。介于这种情况,文件系统的数据管理满足不了应用的需求,为解决共享数据的需求,随之从文件系统中分离出了专门软件系统——数据库管理系统,用来统一管理数据。数据库系统阶段应用程序与数据之间的对应关系可用下图表示。数据库系统阶段应用程序与数据之间的对应关系结
论综上所述,如上图所示,随着数据管理技术的不断发展,应用程序不断从底层的、低级的、物理的数据管理工作中解脱出来,能独立的、较高逻辑级别地轻松处理数据库数据。从而能极大地提高了应用软件的生产力。1.1.2数据库发展中出现的三大新技术1、层次数据库的发明1968年IBM公司研制IMS(InformationManagementSystem)信息管理系统是典型的层次数据库系统。2、网状数据库的发明1969年美国数据系统语言协会的数据库研究小组DBTG(DateBaseTaskGroup)提出了网状数据库系统的报告。3、关系数据库的发明1970年,E.F.Codd首先在美国计算机学会通信杂志发表关系型数据库方面的论文。
1.1.3数据库系统的特点
主要特点:数据结构化有较高的数据独立性
数据库系统为用户提供了方便的用户接口数据库系统提供四方面的数据控制功能结论数据结构化
数据库系统采用数据模型表示复杂的数据结构,这是数据库与文件系统的根本区别。在文件系统中,相互独立的文件记录内部是有结构的,最简单的形式是等长记录,这种结构是面向某一具体应用的,缺乏灵活性;而数据库系统实现了整体的结构化,数据不再面向某一应用,而是面向全组织,不仅数据具有结构,而且存取数据的方式非常灵活,可以存取数据库中的某一个数据项、一组数据项、一个记录或一组记录,而在文件系统中,数据的最小存取单位是记录,粒度不能细到数据项。
数据的独立性包括数据的物理独立性和逻辑独立性。前者是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的,当数据的物理存储改变了,应用程序不用改变;后者是指用户的应用程序与数据库的逻辑结构是相互独立的,数据的逻辑结构改变了,用户程序也可以不变。这一点在后面数据库系统结构中会作比较详细的说明。有较高的数据独立性
用户可以使用查询语言或终端命令操作数据库,也可以用程序方式(例如使用各种高级语言:C++、C#、VisualBasic等编写的程序调用)操作数据库,解决了数据共享的问题,而且降低了数据的冗余度并易于扩充。 数据库系统为用户提供了
方便的用户接口数据库系统提供四方面的数据控制功能(1)数据库的并发控制(Concurrency)。对多用户同时需要应用数据库的并发操作加以控制和协调,防止相互干扰而得到错误的结果。(2)数据库恢复(Recovery)。在某一特殊情况下,数据库被破坏或数据不可靠时,系统有能力将数据库从错误状态恢复到某一已知的正确状态。(3)数据库的完整性(Integrity)。在数据库运行过程中,系统能将数据控制在有效的范围内,或保证数据之间能满足一定的关系。数据库系统提供四方面的数据控制功能(4)数据的安全性(Security)。保护数据,防止不合法用户的使用造成数据的泄密和破坏,使每个用户只能按指定方式操纵数据。总的来说,数据库系统增加了系统的灵活性。对数据的操作可以是集合形式操作,也可以以记录为单位操作,还可以以单个字段或多个字段为单位操作。
结论目前,数据库已经成为现代信息系统的不可分离的重要组成部分。
数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。这样既便于数据的集中管理,又有利于应用程序的研制和维护,提高了数据的利用率和相容性,提高了决策的可靠性。数据库技术是计算机领域中发展最快的技术之一,数据库技术的发展是沿着数据模型的主线展开的。数据库新技术中的几个主要名称数据数据库数据库管理系统数据库系统数据(Data)(1)定义数据是用来记录信息的可识别的符号,是信息的具体表现形式。(2)表现形式数据是数据库中存储的基本对象。按广义的理解来说,数据的种类有很多,如文字、图像、声音、等等都可以转化为计算机可以识别的标识,可以以数字化后的二进制形式存入计算机。在日常生活中人们可以对事务直接用自然语言描述。在计算机中存储和处理时,就要抽出对这些事物感兴趣的特征组成一个记录来描述。(3)与信息的联系数据解释的含义称为数据的语义(即信息),数据与其语义是不可分的。可以这样认为:数据是信息的符号表示或载体,信息则是数据的内涵,是对数据的语义解释。数据库(DataBase,简称DB)(1)数据库从字面意思来说就是存放数据的仓库。具体而言就是长期存放在计算机内的有组织的可共享的数据集合,可供多用户共享,数据库中的数据按一定的数据模型组织、描述和储存,具有尽可能小的冗余度和较高的数据独立性和易扩张性。(2)数据库具有两个比较突出的特点①把在特定的环境中与某应用程序相关的数据及其联系集中在一块并按照一定的结构形式进行存储,即集成性。②数据库中的数据能被多个应用程序的用户所使用,即共享性。数据库管理系统(DataBaseManagementSystem,简称DBMS)(1)数据库管理系统是数据库的核心组成部分,是对数据库中数据进行管理的大型系统软件,是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供了访问数据库的方法,包括数据库的建立、查询、更新及各种数据控制。具体来说包括以下4个主要功能:(1)数据定义。DBMS提供数据定义语言(DataDefinitionLanguage,简称DDL),用户通过它可以方便地对数据库中的数据对象(包括表、视图、索引、存储过程等)进行定义。定义相关的数据库系统的结构和有关的约束条件。
数据库管理系统(DataBaseManagementSystem,简称DBMS)(2)(3)数据库的运行管理。这一功能是数据库管理系统的核心所在。DBMS通过数据库在建立、运用和维护时统一管理和控制,以保证数据安全、正确、有效的正常运行。DBMS主要通过数据的安全性控制、完整性控制、多用户应用环境的并发性控制和数据库数据的系统备份与恢复四个方面来实现对数据库的统一控制功能的(这一内容会在第7章中详细介绍)。(4)数据库的建立和维护功能。数据库的建立和维护功能包括数据库初始数据的输入、转换功能、数据库的转储、恢复功能、重组织功能、性能监视和分析功能等。这些功能均可以使用DBMS中的一些专用命令来解决。数据库系统(DataBaseSystem,简称DBS)
数据库系统是实现有组织地、动态地存储大量关联数据、方便多个用户访问的硬件、软件和数据资源组成的系统,即采用数据库技术的计算机系统。它主要有以下4部分组成:(1)数据库(DB)(2)硬件(3)软件。这一部分包括DBMS、操作系统(OS)、各种开发数据库的高级语言和各种应用开发支撑软件程序。(4)用户:包括数据库管理员(DatabaseAdministrator,DBA),系统分析员和数据库设计人员,应用程序员,一般用户几种.数据库系统结构图1.2数据库技术的新发展虽然目前的数据库技术已经比较完美,但随着社会信息量持续增加,信息处理技术不断发展,数据库技术也在不断发展。每个学员都要及时跟踪和学习数据库技术的最新进展,以便能掌握它的最新技术为自己的工作服务。本节主要简单介绍数据库研究领域和数据库发展两方面的知识。数据库技术的新发展目录1.2.1数据库技术研究的主要领域1.2.2数据库技术的新发展数据库技术研究的主要领域数据库技术研究领域研究的问题十分广泛,也十分复杂,综合起来,可以归结为以下3个方面:(1)数据库理论研究领域(2)数据库系统软件的研制(3)数据库应用系统的设计与开发数据库技术的新发展
从20世纪70年代末发明了数据库系统后,至今数据库技术已经历了3个发展阶段,第1阶段是格式化数据模型包括层次模型和网状模型;第2阶段是关系数据库模型;第3阶段是面向对象的数据模型。虽然第三阶段的技术还不很成熟,但已经可以看出它的优越性。数据库技术发展方向很多,下面介绍的是目前发展比较突出、应用比较广泛的面向对象数据库、数据仓库、数据挖掘3个方面的知识。面向对象数据库
面向对象数据库(ObjectOrientedDataBase,简称OODB)就是把面向对象的方法和数据库技术结合起来的一种数据库。这种数据库可以使数据库系统的分析、设计最大程度地与人们对客观世界的认识相一致。面向对象数据库系统(ObjectOrientedDataBaseSystem,简称OODBS)是为了满足新的数据库应用需要而产生的新一代数据库系统。面向对象数据库的概念有5个核心概念:①对象是基本的数据结构,对象是存储和操作的基本单位。②每个对象有一个永久的标识符,这个标识符在该对象的整个生命周期中都有效,即不论该对象是存储在外存或内存中都有效。③对象可以被指定为类型和子类型,子类型可以继承父类型的所有数据特征和行为。④对象状态由数据值与联系定义。⑤对象行为由对象操作定义需要面向对象数据库应用的领域①辅助软件工程(CASE)、计算机辅助印刷(CAP)和材料需求计划(MRP)领域。②目前应用较为广泛的多媒体数据库。③人工智能(AI)应用的需要。④商业应用领域。目前面向对象的数据库有许多产品出现,应该说,比较好的产品是数据库Oracle
8。它的基础是关系数据库,但它又引入了面向对象的技术。
数据仓库
数据仓库,英文名称为DataWarehouse,可简写为DW数据仓库的特征在于面向主题、集成性、稳定性和时变性。数据仓库的特征(1)①面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。②集成性:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。数据仓库的特征(2)③相对稳定性:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。④时变性:所谓时变性就是能反映历史的变化。数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。数据仓库系统的基本组成从功能结构化来分,数据仓库系统至少应该包含数据获取(DataAcquisition)、数据存储(DataStorage)、数据访问(DataAccess)三个关键部分。数据仓库系统体系结构从数据仓库系统的体系结构来看,主要分为以下几个部分:①数据源。②数据的存储与管理。③OLAP(联机分析处理)服务器。④前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以数据挖掘及各种基于数据仓库或数据集市的应用开发工具。使用数据仓库的好处
(1)仓库中的数据按照一定的方式组织,从而使得信息容易存取并且有使用价值。(2)数据仓库给各级单位带来了巨大的变化。数据仓库的建立给它们带来了一些新的工作流程,其他的流程也因此而改变。(3)数据仓库为各单位带来了一些“以数据为基础的知识”,它们主要应用于对城市规划与建设、寻找采用新方法和新措施的依据、市场战略的评价,和为企业发现新的市场商机,同时,也用来控制库存、检查生产方法和定义用户群。数据仓库与数据库的区别
数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。数据库是面向事务的设计,数据仓库是面向主题设计的。数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。数据库是为捕获数据而设计,数据仓库是为分析数据而设计。
数据挖掘数据挖掘(DataMining),在人工智能领域,习惯上又称为数据库中知识发现(KnowledgeDiscoveryinDatabase,KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下三个阶段组成:数据准备、数据挖掘、结果表达和解释。数据挖掘可以与用户或知识库交互。数据挖掘的应用领域(1)①分类(Classification)。②估值(Estimation)。③预言(Prediction)。④相关性分组或关联规则(Affinitygroupingorassociationrules)。决定哪些事情将一起发生。⑤聚集(Clustering)。⑥描述和可视化(DescriptionandVisualization)。是对数据挖掘结果的表示方式。数据挖掘的应用领域(2)以上6种数据挖掘的分析方法可以分为两类:直接数据挖掘和间接数据挖掘。·直接数据挖掘目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。间接数据挖掘目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系。分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘数据挖掘技术的工作过程①数据的抽取。②数据的存储和管理。③数据的展现。在数据展现方面主要的方式有:查询:实现预定义查询、动态查询、OLAP查询与决策支持智能查询;报表:产生关系数据表格、复杂表格、OLAP表格、报告以及各种综合报表;可视化:用易于理解的点线图、直方图、饼图、网状图、交互式可视化、动态模拟、计算机动画技术表现复杂数据及其相互关系;统计:进行平均值、最大值、最小值、期望、方差、汇总、排序等各种统计分析;挖掘:利用数据挖掘等方法,从数据中得到关于数据关系和模式识别。数据挖掘的发展前景当前数据挖掘应用主要集中在电信、零售、农业、网络日志、银行、电力、生物、天体、化工、医药等方面。看似广泛,实际应用还远没有普及。而据有关专业报告指出,数据挖掘会成为未来10年内重要的技术之一。而数据挖掘,也已经开始成为一门独立的专业学科。数据挖掘的发展应是挖掘工具在先进理论指导下的改进,而就目前情况而言,还有至少20年的发展空间。本章小结1.从上世纪50年代开始,数据管理技术产生并逐步进入快速发展阶段,直至70年代末经历了人工管理阶段、文件系统阶段、数据库系统阶段三个历程。数据库系统阶段直到现在获得到广泛使用,主要是具有以下的优点:数据结构化;数据有很高的独立性;数据共享性好,冗余度小并易于扩充;数据库系统具有数据库并发控制、数据恢复、数据安全性、数据完整性四个方面的数据控制功能。2.要学好数据库技术,首先熟悉其中的数据、数据库、数据库管理系统和数据库系统四个最基本的概念。这些概念会贯穿在本教材的全部内容中。本章小结3.数据库技术一直在不断的发展过程中,计算机领域的专家们对于数据库技术的研究也从末中断过,综合起来,其研究领域主要集中在数据库理论研究、数据库管理系统软件的研制、数据库应用系统设计与开发三个方面。4.目前新型数据库的研发越来越多,应用技术也越来越成熟,在最新发展中影响较大、成果较突出的主要体现在面向对象数据库的研制、数据仓库技术、数据挖掘技术3个方面。面向对象数据库是数据库发展的方向;数据仓库技术对其定义、体系结构、组成、建立步骤、数据仓库作用、建立数据仓库原因以及其对于数据集和数据库的区别等问题作了说明;数据挖掘技术对其定义、起源、作用、关联规则、技术实现方法和发展前景等问题作了介绍。习题一、选择题1.文件倒排系统阶段是属于下列()。A.文件系统阶段B.人工管理阶段C.数据库系统阶段D.面向对象数据库发展阶段2.()是用来实现数据库系统的一些些操作,包括数据定义、数据操纵、数据查询的数据控制等。A.DBMSB.DBC.DBSD.DBA3.可以把文字、图形、图像、声音、各种具体数据,按照一定的结构存放起来,这些都是()A.DATAB.DBSC.DBD.其他4.具有数据独立性和共享受性好、冗余度小的优点发生在()阶段。A.文件系统阶段B.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度城市地下综合管廊安装与维护合同
- 砌石挡土墙施工合同
- 球形网架施工合同
- 论合同的效力终稿
- 2025版酒店股东投资合作经营合同范本:创新管理模式3篇
- 新生个人军训心得体会
- 2025版驾驶员兼送货员绩效管理与薪酬合同3篇
- 2025版高科技企业研发团队聘用合同3篇
- 北京邮电大学世纪学院《文学理论2》2023-2024学年第一学期期末试卷
- 计算机软件开发合同书
- 保密与信息安全培训
- 砂石料供应、运输、售后服务方案-1
- 2022-2023学年江苏省徐州市铜山区四校联考五年级(上)期末科学试卷(人教版)
- 个体工商户公司章程范本:免修版模板范本
- 2023四川测绘地理信息局直属事业单位招考笔试参考题库(共500题)答案详解版
- 山东师范大学《古代文学专题(一)》期末复习题
- 【《“双减”背景下小学数学创新作业设计问题研究》(论文)】
- 健康养生管理系统
- 口风琴在小学音乐课堂中的运用与实践 论文
- 塑件模具验收报告
- 2023年9月份济南天桥区泺口实验中学八年级上学期语文月考试卷(含答案)
评论
0/150
提交评论