数据库规范化理论研究_第1页
数据库规范化理论研究_第2页
数据库规范化理论研究_第3页
数据库规范化理论研究_第4页
数据库规范化理论研究_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 卷 第 期 年 月武汉大学学报(理学版)() ,文章编号:()综 述数 据 库 规 范 化 理 论 研 究郭思培,彭智勇(武汉大学 软件工程国家重点实验室,湖北 武汉 ;华中师范大学 数学与统计学院,湖北 武汉 ;武汉大学 计算机学院,湖北 武汉 )摘要:数据库规范化理论是数据库领域研究的一个重要课题本文综合论述了数据库规范化理论研究的现状,指出了从关系数据库、面向对象数据库到 数据库等各发展阶段中数据库规范化问 题 的 特 点、主 要 思 想 和关键方法,描述了数据库规范化理论的重要研究成果以及存在的问题,指出将形式概念分析方法引入数据库规范 化中,作为新环境下数据库规范化理论研究的新的

2、发展方向关 键词:数据库;关系数据模型;面向对象数据模型; 数据模型;规范化理论中图分类号:文献标识码:鉴了形式概念分析的方法,作为环境下数据库规范化理论研究途径的新思考引言随着信息规模与日俱增,准确高效地进行数据管理便成为了信息技术发展的瓶颈问题数据库规 范化理论从数据组织模式出发,着眼于考察数据库 设计中数据的本质定义与相互关联,从而试图构建 结构清晰明确,使用效率更高的数据库系统从传统的关 系 数 据 库到 面 向 对 象 数 据 库,对象关系数据库,再到以 数据 库为 代 表 的半结构化数据库,无论哪种数据库的构建、管理 及改进都需要以规范化理论为依据随着数据库模 式的不断变化演进,数

3、据库规范化理论方法在数据 库设计与数据管理领域中发挥着重要作用数据库 的规范化,既是对数据库设计技术的理论研究,同时 也为数据信息的组织和管理提供了普适性手段本文沿着数据模型的发展历程,分别对关系数据模型、面向对象数据模型、半结构化数据模型等框 架下的数 据 库 规 范 化 理 论研 究 内 容 做 出 了 总 结归纳,指出各阶段中不同的规范化理论的研究方 法的特点和关键问题所在进一步,在传统规范化研 究方法的基础上,结合信息语义表达的本质特点,借关系数据库规范化理论关系与关系模式针对一个具体问题,应该如何构造适合于它的 数据模式是关系数据库逻辑设计的核心问题,也正是关系数据库规范化理论的研究

4、内容 一个关系通常是由赋予它的元组语义来确定的 凡符合元组语义的那部分 元 素 的 全 体 就 构 成 了 该 关 系 模 式 的 关 系现实世界随着时间不断变化,在不同时刻,关系 模式的关系也会有所变化但现实世界的许多已有 事实限定了关系模式所有可能的关系必须满足一定 的完整性约束条件,这些约束或者通过对属性取值 范围的限定,或者通过属性值之间的相互关联反映 出来后者称为数据依赖,它是现实世界属性间相互 关系的抽象,是数据内在的性质和语义的体现,也是 数据模式设计求精的关键数据库概念设计得到的 是一个关系的集合与一组完整性约束,这是进行数 据库设计的开端,而更严格的设计过程必须通过更 加完整

5、地考虑完整性约束来对数据库模式的初始设收稿日期:基金项目:国家重点基础研究发展计划 ()项 目 ();国家自然科学基金 ();湖北省自然科学基金资助项目 ()作者简介:郭思培,女,博士生,现从事计算机软件理论、数据库理论的研究 :计进行求精达到的最好的范式函数依赖与 公理信息在数据库中的冗余存储是导致产生更新异 常,插入异常,删除异常以及重复占用存储空间等不良性能的根本原因在理想的情况下,我们希望模式 没有冗余“数据依赖”可以用来识别关系模式的属性 之间出现的冗余现象现在人们已经基于数据库模式的现实语义,提出了许多类型的数据依赖,函数依赖无疑是其中最重要的类型之一,它通过判定关系中的 元组在特

6、定属性上的取值是否相等来检测属性之间 是否存在依赖关系一个合法的关系必须满足所有的 完整性约束,包括所有规定的函数依赖:检查关系中的实例可以确定特定的函数依赖不 成立,但事实上我们很难通过检查所有合法实例从 而推断函数依赖的成立因此,需要建立函数依赖的 推理机制,帮助找到更多有用的依赖关系我们称所 有可以从函数 依 赖 集 合 中 推导 出的函数依赖所 组成的集合称为 的闭包 公理的三条 规则:自反律,增补律,传递律,能简单而优美地推导 出 所蕴涵的所有函数依赖,并且,已经证明,该公 理的有效性(由 出发根据该公理推导出的每个函 数依赖均在 的 闭 包 中)和 完 备 性 ( 的 闭 包 中

7、每 个函数依赖必 定 可 以 由 出 发根 据该公理推导出 来)也都是成立的分解的特性为了解决冗余,可以将一个关系分解成一些较 小的关系,每个较小的关系都包含了一个原关系属 性集合的子集,这个过程称之为“模式分解”模式分 解有两个重要的性质:无 损 连 接 性(它 能 够 通 过连接分解所得到的那些较小的关系来恢复被分解 关系的所有 实 例)和 保 持 依 赖 性(它 能 将 被 分 解关系上的所有依赖在这些较小的关系上得以保留,即不需要将这些关系进行连接就能检测是否违反了原关 系 的 约 束)分 解 为 只 能 保 证 无 损 连 接 性,但不能保 证 其 依 赖 关 系 不 发 生 变 化

8、,而 分 解 为 既能保证无损连接又能保证依赖保持性在 讨论分解的特性时,“函数依赖集合的最小覆盖”的概 念对依赖保持性有重要意义直观上,函数依赖集 合 的最小覆盖就是它的一个等价依赖集合所谓的 “最小”主要体现在:每个依赖关系都尽可能的小;左 边属性没有多余的,右边为单属性;而且其中每个依 赖关系都是必要的解决有关函数依赖分解的特性和 分解算法,函数依赖的闭包,成员籍以及最小覆盖等 问题,对消除关系数据库冗余有着关键的作用其他类型的依赖关系除了最普遍的函数依赖还有其他一些类型的依 赖关系存在,如多值依赖和连接依赖等,它们 可以帮助我们发现函数依赖不能检测到的一些冗余 问题给定一组函数依赖和多

9、值依赖能够导出一些相关的函数依赖和多值依赖由三个 公理 加上五个有关多值依赖的规则构成了完整的依赖关 系推导规则系统,其有效性和完备性成立连接依赖是对多值依赖的进一步推广,如果关 系 有一个无损连接的分解,那么 上存在连接依 赖基于连接依 赖 可 以 定 义 与 函 数 依 赖 和 多值依赖不一样,连接依赖没有完备的推理规则集 合因此,文献中提出可以不用连接依赖而只用 函数依赖来检测冗余:“如果一个关系是,而且 它的每个码都是由单属性构成,则它也是”(充 分而非必要条件)近期,学者们讨论了基于函数依赖定义范式的 弱点:函数依赖范畴内的最高级别范式 范 式 依 然是有不当冗余的在此基础上提出了一

10、种基于函 数独立性的新型范式:“子域依赖”的概念,并阐述了 它与“子集依赖”和模式依赖的区别消除“子域 依赖”后的关系模式称为函数独立的,而满足函数独 立的关系模 式 则 称 为 函 数 独 立 范 式 ()范式数据库的模式规范化需要解决的主要问题是从 关系模式的初始状态开始,不断修改模式结构,以减 少或消除冗余,同时还应充分考虑修改而引起的相关 问题给定一个关系模式,规范化理论需要确定它是 否是一个良好的设计,或者是否需要进行模式分解 “范式”可以帮助我们做出上述决定如果一个关系满 足某种范式,那么就肯定不会发生诸如插入或删除异 常此类特定的问题如果不能满足某种范式,则需要 判定其是否能通过

11、模式分解,将原关系模式转化成为 满足要求的范式,从而避免出现一些不良问题范式的定义以函数依赖为基础按其规定的严 格性从低到高的顺序为:第一范式(),第二范式(),第 三 范 式 (), 范 式 ( ),以及 第 四 范 式 (),第 五 范 式 ()等等其中比较重要的是, 等范式类型直观地说,在一个 的关系中,每一个 非 主 属性既不部分依赖于码也不传递依赖于码,而一个 满足 的关系排除了任 何 属性 对 码 的 传 递 依 赖和部分依赖 可以 确 保 只 使 用 函 数 依 赖 不 能再检测出冗余,即在函数依赖范畴下, 是能第 期郭思培 等:数据库规范化理论研究消除了因子域依赖引起的数据冗余

12、与异常对象之间的联系,是模式级别的多类型依赖关系基于垂直路径的依赖称为局部依赖或全局依赖,是对 象级别的依赖关系,表达了对象和它的成员之间的 关系,即对象内部的关系其中局部依赖讨论的是一 个对象的单个实例满足的依赖关系,而全局依赖则 指的是一个类的所有实例都满足的相互关系面向 对象模型的依赖关系的推导也有有效且完备的公理 系统,其中包含了各种依赖类型各自的推导规则,帮 助我们完成面向对象模型中依赖关系的推导面向对象数据模型是论域中用户解释的正确概念模式,而不是数据库实现或执行所以,面向对象 规范化理论是基于论域中用户解释与模式中对象反 映的解释相一致的出发点之上的解释是全局依赖 约束的集合用户

13、解释是通过用户对论域语义的理 解来指定的全局依赖约束的集合,称为用户的 约束从对象的复杂结构中得到对象的多重解释(或 理解)叫做对象解释对象的多重解释来源于它的垂 直路径,是它的路径的各种可能解释的反映,联合起 来形成对象解释关系数据库模型中,一个关系只有 一个惟一的解释,而在面向对象数据模型中一个对 象可以有多个对象解释对象的所有对象解释形成 对象完整语义概念,被称为对象模型在面向对象模 式中对象的规范化可被看作一个用户解释被对象解 释检查匹配的过程如果用户解释是通过对象模型 所表达的即当用户解释是通过推导公理方法从对象 解释中导出的时,则称这个对象处于一个范式中否 则称为非规范化对象范式提

14、供一个在论域中的用 户解释和对象结构反映的解释之间的连接当一个 对象不在一个范式中,对象的复杂结构就要被改变 或重构,直到每个对象都属于范式面向对象模型的 规范化是要使得最终设计出的面向对象模式在用户 解释与反映对象的结构解释之间没有差别推广的关系数据模型的规范化在上述传统的经典关系理论的研究基础之上, 对于新模型和新依赖关系的研究工作蓬勃展开新 的关系数据模型保持了传统关系模型的基本“关系” 结构,同时又为适应新的数据库应用而加以特定扩 充如为了存储“不精确”或“模糊”数据而开发的模 糊关系模型它以模糊函数依赖来表征其冗余问 题,并有其推导公理系统,可以证明其有效性和完备 性而在动态 模 型

15、中,不 仅 反映 了关系模式所代 表的那些实体的个别场合的情况,而且反映了它的 一系列变化基于动态约束的概念,定义了动态函数 依赖,但对于其范式定义和规范化的分解算法还未 有深入研究嵌套关系模型也是一类扩展的关系 数据模型,它允许关系中属性的值可以是关系,并允 许出现多次嵌套嵌套模型中也相应地讨论了嵌套 函数依赖和嵌套范式的定义,其理论体系完备严密 嵌套模型的发展与面向对象模型在上世纪 年代 的发展有密切关系,并且其“拆平”的规范化思想,被 后来的复杂对象模型的规范化理论所借鉴关系模型因其严格的数学理论基础,使关系数据库的规范化设计获得了空前的成功自 提 出这一理论以来,关系数据库的规范化理论

16、研究取 得了丰富的成果这些研究工作基于这样的主线来 开展:以数据依赖为核心,讨论依赖关系的各种合宜 形式,试图减少或消除不合理的依赖关系,使数据库 模式达到符合不同级别要求的范式,从而使数据库 系统冗余少,一致性高,进而获得更高的查询和检索 效率面向对象数据库规范化理论面向对象数据库规范化理论基本框架等人于 世纪 年代末期提出了面向 对象数据库规范化理论与传统的关系数据库规范 化理论的最大区别是,面向对象规范化理论主要用 于数据库的概念设计,与数据库的逻辑设计无关这 弥补了传统 数 据 库 设 计 方 法 在 概念模式方面的不 足,使其能够支持面向对象数据模型面向对象数据模型中的依赖约束是不同

17、对象类 型间的语义依赖,而语义依赖是与聚集、联合、继承等不同类型的联系相关联的根据对象之间路径的 不同类型,这些依赖有不同形式且表达了在不同的粒度级别关于不同的路径类型的对象关系基于水 平路径的依赖称为路径依赖,表征各种不同类型的对基本框架的改进文献是面向对象数据模型规范化理论的奠 基,但其中不乏可改进之处如其中的两种对象范式 生成算法共同缺陷是,当用户解释中含有冲突时,算 法将进入死循环,而且某些算法不能在多项式时间 内得到解,说明他们并不完善针对这些问题,可以 利用扩充有向图对对象生成算法进行改进扩充 有向图借鉴了超图的思想,但不同的是超图扩展的是弧的定义,而扩充有向图扩展的则是顶点的含义

18、文献中提出了规范化对象结构图和对象范式的生成算法,并给出了正确性证明和算法复杂度分析结果用与文献中相同的例子进行检验,得到的结果相同,同时,采用扩充有向图的算法时间复杂度更低围绕文献中的路径依赖定义和嵌套关系的特征,吴永辉等人提出了对象间的依赖关系的定 义应充分反映语义关系的观点,用对象模式树表示 复杂对象模式,更多借鉴了关系数据理论的分析模 式,提出了语义层面上的关系依赖概念,并给出类似 多值依赖和嵌套依赖的推导公理和对应的完整性证 明,讨论了对象范式(规范化对象模式树和规范化对 象模式森林)的生成算法,解决了复杂对象模式的规 范化问题其 中,算 法 是 规 范化过程的核心, 它由两个基 本

19、 过 程 构 成,过 程 将 半 规 范 化对象模式树分解为不可分解的半规范化对象模式 树,然 后 用 过 程 对 半 规 范 化 对 象 模 式 树删除部分冗余或传递冗余针对对象代理模式中信息冗余和模式结构复杂等问题,文献讨论了对象代理数据库模式的依 赖约束,提出了对象代理范式以描述“良好的”数据 模式,同时还提供了转换算法,为原有模式向期望模 式的转换提供了有效途径,是对象代理数据库规范 化理论的基础文献则是利用形式概念分析作 为工具,将对象代理模式表示成二维信息表,将依赖 规则映射为偏序关系的推理规则,从而形成一种一 般化的对象模式表示框架,既是对对象代理模式的 表示方法的推广,也是对对

20、象代理模式规范化理论 工具的深入发展 数据库规范化理论对象关系数据库的规范化鉴于关系数据库系统较为成熟的系统构造,以 及面向对象程序设计方法的广泛普及,在现实应用 中,比较经济的方式是将原有的关系数据库系统进 行扩展,使之在关系数据库系统的基本框架之内,尽 可能适应面向对象的特征对象关系数据模型通过 提供更加丰富的类型(包括复杂数据类型和面向对 象)扩展了关系数据模型,同时,它还具有功能强大 的数据库查询语言对象函数依赖是关系数据模型中的多值依赖的广义版本,关系数据模型中的函数依赖可以直接推 广到 对 象关 系 模 型 中,另 外,如 “完 全 对 象 函 数 依 赖”、“部分对象函数依赖”以

21、及“对象函数依赖集逻 辑蕴涵”等概念,也可以类似地通过将“函数依赖”化 为“对象函数依赖”而进行转换在范式方面则是将 关系数据理论 中 的 范 式 规 则 推 广 到 对 象关 系 模 型 中,称为对象 范式有关对 象 函 数 依 赖 的 推 导 是 由 扩 展 的 公理体系支持的原有的自反律,增广律和传 递律直接推广至对象关系模型,同时,增加覆盖律(类的 对象函数决定该类的 所 有 属性)和 等 价 律(属性集合中的类的关键字对象函数决定 ),并可以证明,扩展的 公理系统是有效且完备的关系数据模型中直至 可依据上述定义 加以推广至对象关系数据模型 数据模型随着互联网技术的快速发展与普及,基于

22、网络 的数据需求规模与日俱增,同时,其应用也更多地以在 线 的 方 式 进 行 年, (万 维 网 协 会, )推 出 了 (可 扩展标 记 语 言, ),并 将其 作为互联网数据发布、交 换 和 集 成 的 标 准 具有自描述、跨平台、易检索、快集成等优点,使其在很短的时间内就获得了广泛认同,并成为互联网通用数据格式传统的数据库管理系统是结构化数据模型,先 有模 式再有数据定义,但 是 半 结 构 化 的 模型,数据模式不规则不固定,它是先有数据定义,再从中提取模式在现存的模式规范中,和比 较 通 用考 虑 到 良 好 的 易用性、一致性和扩展性,通常采用 作为基本的 模式描 述 语 言,文

23、 献 ,给 出 了 和 “路径”的形式化定义于是, 数据库的规范化 的核心也就是构造“设计良好的” 函数依赖、多值依赖及其推理规则 数据库中文档间相互关系的体现为 上的函数依赖显然它比平面或者是嵌套关系中的 函数依赖要复杂得多考虑到 文档和 是 树型模型, 上依赖关系的描述也基于这种层次 结构,函数依赖说明“一对一”或“多对一”联系,多值对象代理数据库的规范化文献开创性地提出了对象代理模型,用对 象表示现实世界中的客观实体,通过定义代理对象 来表现对象的多侧面和动态变化特性,使得模型既 具有关系数据模型的柔软性,又具有面向对象数据 模型表现复杂信息的能力,能满足复杂数据管理的 建模需求依赖则用

24、于表达对象之间的“一对多”联系直观的,函数依赖说明对于文档树中任意两个树元组,在头部路径 约束保持范围内,若存在左部路径相等则 一定有其右部路径相等而当语义上非直接联系的 元素类型组织成树结构时,就可能出现部分函数依第 期郭思培 等:数据库规范化理论研究赖,可能导致数据冗余和操作异常传递依赖则将造成数据的重复存储,导致更新异常 中用逻辑蕴涵表达数据依赖关系给定一 个数据依赖集 和一个数据依赖,是否可以判定 任意使得 成立的 文 档 必 然 也 使 得 成 立,该问题称为数据依赖的成员籍问题被 所 逻 辑蕴涵的全部数据依赖就表示所有的约束关系,如 何找出这些约束关系被称为数据依赖的闭包问题 如果

25、忽略 上的某个数据依赖,其他的数据依赖 仍然能够完全表示 ,对应的就是数据依赖集的等 价表示问题,既覆盖问题关于 函数依赖的推 理和初步规范化模型的研究,较早见于国内学者谈 子敬等的文献,但较为全面深入的研究结 果是在文献中提出的作者在文献中构造 了一套完整的推理规则来解决上述成员籍问题、闭 包问题和覆 盖 问 题 上 的 推 理 规 则 由 自 反 规 则,传递规则,增广规则,合并规则,投影规则以及伪 传递规则等六条规则组成,文献中证明了上述六条 推理规则构成的集合是有效且完备的同时,还给出 了多项式时间内可求解的最小覆盖算法 多值依赖也存在逻辑蕴涵关系即多值 依 赖的推理规则,包括补集规则

26、、自反规则、增广规则、 传递规则、合并规则、投影规则以及伪传递规则,它 们与函数依 赖 的 推 理 规 则 一 样 具有有效性和完备 性 范式基于 各 种 函 数 依 赖,可 以定义各级别范 式如果所有的结点都是不可分解的原子值,那么该 就是属于 第 一 范 式 的;在 此 基 础 之 上, 如果 中不存在部分函数依赖,那么该 属 于 第二范式;更进一步,如果在第二范式的基 础上,如果 中还排除了传递依赖,那么该 属于第三范式 的各级范式分别说明了数据库模式的 规 范化程度,可以被看作是“设计良好的”数据模式的 各种范型,而规范化算法则是完成从初始模式到各 级范式转化的工具 的规范化的关键是模

27、式分 解分解算法以两条规则为基础的:移动规则和创建 规则算法的基本思想是根据根结点下的不同元素 类型将 分 解 几 个 子 模 式,每 个 模 式 的 属 性 包 含根结点的属性和叶子结点可以证明,存在分解至 二级范式和三级范式的无损连接算法,而且是多项 式时间内可以完成的 规范化的其他尝试纵观上述 数 据 库 规 范 化 的 过 程,其 基 本思路是沿着关系数据库规范化的框架结合 数据库的树结构进行的“复刻”理论证明及实验检测 的结果表明,上述规范化方法的确对定义“设计良好 的” 文档模式起到了明显的作用在经典的研究思路之外,国内外也由不少学者尝试用其他巧妙的方法解决规范化过程中的一些问 题

28、如文献,沿用复杂对象模式规范化中的方 法,采用层次模式分解,给出了消除冗余模式的分解 树设计算法,并且证明了该算法具有无损连接的特 性文献则是对冗余进行了深入研究,讨论了有 关排除 隐式冗余的条件,进 一 步 明 确 了 规 范 化 的 模式应具有的特性,为研究规范覆盖的产生和 模式分解的判定奠定了理论基础同样采用面向对 象方法看待 数 据 模 式 的 还 有 文 献 ,虽 然 该文献重点不 在 模 式 的 规 范 化,但 面 向 对 象 方法的强大建模能力是值得规范化研究工作的借鉴 的无环数据库模式设计是数据库理论与图论相结合而产生的,来源于关系数据库模式规范化的研究,环指的是某些属性可能存

29、在的二义性,在查询中会形成两条及以上的路径,继而形成环文献将环 问题迁移到了 数 据 库 的 模 式 结 构 讨 论 中,提 出了 模式中不同类型的环的判定问题和相关 算法,并给出了消除环的方法,解决了 模式中 可能存在的二义性缺陷,保证了模式一致性 数据库模式规范化的新进展在范式和规范化算法研究方面,文献提出 了一种基于信息理论的规范化判定准则,用于检验 当数据库的设计满足某种条件(这样的条件正是用 “范式”给出的)所得到的数据库的确是“良好的”具 体地,可以为数据库中的每一个元素依照一个约束 集合定义信息量,然后判定一些特定条件下(比如模 式满足某种范式)数据库实例和模式中的每个数据 的信

30、息量是否被最大化作为试验,将此准则用于关 系数据库规范化中 和 模式的信息量检 测,进而在 规 范 上 进 行 检 验结 果 发 现,一 个 “良好的”规范化算法设计,在其每一步中都不会降 低每个元素的信息含量这样的设计准则将规范化 标准进行合理量化,充分考虑模式的本质特征和应 用需求点,为 结 构 复 杂 多 变 的 模 式 和 今 后 其 他的复杂模型的规范化算法的构建提供了一种本质的、通用的、易操作的分析方法在此准则的框架下,文献,考虑到规范化算法在依赖保持和消除冗余之间所必须的权衡,用信息熵作为度量,分析了 数据库设计中的一种“最坏情形冗余”,指出:关系数 据模式中的 是一种冗余代价

31、最小的依赖保持 范式,同时,文中也给出了各种范式在依赖保持的条件之下能承受的最大冗余量类似的,文献, 将关系数据 库中得到的结 果 用 于 数 据 模 式, 在冗余与依赖保持的冲突中找到了一条有效的平衡 途径由于 模式复杂多变,因此有关 文档 的一致性检验问题自然成为了模式规范化中的一个必须解决的问题如何鉴别文档的不一致,如何从含 有冲突的文档中抽取出一致性数据,是保证规范化 过程正确的前提文献,分别提出了修复算法 和完整性检验算法,但可惜的是这两种精确算法都不 能在多项式时间内完成,因此只能需求其近似算法, 这也成为了一类开放性问题,有待继续深入研究义及概念格的结构形式概念分析与数据库规范化

32、的结合从上述这些研究中不难找到概念格的分析方法 与数据模型的描述及规范化之间的对应关系,这为 数据库规范化理论提供了一种新的途径概念格是 一种描述对象间关系的工具,作为一种数学工具,它 对于概念的抽象程度比直观图形更高,同时,它也具备严格的逻辑推导的条件鉴于它与模型中“关系”的概念的一致特征,基于对数据信息本质的认识和描述,不妨可将概念格的推导方法“嫁接”到数据库 模式规范化中来用形式概念分析的方法对数据库 模式的构造和规范化过程加以辅助,从对象信息的 表达和描述,对象之间联系的构建,及关联的蕴涵及 推导等方面全面应用形式概念分析的方法,通过将 概念格的相关定理和算法迁移到数据库规范化算法 中

33、这一直观的途径,试图寻求新环境中数据库规范 化的一般化 方 法目 前,对 象 代 理 模 型 的 规 范 化 中应用形式概念分析手段,借助等价类分划、偏序与 包含度等方法,为模式结构的简化和依赖规则的提 取提供理论基础和可行途径,为对象代理数据库模研究展望形式概念分析简介形式概念分析 (,) 是由德国的 教授于 世纪 年代初提出的 一种数据分析工具,用于概念的显示、排序和发现, 其核心数据结构是概念格因其能准确而简洁地 描述概念之间的层次关系,而逐步成为一种重要的 知识表示方法形式概念分析通过从形式背景建立 概念格来进行数据分析和规则提取,它从本质上描 述了对象与对象之间以及对象和特征之间的各

34、种联 系,能简明地描述概念之间存在的泛化特化关系从 表达形式上看,与格结构对应的 图可以实现 对数据的可视化,使概念格的描述更直观作为数据分析和知识处理的形式化工具,形式概念分析已经获得了广泛而成功的应用形式概念分析方法常常与其他多种数据表示方 法相结合应用将粗糙集理论中的上下近似思想引 入形式概念分析中,开发出形式概念分析中的几种 近似算子;在形式概念分析中实现粗糙集合运算,运 用这些运算能够求取函数依赖;将粗糙集理论中属 性约简和辨识矩阵的概念引入形式概念分析中,可 以实现形式背景中的冗余知识约简,将模糊集 合引入形式概念分析,定义了广义模糊属性概念格 和模糊格构造算法,而且还能从模糊格提取不确 定性规则,计 算 规 则 的 确 信 度 和 支 持 度 等将 偏 序关系应用到形式概念分析中,可以定义基于偏序 集的衍生形式背景,并利用衍生形式背景对原有的 形式背景中的概念的内涵、外延及蕴涵规则进行刻 画,为形式概念分析提供了新的知识表示方法和知 识获取方法,有利于进一步深入理解形式概念的含式规范化的进一步研究提供了形式化表示的前提今后,形式概念分析方法的推广将在数据库规范化领域中起到重要的推动作用,不但可以用于对象代 理数据库的规范化理论中,也可以应用于半结构化 数据库的规范化理论,形成简洁完备的结构统一的 数据库规范化理论框架结论传统的数据库模式规范化方法有着严格

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论