第一章绪论第二章粒计算常见模型第三章第一节哲学基础课件_第1页
第一章绪论第二章粒计算常见模型第三章第一节哲学基础课件_第2页
第一章绪论第二章粒计算常见模型第三章第一节哲学基础课件_第3页
第一章绪论第二章粒计算常见模型第三章第一节哲学基础课件_第4页
第一章绪论第二章粒计算常见模型第三章第一节哲学基础课件_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

粒计算及其应用梁俊奇数学与信息科学学院粒计算及其应用梁俊奇1教学内容、教学时数第一章绪论4学时第二章粒计算的常见模型2学时第三章粗糙集模型28学时第一节各种集合理论的哲学基础2学时

第二节经典集合与等价关系2学时

第三节Pawlak.Z粗糙集模型8学时

第四节常见广义粗糙集模型8学时

第五节简单应用—决策分析6学时教学内容、教学时数第一章绪论2第一章绪论内容提要

一、软计算(SoftComputing,SC)

二、粒计算(GranularComputing,GrC)第一章绪论内容提要30.引言:确定性和不确定性秃头悖论问题;精确数学是描述确定性规律的;概率论是揭示随机现象的统计规律性,是对精确数学的突破,但不排斥概率统计模型可能转化为精确数学模型去处理;模糊集和粗糙集是揭示模糊现象的亦此亦彼的规律性,是对精确数学的突破,但不排斥模糊学模型可能转化为概率统计模型甚至精确数学模型去处理;随机性和模糊性是不确定性的两个方面,确定值可以被看作是不确定性的特例。0.引言:确定性和不确定性秃头悖论问题;4不确定性:随机性模糊性不完全性不稳定性不一致性不确定性的魅力!随机性和模糊性的关联性不确定性:随机性不确定性的魅力!随机性和模糊性的关联性5对不确定性现象的研究,并不一定非要分别从随机性和模糊性入手去认识,也不一定非要去区分随机体现在那里,模糊在哪里。对不确定性现象的研究,并不一定非要分别从随机性6视觉的不确定性视觉的不确定性7视觉的错觉视觉的错觉8认知的不确定性认知的不确定性9模式识别(人脸识别)的不确定性身份识别表情识别性别识别年龄识别性格识别人种识别

.......模式识别(人脸识别)的不确定性身份识别10手语(Signlanguage)识别:内容识别图形识别身份识别年龄识别风格识别

.......手语(Signlanguage)识别:内容识别11文字识别:内容识别写字人身份识别性别识别年龄识别风格(性格)识别字体识别

.......文字识别:内容识别12声音识别:内容识别说话人身份识别性别识别年龄识别性格识别字体识别

.......语调(情感)识别音乐识别方言识别语种识别

.......声音识别:内容识别语调(情感)识别13纹理识别:静态纹理指纹脸纹声纹皮、石、木、布纹草地、森林、海滩

.......动态纹理海浪喷泉烟雾云彩瀑布

.......纹理识别:静态纹理动态纹理14思维的不确定性

思维有精确的一面,更有不确定的一面。人类习惯于用自然语言进行思维,思维的结果往往是可能如何、大概如何等定性的结论。人类还擅长通过联想的、直觉的、创造的形象思维来思考,很少象计算机一样做精确的数学运算或者逻辑推理,但是这并不妨碍人类具有发达的、灵活的智能,并不妨碍人类具有发达的、灵活的模式识别能力。思维的不确定性思维有精确的一面,更有不确定的一面。人15自然界中的不确定现象随机模糊混沌分形复杂网络自然界中的不确定现象随机16不确定性的基础科学问题

不确定性知识的形式化表达问题,即

不确定性知识的表示问题。

不确定性知识的最好表示,就是使用自然语言表示!要研究自然语言基元的定性定量转换模型,给出不确定性转换模型的形式化方法。不确定性的基础科学问题不确定性知识的形式化表达问题,即17研究人类认知活动的切入层次人脑亚细胞的化学、电学层次人脑的神经构造层次自然语言层次数学语言层次符号语言层次脑科学神经科学不确定性人工智能数学传统人工智能研究人类认知活动的切入层次人脑亚细胞的化学、电学层次人脑的神18基本理念:人脑的思维基本上不是纯数学的;自然语言具有不可替代性;自然语言中的基元是语言值,它对应的概念,是人类思维的基本细胞。数据和概念之间的转换是不确定性人工智能研究的基石。基本理念:人脑的思维基本上不是纯数学的;19不确定性的度量——熵热力学熵熵增加原理玻尔兹曼熵分子运动的无序程度和混乱程度仙农熵拓扑熵………云模型中的熵和超熵不确定性的度量——熵热力学熵熵增加原理20一、软计算(SoftComputing,SC)

1.软计算的概念

传统计算(硬计算)的主要特征是严格、确定和精确。但是硬计算并不适合处理现实生活中的许多问题,例如驾驶汽车、秃子问题。而软计算通过对不确定、不精确及不完全真值的容错以取得低代价的解决方案和鲁棒性。一、软计算(SoftComputing,SC)

1.软计212.软计算的特点

(1)不需要建立问题本身的精确数学或逻辑模型,而是直接对输入数据进行处理得出结果;

(2)更适用于解决哪些传统AI技术难以有效地处理、甚至无法处理的问题;

(3)只有数值数据可利用时可以用神经网络;

(4)处理具有模糊性的知识,可以使用模糊逻辑;

(5)从多个组合中选优,可以使用遗传算法。2.软计算的特点

(1)不需要建立问题本身的精确数学或22第一章绪论第二章粒计算常见模型第三章第一节哲学基础ppt课件23二、粒计算(granularcomputing,GrC)1.粒计算的基本概念

信息粒广泛存在于我们的现实生中.是对现实的一种抽象,信息粒化是人类处理和存储信息的一种反映。粒计算对人类的问题求解非常重要.它通过把复杂问题抽象、划分从而转化为若干较为简单的问题.有助于我们更好的分析和解决问题。

粒计算是一种看待客观世界的世界观和方法论. 二、粒计算(granularcomputing,GrC)124粒计算的基本概念主要有粒子、粒层和粒结构.粒子:粒子是构成粒计算模型的最基本元素,是粒计算模型的原语,没有十分确切的定义.粒子具有双重身份,一个粒子的元素可以是粒子,一个粒子也可以是另外一个粒子的元素.而衡量粒子“大小”的概念是粒度,一般来讲,对粒子进行“量化”时用粒度来反映粒化的程度.现实世界中,粒子无处不在,如一座办公大楼,这座大楼是由很多楼层组成的,每个楼层又包含了很多房间,每个房间又被分成小的办公区域。相对于整个社区环境,这座大楼是一个整体,是一个粒子,它的外墙及外形设计就是它的外在属性。相对于更小的组成部分,这座大楼是复杂的分层结构,它的内部组成和划分就是它的内在属性。粒计算的基本概念主要有粒子、粒层和粒结构.25粒层:按照某个实际需求的粒化准则得到的所有粒子的全体构成一个粒层,是对问题空间的一种抽象化描述.根据某种关系或算子,问题空间产生相应的粒子.同一层的粒子内部往往具有相同的某种性质或功能.由于粒化的程度不同,导致同一问题空间会产生不同的粒层.粒层的内部结构是指在该粒层上的各个粒子组成的论域的结构,即粒子之间的相互关系.在问题求解中,选择最合适的粒层对于问题求解尤为关键,因为在不同粒层求解同一问题的复杂度往往不同.在高一级粒层上的粒子能够分解成为下一级粒层上的多个粒子(增加一些属性),在低一级粒层上的多个粒子可以合并成高一级粒层上的粒子(忽略一些属性).粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化.粒层:按照某个实际需求的粒化准则得到的所有粒子的全体构成一个26

粒结构:一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,它反应了人们从不同角度、不同侧面来观察问题、理解问题、求解问题.所有粒层之间的相互联系构成一个关系结构,称为粒结构.粒结构给出了一个系统或者问题的结构化描述.粒结构:一个粒化准则对应一个粒层,不同的粒化准则对应多个27粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化。粒结构,一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,粒层之间的相互联系构成一个关系结构,称为粒结构。在一般的粒计算理论中,把同一粒层的粒子看成一个集合,通常并不考虑粒子之间的结构关系,而在我们的商空间理论中,粒层中的粒子间具有结构关系,因此我们所谈的粒结构,通常既指粒层间的结构关系,同时又指粒层中的结构。粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒282.粒计算的基本问题根据粒计算的上述模型与概念,可以看到,粒计算中存在2个基本问题:粒化和基于粒化的计算。即如何构造这个模型,以及根据这个模型的计算。粒化,是问题空间的一个划分过程,它可以简单理解为在给定粒化准则下(如等价关系)得到一个粒层的过程,是粒计算的基础,通过粒化我们可以得到问题空间的层次间与层次内部的结构。在同一或者不同的粒化准则下均可得到多个粒层,形成多层次的网络结构。粒计算通过访问粒结构求解问题,包括在层次结构中自上而下、或者自下而上2个方向的交互,以及在同一层次内部的移动。即不同粒层上粒子之间的转换与推理,以及同一粒层上粒子之间相互交互,形成所谓的多粒度计算。2.粒计算的基本问题根据粒计算的上述模型与概念,可以看到,29第一章作业1.举例说明不确定性现象的客观存在性。2.如何表示不确定性知识?表示不确定知识的基本理念有哪些?第一章作业1.举例说明不确定性现象的客观存在性。30第一章绪论第二章粒计算常见模型第三章第一节哲学基础ppt课件31第二章粒计算的常见模型内容提要词计算粗糙集商空间云计算第二章粒计算的常见模型内容提要32粒计算的主要模型粒计算模型大体分为2大类:一类以处理不确定性为主要目标,如以模糊处理为基础的计算模型(Fuzzyset,词计算),以粗糙集为基础的计算模型(Roughset);另一类则以多粒度计算为目标,如商空间理论。粒计算的主要模型粒计算模型大体分为2大类:33这2类模型的侧重点有所不同,前者在粒化过程中,侧重于计算对象的不确定性处理,Zadel认为,在人类推理与概念形成中,其粒度几乎都是模糊的,因此他认为以模糊概念为基础的词计算,是粒计算的主要组成部分。以Pawlak为首的波兰学者提出的粗糙集理论,其基础也是基于“思维的计算,即关于含糊、不清晰概念的近似推理”。而多粒度计算的思想则来源于Hobbs的如下思想“人类问题求解的基本特征之一,就是具有从不同的粒度上观察世界,并很容易地从一个抽象层次转换到其它层次的能力,即分层次地处理它们”。因此多粒度计算的目的是为了降低处理复杂问题的复杂性。这2类模型的侧重点有所不同,前者在粒化过程中,侧重于计算34词计算模型词计算(computingwithwords)是用词语代替数进行计算及推理的方法,它基于模糊集合.词计算模型词计算(computingwithwords)35

高标准的精确表达,普遍存在于数学、化学、工程学和另外一些“硬”科学之中,而不精确表达却普遍存在于社会、心理、政治、历史、哲学、语言、人类学、文学、文艺及相关的领域中.针对复杂且非明晰定义的现象,无法用精确的数学方法来描述,但可以用一些程度词语,如不很可能、十分不可能、极不可能等,来对某些模糊概念进行修饰.尽管普通的精确方法(如数学)在某些科学领域应用相当广泛,也一直尝试着应用到人文学科中,但人们在长期的实践中已经清楚地认识到精确的方法应用到人文学科有很大的局限性.面对巨大而又复杂的人文学科系统,区别于传统方法的新方法——模糊计算方法被L.A.Zadeh提出.高标准的精确表达,普遍存在于数学、化学36粗糙集模型

一个对象属于某个集合的程度随着属性粒度的不同而不同,为了更好地刻画集合边界的模糊性,波兰学者Z.Pawlakg在20世纪80年代提出了粗糙集理论,其本质思想是利用不可分辨关系(等价关系)来建立论域的一个划分,得到不区分的等价类,即不同属性粒度下的概念粒,从而建立一个近似空间(由不同大小的概念粒形成).粗糙集模型一个对象属于某个集合的程度随着37

在近似空间上,用2个精确的集合(上近似集和下近似集)来逼近一个边界模糊的集合.如果近似空间的粒度较粗,被近似的集合的边界域较宽,而如果近似空间的粒度较细,被近似集合的边界域较窄.

等价关系的泛化是推广粗糙集模型的一种重要手段.所谓等价关系的泛化问题实质上就是将满足等价关系的3个条件(自反、对称、传递)根据实际问题进行组合,得到不同的二元关系,再根据这些二元关系得到不同的模型.在近似空间上,用2个精确的集合(上近似38商空间模型

张钹和张铃在研究问题求解时,提出了商空间理论,他们指出“人类智能的公认特点,就是人们能从极不相同的粒度上观察和分析同一问题.人们不仅能在不同粒度的世界上进行问题求解,而且能够很快地从一个粒度世界跳到另一个粒度的世界,往返自如,毫无困难.这种处理不同世界的能力,正是人类问题求解的强有力的表现”.商空间模型张钹和张铃在研究问题求解时,提39云模型定性概念和定量实现之间的转化是人类认知过程中的重要环节,一方面是通过自然语言表达的定性知识,另一方面是客观世界中存在的定量实现。30度以上,热;23,24,25度等,舒服。云模型作为一个定性定量转换的认知模型具有重要意义。云模型定性概念和定量实现之间的转化是人类认知过程中的重要环节40云模型的定义设U是一个用数值表示的定量论域,C是U上的定性概念。若定量值(x属于U)是定性概念C的一次随机实现,x对C的确定度是稳定倾向的随机数,则x在论域U上的分布称为云,每一个x称为一个云滴。云发生器云模型的定义设U是一个用数值表示的定量论域,C是U上的定性概41粒计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究,主要用于处理不确定的、模糊的、不完整的和海量的信息.粗略地讲,一方面它是模糊信息粒度理论、粗糙集理论、商空间理论、区间计算等的超集,另一方面是粒数学的子集.具体地讲,凡是在分析问题和求解问题中,应用了分组、分类和聚类手段的一切理论与方法均属于粒计算的范畴.对它的研究,引起了人们的关注,已成为人工智能领域新近研究的热点方向之一.

粒计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度42第二章作业粒计算的主要模型有哪些?第二章作业粒计算的主要模型有哪些?43第一章绪论第二章粒计算常见模型第三章第一节哲学基础ppt课件44

第三章

粗糙集模型内容提要

第一节各种集合理论的哲学基础

第二节经典集合与等价关系

第三节Pawlak.Z粗糙集模型

第四节常见广义粗糙集模型第五节简单应用—决策分析

第三章粗糙集模型45面对日益增长的数据库,将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述?面对日益增长的数据库,将如何从这些浩瀚的数据中找出有用的知识46第一节各种集合理论的哲学基础内容提要

一、普通集合的哲学基础

二、模糊集合的哲学基础三、可拓集合的哲学基础四、反演集合的哲学基础五、粗集合的哲学基础第一节各种集合理论的哲学基础内容提要47一、普通集合的哲学基础普通集合的哲学基础是亚里士多德(Aristotle’s)提出的形式逻辑的矛盾律和排中律,即:“A不能既是B又不是B”和“A是B或不是B”。一、普通集合的哲学基础普通集合的哲学基础是亚里士多德(Ari48二、模糊集合的哲学基础模糊集合的哲学基础是:形式逻辑矛盾律+模糊中介边界(排中律的替代品)。二、模糊集合的哲学基础模糊集合的哲学基础是:形式逻辑矛盾律+49三、可拓集合的哲学基础:可拓集合的哲学基础是:形式逻辑矛盾律+临界+可拓域。三、可拓集合的哲学基础:可拓集合的哲学基础是:形式逻辑矛盾律50四、反演集合的哲学基础

反演集合就是在充分肯定以形式逻辑矛盾为基础的普通集合的同时,把普通集合(或)所对应的另一半(或)找回来。因为它们原本就是一对相互依存、同生同灭的孪生兄弟,就像作用力与反作用力一样不可分割。现在找回来,并探讨其之间的关系,这就是反演集合理论的实质。四、反演集合的哲学基础反演集合就是在充分51五、粗集的哲学基础

粗集的哲学基础应该是形式逻辑矛盾律+“边界”。五、粗集的哲学基础粗集的哲学基础应该是形式逻辑矛盾律52第三章第一节作业简述各种集合的哲学基础分别是什么?第三章第一节作业简述各种集合的哲学基础分别是什么?53第一章绪论第二章粒计算常见模型第三章第一节哲学基础ppt课件54第二节经典集合与等价关系第二节经典集合与等价关系55第一章绪论第二章粒计算常见模型第三章第一节哲学基础ppt课件56第三节Pawlak.Z粗糙集模型第三节Pawlak.Z粗糙集模型57一、粗糙集的概念(一)粗糙集概述在很多实际系统中均不同程度地存在着不确定性因素,采集到的数据常常包含着噪声,不精确甚至不完整.粗糙集理论是继概率论,模糊集,证据理论之后的又一个处理不确定性的数学工具。(二)相关概念知识:(举例说明)一、粗糙集的概念58A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,按照颜色的不同,我们能够把这堆积木分成R1={红,黄,兰}三个大类,那么所有红颜色的积木构成集合X1={x1,x2,x6},

黄颜色的积木构成集合X2={x3,x4},

兰颜色的积木构成集合X3={x5,x7,x8}。按照颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类),那么我们就说颜色属性就是一种知识在这个例子中我们不难看到,一种对集合A的划分就对应着关于A中元素的一个知识

A={x1,x2,x3,x4,x5,x6,x7,x8},每个59假如还有其他的属性,比如还有形状R2={三角,方块,圆形},大小R3={大,中,小},这样加上R1属性对A构成的划分分别为:

A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}}(颜色分类)

A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}}(形状分类)

A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}}(大小分类)

上面这些所有的分类合在一起就形成了一个基本的知识库。

假如还有其他的属性,比如还有形状R2={三角,方块,圆形},60除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}这样的概念以外还可以表达例如

大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},

大三角{x1,x2,x5}∩{x1,x2}={x1,x2},

兰色的小的圆形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},

兰色的或者中的积木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而类似这样的概念可以通过求交运算得到,比如X1与Y1的交就表示红色的三角形。除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角61所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一起就构成了一个知识系统记为R=R1∩R2∩R3,它所决定的所有知识是A/R={{x1,x2},{x3},{x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。

所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(62近似下近似集是在那些所有的包含于X的知识库中的集合中求并得到的,而上近似则是将那些包含X的知识库中的集合求并得到的。近似63一般的,我们可以用右面的图来表示上、下近似的概念。

这其中蓝色曲线围的区域是X的区域,紫色曲线围的部分是内部参考消息,是下近似,红色曲线围的内部部分就是上近似集。其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。

整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。一般的,我们可以用64

1.关于粗糙集的用途粗糙集是用来处理不确定信息不确定性按性质划分:1)随机性.例:明天可能会下雨2)模糊性:模糊性就是一个命题中所出现的某些言词概念上无明确的内涵和外延。模糊现象是指边界不清楚,在质上没有确定性的含义,在量上没有确切界限的事物的一种客观属性,是事物之间的差异存在一定的中间过渡的结果.例:这孩子是个聪明的孩子1.关于粗糙集的用途653)不完全性:例:在炒股票中.4)不一致性:相同原因产生不一样的结果5)时变性:随着时间会改变的事物3)不完全性:66一些基本术语论域:数学定义是:U={U1,U2,…,Um}解释:所要处理的所有对象(在数据库中即是所有数据)的总和例:例如,对于货票集合来说,其任意子集称为一个概念。根据运输距离对货票进行分类,可以形成不同的概念:概念1:运距在500公里(含500公里)以下的货票;概念2:运距在500公里-1500公里(含1500公里)间的货票;概念3:运距在1500公里以上的货票。对于上例来说U就是货票集合,它由价格分成了3个概念即类(U1,U2,U3)粗糙集理论建立在这样一个前提上:即所考虑的论域中的每一个对象都包含某种信息(数据和知识)。一些基本术语粗糙67条件属性集:数学定义是:P={P1,P2,…,Pm}解释:就是对象的各种属性总和(也就是数据库中的字段)Pm就是这个对象的一个属性基本集(基本粒度):定义:所有不可区分的对象形成的集合解释:可区分(可分辨):如果Ui≠Uj就称这两个对象在其条件P下是可区分的(对于两个不同的对象至少有一个属性是不同的)否则即为不可区分条件属性集:68例对于上表来说,U中有四个对象(概念),而现在条件集合中只有一个属性,对于U1和U2来说,它们的p不同所以可以通过p来区分,即u1,u2在p下可区分;而U2和U3虽然是不同的对象但是在P下却是相同的,即在p下不可区分,就成为不可区分例对于上表来说,U中有四个对象(概念),而现在条件集合中只69粗糙集:一个集合若恰好等于基本集的任意并集称为一个清晰(crisp)集(精确集),否则称为粗糙(rough)集(不精确集)。解释:都可区分的是清晰集,有不可区分的对象为粗糙集主要特点:以不完全信息或知识去处理一些不分明现象的能力,或依据观察、度量到的某些不精确的结果而进行分类数据的能力.粗糙集体现了集合中元素间的不可区分性.主要优势:它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其它不确定性问题的理论有很强的互补性.粗糙集:70第一章绪论第二章粒计算常见模型第三章第一节哲学基础ppt课件71属性约简粗糙集是处理模糊数据的有力工具,而要达到这样的目的需要有两个重要的步骤来进行处理—属性约简和值约简,属性约简是对粗糙集合(那些不能区分的集合)进行纵向的简化,把不必要的属性去掉,即去掉这些属性也不会影响对象的区分能力,这样便于以后进一步的简约处理属性约简72关于属性约简的一些基本概念1.由可区分的概念引申出来:如果在整个信息系统S(即带所有P的所有U)上所有Ui都互不相等,那么就称为这个S在P下是可分辨的,一般记作ind(P)解释:这个标号说明是在P这个条件集合下是可分辨的,而且另一个P’下可能不可分辨,所以在对于一个S是否分辨取决于它的属性集合,因此ind(P)只需一个参数P即可2.如果去掉P中的某个属性集合Pi,系统S仍然是可以分辨的,那么P中的Pi是可以简约的,一般记作ind(P-Pi)=ind(P)关于属性约简的一些基本概念73

3.如果P中的任何一条属性都是不可简约的,那么就称P是独立的解释:P是独立的说明P中的任何一个属性都是必不可少的,它独立的表达一个系统分类的特征。属性约简的算法分析:

初始状态:所有数据已存入数据库(以下为模拟数据)uabcdE1100112100013000004110105110226210223.如果P74现在设e为决策属性,其他为条件属性,即对于不同的对象,不同的条件属性的组合会对决策属性有怎么样的影响?算法思路:基本假设是能影响属性e的只有a,b,c,d四个(即系统在a,b,c,d,e下可区分)基本原则是如果所有的条件属性都是一样的两个对象其决策属性也应该是一样的(因为否则说明这个对象还有能影响其决策属性的条件属性未被列入表内)那么如果去掉某个条件属性,对于任意两个不同的决策属性其他属性都不同,那么这个属性冗余,否则这个属性必需(即前面的概念2)现在设e为决策属性,其他为条件属性,即对于不同的对象,不同的75实例如表一所示.描述了一些人的教育程度以及是否找到了较好工作,旨在说明两者之间的关系.

表1教育程度与是否找到好工作的关系姓名教育程度是否找到了好工作王治高中否马丽高中是李得小学否刘保大学是赵凯博士是如表一所示.描述了一些人的教育程度以及是否找到了较好工作76

设O表示找到了好工作的人的集合,则

O={马丽,刘保,赵凯},设I表示属性“教育程度”所构成的一个等效关系根据教育程度的不同,该论域被分割为四个等效类:{王治,马丽},{李得},{刘保},{赵凯}.王治和马丽在同一个等效类中,他们都为高中文化程度,是不可分辨的.设O表示找到了好工作的人的集合,则77集合O的下逼近(即正区)为I3(O)=POS(O)={刘保,赵凯}集合O的负区为NEG(O)={李得}集合O的边界区为BND(O)={王治,马丽}集合O的上逼近为I3(O)=POS(O)+BND(O)={刘保,赵凯,王治,马丽}根据表1,可以归纳出下面几条规则,揭示了教育程度与是否能找到好工作之间的关

RULE1:IF(教育程度=大学)OR(教育程度=博士)THEN(可以找到好工作)

RULE2:IF(教育程度=小学)THEN(找不到好工作)

RULE3:IF(教育程度=高中)THEN(可能找到好工作)从这个简单的例子中,我们还可以体会到粗糙集理论在数据分析,寻找规律方面的作用

集合O的下逼近(即正区)为I3(O)=PO78二、粗糙集的特点粗糙集方法的简单实用性是令人惊奇的,它能在创立后的不长时间内得到迅速应用是因为具有以下特点:(1)它能处理各种数据,包括不完整(incomplete)的数据以及拥有众多变量的数据;(2)它能处理数据的不精确性和模棱两可(ambiguity),包括确定性和非确定性的情况;

(3)它能求得知识的最小表达(reduct)和知识的各种不同颗粒(granularity)层次;

(4)它能从数据中揭示出概念简单,易于操作的模式(pattern);二、粗糙集的特点(1)它79(5)它能产生精确而又易于检查和证实的规则,特别适于智能控制中规则的自动生成.特点综述:粗糙集理论作为一种处理不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备的信息有效的工具。一方面得益于他的数学基础成熟、不需要先验知识;另一方面在于它的易用性。由于粗糙集理论创建的目的和研究的出发点就是直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,因此是一种天然的数据挖掘或者知识发现方法,它与基于概率论的数据挖掘方法、基于模糊理论的数据挖掘方法和基于证据理论的数据挖掘方法等其他处理不确定性问题理论的方法相比较,最显著的区别是它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其他不确定性问题的理论有很强的互补性(特别是模糊理论)。(5)它能产生精确而又易于检查和证实的规则,特别适于智能80粗糙集理论所处理的问题

•不确定或不精确知识的表达;

•经验学习并从经验中获取知识;

•不一致信息的分析;

•根据不确定,不完整的知识进行推理;

•在保留信息的前提下进行数据化简;

•近似模式分类;

•识别并评估数据之间的依赖关系粗糙集理论所处理的问题81

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论