人工智能-第二章 知识表示与推理_第1页
人工智能-第二章 知识表示与推理_第2页
人工智能-第二章 知识表示与推理_第3页
人工智能-第二章 知识表示与推理_第4页
人工智能-第二章 知识表示与推理_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

知识表示与推理第二章“使计算机像人一样思考”是人工智能最早被广泛接受的定义之一。人类的思考方式体现在能够运用知识进行推理,而计算机进行知识推理的前提在于知识的表示。因此,知识表示与推理是人工智能的重要研究内容之一。本章要点知识的概念、分类和特性产生式表示法、框架表示法不确定性推理的概念和分类概率推理、主观Bayes方法可信度方法模糊推理目录Contents2.1知识表示2.1.1知识的概念2.1.2知识的分类和特性2.1.3产生式表示法2.1.4框架表示法2.1.5其他表示法2.2知识推理2.2.1不确定性推理的概念和分类2.2.2概率推理2.2.3主观Bayes方法2.2.4可信度方法2.2.5模糊推理2.1知识表示人类一切智能活动所表现出来的智能行为归根结底就是一个不断获取知识和应用知识的过程。知识是智能的基础,计算机要想具有智能,就必须像人类一样首先具有知识。但人类的知识需要用适当的模式表示出来,才能便于计算机访问和处理,这就是知识表示要解决的问题。因此,知识表示是人工智能中一个十分重要的研究课题。2.1知识表示知识的分类和特性知识的概念产生式表示法框架表示法01020304其他表示法052.1.1知识的概念“知识”是我们熟悉的名词,从接受教育开始,我们基本就在学习知识。日常生活中,人们也几乎每天都会涉及“知识”这一术语。例如,“知识改变命运”、“知识是人类进步的阶梯”、“知识就是力量”、“把我们学到的知识应用到社会实践中”等等。但究竟什么是知识,它和信息及数据之间又具有什么样的联系呢?2.1.1知识的概念知识数据信息数据是记录信息的符号,是信息的载体和具体表现形式。数据经过加工处理后,就成了信息,信息可以简单理解为数据中包含的有用的内容。一般把有关信息关联在一起所形成的信息结构称为知识。知识是人们在长期的生活及社会实践中、在科学研究及实验中积累起来的对客观世界的认识与经验,人们把实践中获得的信息关联在一起,就形成了知识。知识的概念2.1.1知识的概念全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。这就是有名的“啤酒与尿布”的故事。如果以我们日常的思维来思考,人们恐怕很难把这两样商品联系在一起,更别说放在一起进行销售。这就是通过在大量的数据背后发掘出隐藏着的可用信息,通过对信息的分析,找出“啤酒”与“尿布”之间确实存在关联关系,此时,这种关联关系就已经变成了有用的知识。举例2.1.1知识的概念数据、信息和知识是三个层次的概念。数据经过加工处理形成信息,把有关的信息关联在一起,经过处理过程就形成了知识。知识反映了客观世界中事物之间的关联关系,不同事物或者相同事物之间的不同关系形成了不同的知识。这种关联关系有多种,其中最常见的有规则、事实等。规则通常以“如果……,则……”的形式出现,反映两个事物之间的因果关系,例如:“如果大雁向南飞,则冬天就要来临了”,“如果温度低于0度,则水就会结冰”等。事实通常以“……是……”的形式出现,陈述的是一种状态或一种现象,例如:“雪是白色的”、“今天不下雨”等。2.1.2知识的分类和特性知识是人们对客观事物及其规律的认识,还包括人们利用客观规律解决实际问题的方法和策略等。不同的学者在对知识进行研究时,由于观察的角度不同形成了不同的分类方法。1.知识的分类(1)就知识的形式而言,知识分为显式知识和隐式知识。(2)就知识的作用范围而言,知识分为常识性知识和领域性知识。(3)就知识的确定性而言,知识分为确定性知识和不确定性知识。(4)就知识的确切性而言,知识分为硬的、确切描述的知识和软的、非确切描述的知识。2.1.2知识的分类和特性(5)就知识的作用及表示而言,知识分为事实性知识、过程性知识和控制性知识。(6)就人类的思维及认识方法而言,知识分为逻辑性知识和形象性知识。2.知识的特性知识是人类对客观世界认识的结晶,想要更好地理解知识,就要了解知识的特性。知识主要具有以下几个特性:2.1.2知识的分类和特性(1)相对正确性任何知识都是在一定的条件及环境下产生的,只有在这种条件及环境下才是正确的。(2)不确定性随机性引起的不确定性。模糊性引起的不确定性。经验引起的不确定性。不完全性引起的不确定性。(3)可表示性与可利用性2.1.2知识的分类和特性3.知识的表示知识的表示是对知识的一种描述,可看成是一组事物的约定,把人类知识表示成机器能处理的数据结构。简单来说,知识表示就是将人类知识形式化或者模型化。对知识进行表示的过程实际上就是把知识编码成某种数据结构的过程。目前,知识的表示有多种不同的方法,主要包括产生式表示法、框架表示法等。2.1.3产生式表示法产生式这个术语最早由美国数学家波斯特(E.Post)于1943年提出,在符号逻辑中使用。根据知识之间具有因果关联关系的逻辑,形成了“IF-THEN”的知识表示方法,也是早期专家系统常用的知识表示方法之一。目前,产生式系统已被应用于更多领域,成为人工智能中应用最多的一种知识表示方法。2.1.3产生式表示法1.产生式的基本形式产生式又称产生式规则,通常用于表示具有因果关系的知识,其基本形式是:P→Q或者IFPTHENQ其中:P又称前件,是产生式的前提或条件,用于指出该产生式是否是可用的条件;Q又称后件,是一组结论或操作,用于指出该产生式的前提条件P被满足时,得出的结论或应该执行的操作;整个产生式的含义是:如果前提P被满足,则可推出结论Q或执行Q所规定的操作。2.1.3产生式表示法2.产生式表示知识的方法(1)确定性规则性知识的表示采用产生式的基本形式来表示,即:P→Q或者IFPTHENQ例如:IF动物会飞AND会下蛋THEN该动物是鸟,就是一个产生式。2.1.3产生式表示法(2)不确定性规则性知识的表示产生式在表示不确定性知识的时候,加入置信度来表示知识不确定性的程度,用0到1之间的数来表示。不确定性规则性知识的产生式表示形式为:P→Q(置信度)或者IFPTHENQ(置信度)例如:IF下雨THEN打伞(0.6)就是一个产生式。2.1.3产生式表示法(3)确定性事实性知识的表示确定性事实性知识通常用一个三元组来表示,具体表示形式为:(对象,属性,值)或者(关系,对象1,对象2)例如:“小明年龄是9岁”表示为(XiaoMing,Age,9),

“小张和小王是朋友”表示为(Friend,Zhang,Wang)2.1.3产生式表示法(4)不确定性事实性知识的表示不确定性事实性知识通常用一个四元组来表示,具体表示形式为:(对象,属性,值,置信度)或者(关系,对象1,对象2,置信度)例如:“这座楼高约30米”表示为(Building,High,30,0.9),这里用置信度0.9表示可能性比较大;“小张和小王不大可能是朋友”表示为(Friend,Zhang,Wang,0.1),这里用置信度0.1表示可能性较小。2.1.3产生式表示法3.产生式系统产生式系统是人工智能系统中常用的一种程序结构,通常由三部分组成:规则库、综合数据库和控制系统(推理机),其基本结构如下图所示。2.1.3产生式表示法(1)规则库用于描述相应领域内知识的产生式集合,是相应领域知识(规则)的存储器。例如,在统计学生成绩S所对应的等级时,规则库中会有如下的规则:R1:IFS<60THENFailR2:IFS>=60THENPassR3:IFS>=70THENAverageR4:IFS>=80THENGoodR5:IFS>=90THENExcellent其中,R1,R2,……,R5分别是对各产生式规则所做的编号,以便于对它们的引用。2.1.3产生式表示法(2)综合数据库用来存放输入事实、中间和最后结果及问题求解过程中各种当前信息。例如,在统计学生成绩S所对应的等级时,每个学生的具体成绩S就是放在综合数据库中作为问题的初始状态,引导推理的下一步进行。(3)控制系统(推理机)控制系统又称推理机,由一组程序组成,用来控制协调规则库与数据库的运行,包括推理方式和控制策略。2.1.3产生式表示法在此,还以统计学生成绩S所对应等级的例子进行说明。比如,学生甲考了85分,即S=85,控制系统主要做以下几项工作:①匹配:学生甲考85分可以匹配上规则R2、R3和R4。此时学生甲匹配上三条规则,到底选用哪条规则进行推理的执行,此时就产生了冲突;②冲突消解:如果匹配成功的规则不止一条,则称“发生了冲突”。此时,控制系统必须调用相应的解决冲突的策略进行消解,以便从匹配的规则中选用一条执行。此处可以采用规则排序(即优先匹配到的第一条规则即为要采用的规则)进行冲突的解决,即启用如下次序:2.1.3产生式表示法IFS>=90THENExcellentIFS>=80THENGoodIFS>=70THENAverageIFS>=60THENPassIFS<60THENFail最终,选用S>=80这条规则。③执行规则:如果某一规则的右部是一个或多个结论,则把这些结论加入综合数据库中;如果是操作,则执行这些操作。因此,该例在执行规则时会将结论Good加入到综合数据库。④检查推理终止条件。检查综合数据库中是否包含了最终结论,决定是否停止系统运行。由此最终推出学生甲的成绩是Good。2.1.3产生式表示法双向推理正向推理反向推理正向推理是指从已知事实出发,通过规则求得结论,也称自底向上的方式。反向推理是指从目标(作为假设)出发,反向使用规则,求得已知事实,也称自顶向下的方式。双向推理是指推理从两个方向同时进行,既自顶向下、又自底向上进行推理,直至某个中间界面上两方向结果相符便成功结束。产生式的推理方式2.1.3产生式表示法4.产生式的特点1自然性整个推理过程由推理机完成,可以发现产生式系统求解问题的过程和人类求解问题的思维过程很相似。2模块性产生式规则之间没有相互的直接作用,它们之间只能通过综合数据库发生间接联系,而不能相互调用,这种模块化结构使得在规则库中的每条规则都可以自由增删和修改。3清晰性产生式规则有固定的格式,每一条产生式规则都由前提和结论组成,而且每一部分所含的知识量都比较少,这既便于对规则进行设计,又易于对规则库中知识的一致性及完整性进行检测。2.1.4框架表示法框架表示法是以框架理论为基础的一种结构化知识表示方法。1975年,美国麻省理工学院明斯基(MarvinLeeMinsky)提出了框架理论,作为理解视觉、自然语言对话以及其他复杂行为的一种基础,受到了人工智能界的广泛重视。1.框架的一般结构框架是一种描述所论对象(一个事物、事件或概念)属性的数据结构。一个框架由框架名和若干个被称为“槽”的结构组成,每个槽又根据实际情况划分为若干个“侧面”。每个槽设有一个槽名,一个槽用于描述所论对象某一方面的属性。一个侧面用于描述相应属性的一个方面。槽和侧面所具有的属性值分别称为槽值和侧面值。2.1.4框架表示法下面是框架的一般表示形式:<框架名>槽名1:侧面名11侧面值111,侧面值112,……

侧面名1m侧面值1m1,侧面值1m2,…槽名2:侧面名21侧面值111,侧面值112,……

侧面名2m侧面值2m1,侧面值2m2,……槽名n:侧面名n1侧面值n11,侧面值n12,……

侧面名nm侧面值nm1,侧面值nm2,…约束:约束条件1…

约束条件n2.1.4框架表示法2.框架的应用举例【例2-1】大学生框架结构。【案例分析】框架名:<大学生>姓名:单位(姓、名)年龄:单位(岁)性别:范围(男、女),缺省:男学院:单位(学院)专业:单位(专业)班级:单位(班)住址:<学生住址框架>电话:移动电话单位(数字)住宅电话单位(数字)2.1.4框架表示法当把具体的信息填入槽或侧面后,就得到相应框架的一个事例框架。例如,把某一大学生的具体信息填入“大学生”框架的各个槽中,就能得到该框架的一个事例框架如下:框架名:<大学生-1>姓名:王明年龄:19性别:男学院:信息工程学院专业:大数据专业班级:01班住址:<adr-1>电话:139111111110371111111112.1.4框架表示法【例2-2】将下列一则地震消息用框架表示:“某年某月某日,某地发生6.0级地震,若以膨胀注水孕震模式为标准,则三项地震前兆中的波速比为0.45,水氡含量为0.43,地形改变为0.60。”【案例分析】“地震框架”也可以是“自然灾害事件框架”的子框架,“地震框架”中的值也可以是一个子框架,如其中的槽值“地形改变”就是一个子框架。2.1.4框架表示法2.1.4框架表示法3.框架表示法的特点1结构性框架表示最突出的特点就是便于表达结构性知识,能够将知识的内部结构关系及知识间的联系表示出来,这是产生式知识表示方法不具备的。框架表示法的知识单位是框架,而框架是由槽组成,槽又分为若干个侧面,这样就可以把知识的内部结构显式地表示出来。2继承性框架表示法通过使槽值为另一个框架的名字来实现框架间的联系,建立起表示复杂知识的框架网络。在框架网络中,下层框架可以继承上层框架的槽值,也可以进行补充和修改,这样不仅减少了知识的冗余,而且较好地保证了知识的一致性。3自然性框架表示法体现了人们在观察事物时的思维活动,当遇到新事物时,通过从记忆中调用类似事物的框架,并根据实际情况对其中某些细节进行修改、补充,就形成了对新事物的认识,这与人们的认识活动是一致的。2.1.5其他表示法1.一阶谓词逻辑表示法一阶谓词逻辑表示法以数理逻辑为基础,是一种最早应用于人工智能的表示方法,在人工智能发展中具有重要的作用。在将知识进行谓词逻辑表示前我们需要知晓以下知识点:(1)命题:非真即假的陈述句。分为简单命题和复合命题,简单命题又称原子命题。在命题逻辑中,简单命题不可再分,复合命题通过逻辑联结词联结而成。常见的逻辑联结词有否定联结词¬、合取联结词∧、析取联结词∨、蕴含联结词→、等价联结词↔等。2.1.5其他表示法(2)谓词逻辑:将命题进一步分解研究的逻辑称为谓词逻辑。在谓词逻辑中,谓词可表示为P(x1,x2,x3,…,xn),其中P是谓词符号,表示个体属性、状态或关系;x1,x2,x3,…,xn称为谓词的参量或项,通常表示个体对象。(3)量词:表示数量的词。为了刻画谓词和个体之间的关系,在谓词逻辑中引入了两个量词:全称量词∀、存在量词∃。在使用谓词逻辑表示知识的时候,一般步骤如下:(1)定义谓词及个体,确定每个谓词及个体的确切含义;(2)根据所要表达的事物或概念,为每个谓词中的变元赋予特定的值;(3)根据所要表达的知识的语义,用适当的联接符号将各个谓词联接起来,形成谓词公式。2.1.5其他表示法【例2-3】用谓词公式表示以下知识:1)张三是一名计算机系的学生,但他不喜欢编程。2)大多数篮球运动员都很高。【案例分析】第一步,定义谓词:Computer(x):x是计算机系的学生。Like(x,y):x喜欢y。Basketball_plaer(x):x是篮球运动员。Tall(x):x个子很高。定义个体:张三(ZhangSan)、编程(Programming)第二步,将这些个体代入谓词中,得到Computer(ZhangSan)、¬Like(ZhangSan,Programming)第三步,根据语义,用逻辑联接词将它们联接起来,就得到了相应的谓词公式:1)Computer(ZhangSan)∧¬Like(ZhangSan,Programming)2)∃x(Basketball_plaer(x)→Tall(x))2.1.5其他表示法2.语义网络表示法语义网络是一种表达能力强而且灵活的知识表示方法,它是通过概念及其语义关系来表达知识的一种网络图。一个语义网络是一个由一些有向图表示的三元组(节点1,弧,节点2)连接而成的。一个三元组称为一个基本网元,当把多个基本网元用相应的语义联系在一起时,就构成了一个语义网络。例如,“苹果是一种水果”的基本语义网络如下图所示。2.1.5其他表示法语义网络可以描述事物之间多种复杂的语义关系。在实际使用中,人们可根据自己的实际需要进行定义。下面列举几个经常使用的语义关系(联系)。(1)实例关系表示类与其实例(个体)之间的关系,即一个事物是另一个事物的具体例子。通常用“ISA”或“is-a”来标识,表示“是一个”。例如,“小明是一个大学生”的语义网络如下图所示。2.1.5其他表示法(2)分类(从属、泛化)关系分类关系描述事物之间的类属关系,即一个事物是另一个事物的一个成员,体现的是子类与父类之间的关系。通常用“AKO”或“a-kind-of”来标识,表示“是一种”。例如,部分动物分类关系的语义网络如下图所示。2.1.5其他表示法(3)聚类关系聚类关系有时也称组装关系,表示下层概念节点是上层概念节点的一个方面或一部分。与分类关系最主要的区别在于聚类关系一般不具备属性的继承性。通常用“Partof”或“a-part-of”来标识,表示“是一部分”。(4)属性关系属性关系用于表示个体、属性和属性取值之间的联系,通常用有向弧表示属性,用弧所指向的节点表示属性的值。2.1.5其他表示法例如,描述“桌子”的语义网络如下图所示,其中就包含了实例关系、分类关系、聚类关系和属性关系四种基本语义关系。2.1.5其他表示法(5)集合与成员关系集合与成员关系表示“……是……的成员”,通常用“AMF”或“a-member-of”来标识。例如,“小明是学生会成员”的语义网络如下图所示。(6)所属关系所属关系表示“……具有……”,通常用“Have”来标识。例如,“大象有长鼻子”、“狗有尾巴”、“鸟有翅膀”等,其中“鸟有翅膀”的语义网络如下图所示。2.1.5其他表示法3.过程表示法框架、语义网络等知识表示方法,是对知识和事实的一种静止的表达方法,这类知识表示方法称为陈述性知识表示方法。与陈述性知识表示方法不同,过程性知识表示法是将知识及如何使用这些知识的控制策略隐式地表述为一个求解问题的过程。过程表示法强调的是对知识的利用,过程所给出的是事物的一些客观规律,表达的是如何求解问题,它把与问题有关的知识以及如何运用这些知识求解问题的控制策略都表述为一个或多个问题的求解过程。2.1.5其他表示法过程表示法用程序来表示知识,从程序求解问题的效率来看,过程表示法的效率要比陈述式表示法高的多。由于控制性质已嵌入程序中,控制系统容易实现。但过程表示法不易修改和添加新知识,当对某一过程进行修改时,又可能影响到其他过程,给系统带来不便。因此,过程表示维护困难。2.1.5其他表示法4.面向对象表示法面向对象编程语言的普及,如C++、Java、Python等,表明面向对象是表示知识的有效和有用的方式。近年来,在智能系统的设计和构造中,人们开始使用面向对象的思想、方法和开发技术,并在知识表示、知识库的组成与管理、专家系统的设计等方面取得了快速的进展。面向对象的知识表示方法是按照面向对象的程序设计原则组成的一种混合知识表示形式,它以对象为中心,把对象的属性、动态行为、领域知识和处理方法等有关知识封装在表达对象的结构中。2.2知识推理通过知识表示方法,可以把知识用某种模式表示出来存储到计算机中去。但是为了使计算机具有智能,仅仅使计算机拥有知识是不够的,还必须让它具有思维能力,即能运用知识进行问题求解的能力。推理是求解问题的一种重要方法,因此,对知识推理方法的研究成为人工智能的一个重要的研究课题。人类的智能活动有多种思维方式,相应地也有多种推理方式。若按推理时所用知识的确定性来划分,推理可分为确定性推理与不确定性推理。在人类的知识和思维行为中,确定性只能是相对的,而不确定性才是绝对的。人工智能要解决这些不确定性问题,就必须采用不确定性的知识表示和推理方法。因此本节主要讨论的是不确定性推理。2.2知识推理概率推理不确定性推理的概念和分类主观Bayes方法可信度方法01020304模糊推理052.2.1不确定性推理的概念和分类现实生活中,经常会遇到这样的情况:今天有可能下雨、这场球赛甲队可能会取胜、小王是个高个子、小红和小丽是好朋友、“秃子悖论”等,这里的“可能”、“高个子”、“好朋友”、“秃子”等,都说明了现实世界中的事物以及事物之间关系的复杂性,导致人们对它们的认识往往是不精确、不完全的,具有一定的不确定性。2.2.1不确定性推理的概念和分类1.不确定性推理的概念所谓推理就是从已知事实出发,运用相关的知识(或规则)逐步推出结论或者证明某个假设成立或不成立的思维过程。其中,已知事实和知识(规则)是构成推理的两个基本要素。已知事实是推理过程的出发点及推理中使用的知识,我们把它称为证据;而知识(规则)是推理得以向前推进,并逐步达到最终目标的根据。不确定性推理是指那些建立在不确定性知识和证据的基础上的推理,包括不完备、不精确知识的推理,模糊知识的推理,非单调性推理等。2.2.1不确定性推理的概念和分类不确定性推理过程实际上就是一种从不确定的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却又合理或近乎合理的结论的思维过程。通过不确定性推理,使计算机对人类思维的模拟更接近于人类的真实思维过程。2.不确定性推理的分类不确定性推理方法控制方法模型方法数值方法基于概率理论的推理方法基于模糊理论的推理方法非数值方法2.2.1不确定性推理的概念和分类3.不确定性推理的基本问题(1)不确定性的表示与度量知识的不确定性证据的不确定性(2)不确定性的匹配不确定性的匹配算法阈值的选择(3)组合证据不确定性的算法(4)不确定性的传递算法(5)结论不确定性的合成2.2.1不确定性推理的概念和分类以上问题就是不确定性推理中需要考虑的一些基本问题,但需要指出的是,并非每种不确定性推理方法都必须包括这些内容。在实际应用时,不同的不确定性推理方法所包括的内容可以不同,对这些问题的处理方法也可以不同,应具体问题具体分析。2.2.2概率推理概率是我们生活中不可替代的组件,例如,早上上班时,在公交车上,旁边有乘客打喷嚏或咳嗽,那么你有可能感冒,但你也可能不会感冒,这具有一定的不确定性。而这样的不确定性在现实问题中是普遍存在的。概率推理也称Bayes推理,是以Bayes法则为基础的不确定性推理方法,具有处理“事物发生与否不能确定”这样的不确定性的能力,在现实生活中有着广泛的应用。2.2.2概率推理假设P(A)表示随机事件A发生的概率,P(B|A)表示在事件A发生的条件下事件B发生的概率。那么由右图可以得出:

由此可以得出:

2.2.2概率推理假设要乘坐三种不同的交通方式去上班,A1表示开车,A2表示乘坐公交车,A3表示乘坐地铁,B表示上班迟到这个事件,如右图所示,那么上班迟到的概率P(B)就可以表示为:当i的取值为n时,得到:

2.2.2概率推理再结合下面的式子:

可以得出:

把P(B)代入上式中,最终得到:

2.2.2概率推理由于事件A是由若干个互斥事件(即两个事件交集为空)组成的一个整体,在具体求解问题时通常只求解其中的一个事件,例如,针对上班迟到的例子,通常情况下,可能求的是在迟到的前提下开车的概率有多大,或者坐公交车的概率有多大,所以继续改写上式即可得到如下公式。这便是Bayes公式(又称贝叶斯公式),其中P(Aj)称为先验概率,P(B|Aj)称为条件概率,P(Aj|B)称为后验概率。

2.2.2概率推理【例2-4】已知男性中有5%患有色盲症,女性中有0.25%患有色盲症,现从中随机抽取一个人发现其患有色盲症,问此人是男性的概率(假设男女数量相等)。【案例分析】假设集合A1表示男性,集合A2表示女性,集合B表示色盲症患者,那么由已知条件可知,P(A1)=0.5,P(A2)=0.5,P(B|A1)=0.05,P(B|A2)=0.0025,接下来求解P(A1|B)。将已知条件代入Bayes公式可得:

2.2.2概率推理所谓概率推理就是求出在证据E下结论H发生的概率,即计算P(H|E)的值,若一个证据E支持多个假设H1,H2,…,Hn,即计算P(Hi|E)的值,这些均可直接代入Bayes公式计算得到,在此不再赘述。接下来我们看一个概率推理的例子。2.2.2概率推理【例2-5】设H1,H2,H3为三个结论,E是支持这些结论的证据,且已知:P(H1)=0.4P(H2)=0.3P(H3)=0.4P(E|H1)=0.4P(E|H2)=0.5P(E|H3)=0.3求:P(H1|E),P(H2|E)和P(H3|E)的值。【案例分析】根据题意n=3,代入Bayes公式分别得到:

由于证据E的出现,H1、H3成立的可能性有不同程度的下降,而H2成立的可能性略有增加。2.2.3主观Bayes方法主观Bayes方法是由杜达(R.O.Duda)等人于1976年在概率论的基础上,通过对Bayes公式的修正而形成的一种不确定性推理模型,并成功地将其应用在地矿勘探专家系统PROSPECTOR中。1.知识不确定性的表示在主观Bayes方法中,知识是用产生式规则表示的,具体形式为:IFETHEN(LS,LN)H(P(H))其中:P(H)是结论H的先验概率,由领域专家根据经验给出;LS称为充分性度量,表示E对H的支持程度,取值范围为[0,+∞),定义如下:

2.2.3主观Bayes方法

(LS,LN)用来表示该知识的知识强度。在实际系统中,LS和LN的值均是由领域专家根据经验给出的,而不是通过计算出来的。2.2.3主观Bayes方法2.证据不确定性的表示在主观Bayes方法中,证据的不确定性用概率表示。证据通常可分为全证据和部分证据。全证据就是所有的证据,即所有可能的证据和假设,它们组成证据E;部分证据S就是我们所知道的E的一部分,这一部分证据也可称为观察。全证据的可信度依赖于部分证据,表示为P(E|S)。如果知道所有的证据,则E=S,且有P(E|S)=P(E)。其中P(E)就是证据E的先验似然性,P(E|S)是已知全证据E中部分知识S后对E的信任,为E的后验似然性。2.2.3主观Bayes方法

P(2.2.3主观Bayes方法4.不确定性的传递算法主观Bayes方法推理的任务就是根据E的概率P(E)及LS、LN的值,把H的先验概率P(H)更新为后验概率。(1)证据E肯定为真时,即P(E)=P(E|S)=1,把先验概率P(H)更新为后验概率P(H|E)的计算公式为:P(

2.2.3主观Bayes方法

P(

2.2.3主观Bayes方法结果表明,证据E1的存在,使H1的概率由0.05变成0.345,增加了将近7倍;证据E2的存在对H2没有影响。2)当证据E1、E2不存在时,P(

结果表明,证据E1不存在对H1没有影响;证据E2不存在,使H2的概率由0.4变成0.001,削减了400倍。2.2.3主观Bayes方法5.结论不确定性的合成算法假设有n条知识都支持同一结论H,且这些知识的前提条件分别是n个相互独立的证据E1,E2,…,En,而每个证据所对应的观察又分别是S1,S2,…,Sn,那么可用下面的公式求出O(H|S1,S2,…,Sn)和P(H|S1,S2,…,Sn):P(

2.2.3主观Bayes方法其中,O(x)是几率函数,它与概率函数P(x)的关系如下:P(

2.2.3主观Bayes方法【例2-7】设有如下规则:R1:IFE1THEN(20,1)H(0.03)R2:IFE2THEN(200,1)H(0.03)已知证据E1、E2必然发生,求H的后验概率。【案例分析】1)依据H的先验概率P(H)=0.03可以求出O(H)的先验几率:P(

2)依据R1,可以得出:

2.2.3主观Bayes方法3)依据R2,可以得出:P(4)那么

因此,由于E1、E2的必然发生,使H的概率由0.03增到0.992。2.2.3主观Bayes方法主观Bayes方法是在概率论的基础上发展起来的,具有较完善的理论基础,且知识的输入转化为对LS和LN的赋值,这就避免大量的数据统计工作,是一种比较实用且较灵活的不确定性推理方法。但是,它在要求专家给出LS和LN的同时,还要求给出H的先验概率P(H),而且要求事件间相互独立,这也比较困难,从而也就限制了它的应用。P(2.2.4可信度方法可信度方法是在1975年由美国斯坦福大学数学家肖特里菲(E.H.Shortliffe)等人在确定性理论的基础上,结合概率论等提出的一种不确定性推理方法。尽管该方法未建立在严格的理论推导基础上,但该方法直观、简单,且效果好。目前,许多专家系统都是基于这一方法建造起来的。所谓可信度是指根据经验对一个事物或现象为真的相信程度,其带有较大的主观性和经验性,准确性难以把握。C-F模型是基于可信度表示的不确定性推理的基本方法,其它可信度方法都是在此基础上逐渐发展起来的。因此,对可信度方法的介绍主要以此模型为例。2.2.4可信度方法1.知识不确定性的表示在C-F模型中,知识用产生式规则表示:IFETHENH(CF(H,E))其中:CF(H,E)称为可信度因子或规则强度,反映前提条件与结论的联系强度,描述的是知识的静态强度。CF(H,E)的取值范围为[-1,1]。若由于相应证据的出现增加结论H为真的可信度,则CF(H,E)>0,证据的出现越是支持H为真,就使CF(H,E)的值越大;反之,CF(H,E)<0,证据的出现越是支持H为假,CF(H,E)的值就越小;若证据的出现与否与H无关,则CF(H,E)=0。2.2.4可信度方法2.证据不确定性的表示证据的不确定性也是用可信度因子表示的,即CF(E)。CF(E)描述的是证据的动态强度,表示证据E当前的不确定性程度。CF(E)的取值范围也为[-1,1]。对于初始证据,若所有观察S能肯定它为真,则CF(E)=1;若肯定它为假,则CF(E)=-1;若以某种程度为真,则0<CF(E)<1;若以某种程度为假,则-1<CF(E)<0;若未获得任何相关的观察,则CF(E)=0。2.2.4可信度方法

2.2.4可信度方法4.不确定性的传递算法C-F模型中的不确定性推理过程为从不确定的初始证据出发,通过运用相关的不确定性知识,最终推出结论并求出结论的可信度值。结论H的可信度由下式计算:

其中,当CF(E)<0时,CF(H)=0;当CF(E)=1时,CF(H)=CF(H,E)。2.2.4可信度方法5.结论不确定性的合成算法若有多条不同知识推出了相同的结论,但可信度不同,则可用合成算法求出综合可信度。设有如下规则:IFE1THENH(CF(H,E1))IFE2THENH(CF(H,E2))(1)分别对每一条规则求出CF(H):

2.2.4可信度方法(2)求出E1与E2对H的综合影响所形成的可信度:

2.2.4可信度方法【例2-8】设有如下规则:R1:IFE1THENH(0.8)R2:IFE2THENH(0.6)R3:IFE3THENH(-0.5)R4:IFE4AND(E5ORE6)THENE1(0.7)已知:CF(E2)=0.8,CF(E3)=0.5,CF(E4)=0.5,CF(E5)=0.6,CF(E6)=0.8,求:CF(H)的值。【案例分析】1)依据R4,可以得出:2.2.4可信度方法2)依据R1,可以得出:

2.2.4可信度方法3)依据R2,可以得出:

4)依据R3,可以得出:

5)根据结论不确定性的合成算法得出:2.2.4可信度方法

因此,所求的综合可信度CF(H)=0.5008。2.2.4可信度方法可信度方法比较简单、直观,易于掌握和使用,已成功应用于推理链较短、概率计算精度要求不高的专家系统中。但当推理长度较长时,由可信度的不精确估计而产生的积累误差会很大,所以该方法不适合长推理链的情况。2.2.5模糊推理关于秃子悖论,有人说,一般人平均有5000根头发,以此为界,规定5000根以下为秃子,以上为不秃。如果这样规定,那么4999根算不算秃?有5000根头发的人,如果他在梳洗打扮时,不小心梳落了一根,是否当即成为一名“秃子”了?这样显然太荒唐了!这里的主要问题就在于“秃子”这个概念是模糊的,没有一个清晰的界限将“秃”与“不秃”分开。与“秃子”相似的模糊概念还有很多,如沙堆、雨的大小、风的强弱、年龄的大小、个子的高低等。这种在生活中常见的模糊概念,用传统的数学方法处理时,往往会出现问题。那么,这类问题究竟要如何解决呢?模糊理论及模糊逻辑是解决这一矛盾的主要工具之一。2.2.5模糊推理1.模糊理论的提出1965年扎德等人从集合论的角度出发,对事物存在的模糊性进行了大量的研究,提出了模糊集、隶属函数、模糊推理等重要概念,开创了模糊理论这一新兴的数学分支,从而对模糊性的定量描述与处理提供了一种新途径。在模糊集中定义了一个关键概念“隶属度”,即一个元素隶属于一个集合的程度,并且规定,当一个元素完全属于一个集合时,它的隶属度为1,反之为0;若在某种程度上隶属于一个集合,则它的隶属度为0~1之间的某个值。2.2.5模糊推理2.模糊集合及其运算处理某一特定问题时,要把议题限定在一个特定的范围内,这个范围就是相应问题的论域。论域中的每个对象称为元素,论域中具有某种相同属性的确定的、可以彼此区别的元素的全体称为集合。所谓模糊集合是指在论域U中的模糊集F用一个在区间[0,1]上取值的隶属函数μF来表示,即:μF:U→[0,1]其中,μF称为F的隶属函数,μF(u)称为u对F的隶属度,u是U中的元素。2.2.5模糊推理模糊集合常用的表示方法有三种:扎德表示法、序对表示法、向量表示法,这里用一个例子进行说明。假设论域U={x1,x2,x3,x4}为一个四人集合,X上的模糊集合A表示“漂亮”,隶属度分别为0.6、0.8、1、0.5,那么(1)扎德表示法表示为:A=0.6/x1+0.8/x2+1/x3+0.5/x4扎德表示法采用“隶属度/元素”的形式来记,这里的“+”号并不是求和,“/”号也不是求商,仅仅是一种记法,是模糊数学创始人扎德给出的一种记法。当某一项的隶属度为0时,可以省略不写。2.2.5模糊推理(2)序对表示法表示为:A={(x1,0.6),(x2,0.8),(x3,1),(x4,0.5)}序对表示法适合比较少的元素,一目了然,比较清晰,但对于元素比较多的模糊集合,扎德表示法更简便。(3)向量表示法表示为:A={0.6,0.8,1,0.5}向量表示法是给论域中的元素规定了一个表达顺序,在向量表示法中,隶属度为0的项不能省略,因为一旦省略,隶属度和元素的一一对应关系就会发生改变。从该例中可以得出,x3是四人当中最漂亮的。2.2.5模糊推理模糊集上的运算主要有相等、包含、并、交、补等,接下来我们一一来看。(1)模糊集合相等两个模糊集合相等,当且仅当它们的隶属函数在论域U上恒等,即A=B,当且仅当∀x∈U,μA(x)=μB(x)。(2)模糊集合的包含模糊集合A包含于模糊集合B中,当且仅当对于论域U上所有元素x,恒有μA(x)≤μB(x)2.2.5模糊推理(3)模糊集合的并、交、补集

【例2-9】设论域U={x1,x2,x3,x4}为一个四人集合,U上的模糊集合A表示“高个子”:A={(x1,0.8},(x2,0.6),(x3,1),(x4,0.4)},模糊集合B表示“胖子”:B={(x1,0.6),(x2,0.5),(x3,0.3),(x4,0.4)}。分别求模糊集合“高或胖”、“又高又胖”、“个子不高”。2.2.5模糊推理【案例分析】模糊集合“高或胖”为:

模糊集合“又高又胖”为:

模糊集合“个子不高”为:

其中:“∨”表示取最大,“∧”表示取最小。2.2.5模糊推理(4)模糊集合的积设A、B是论域U和论域V上的模糊集合,那么

【例2-10】设U={1,2,3,4},V={1,2,3},A、B分别是论域U、V上的模糊集合,其中A=0.8/1+0.7/2+0.5/3+0.2/4,B=1/1+0.6/2+0.3/3,求A×B。【案例分析】A×B=0.8/(1,1)+0.6/(1,2)+0.3/(1,3)+0.7/(2,1)+0.6/(2,2)+0.3/(2,3)+0.5/(3,1)+0.5/(3,2)+0.3/(3,3)+0.2/(4,1)+0.2/(4,2)+0.2/(4,3)2.2.5模糊推理(5)模糊集合的有界和设A、B是论域U和论域V上的模糊集合,那么

3.模糊关系及其运算(1)模糊关系设U、V是论域,从U到V上的模糊关系R是指U×V,由隶属函数μR(x)刻画,μR(x,y)代表有序对<x,y>具有关系R的程度。2.2.5模糊推理比如,设论域U=V={1,2,3,4},模糊关系R大的多,μ(x,y)表示x比y大的程度,如下表:模糊关系R通常用矩阵表示,将上表转化为矩阵表示如下,R就叫做模糊关系矩阵。

2.2.5模糊推理(2)模糊关系的合成假设R与S分别是U×V与V×W上的两个模糊关系,则R与S的合成是指从U到W的一个模糊关系,记作R∘S,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论