版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章专家系统的解释机制
本章学习目的:
1.掌握ES解释机制的功能、作用;2.掌握ES解释机制的实现原理及常用方法。
主要内容包括:
1.专家系统解释机制的基本概念;2.专家系统解释机制实现中常用的方法;3.专家系统解释机制的实现。5.1专家系统解释机制的基本概念1.ES解释的定义
•ES的解释功能是ES区别于传统程序系统的主要特征之一。
•ES的解释主要定义为:一种合理性说明,在系统KB调试、ES测试及运行过程中,对问题求解、知识应用状况等作静态与动态的合理性说明,以解决ES求解的可理解性、透明性及可信赖性。2.ES解释机制的作用
根据定义,其将在四个方面起作用:
•ES生成中对KB的调试;•ES原型测试;•用户使用中的运行解释;•起某种程度上的“教师”作用。
(1)作用1:ES生成中对KB的调试,该作用主要涉及
•检索知识库中已有内容;•跟踪系统运行;•提供出错信息。
(2)作用2:进行ES原理测试的辅助记录与显示
•记录、显示KB中知识的使用情况;•记录、显示上下文中各种参数、中间结果的演变。
(3)作用3:用户使用中的运行解释
•解释问题求解的过程(策略);•解释知识在推理过程中的应用情况;•解释推理过程和结论的合理性。
(4)作用4:起“教师”的作用3.专家系统解释机制的解释类型
ES的解释机制有以下几种类型:
(1)动态
•Why解释:说明系统或某一求解动作为什么要这样做。•How解释:说明系统或某一求解动作是怎样达到当前目标的。•What解释:说明系统当前正在做什么。
(2)静态
•系统求解范围解释:
说明系统求解的边界及出错信息。
•知识内容的解释:说明KB中知识形式、内容应用等信息。•求解策略的解释:对问题求解范围内的问题求解给出一个静态的说明。4.解释机制实现应考虑的问题
我们在设计ES解释机制的时候,应考虑以下几方面的问题:
(1)建立适当的人机接口。(2)建立对应于由推理机生成的推理路径,动态解释类型与所选取的静态解释内容间的关联,并记录相应的推理路径及信息。(3)建立易于用户接受的解释信息的表达方式,即解释的叙述问题便于用户理解、接受。
(4)建立并组织好所有的静态解释信息,它是实现动态运行过程解释的前提。解释信息可以是:•直接由表层知识,如KB中规则的描述规定;•对应于规则的对其的深层描述;•直接的深层知识(含因果、属性、联系等)。5.解释机制的一般体系结构或实现用户人机界面解释信息的表达、叙述控制推理路径及动态信息对应于KB及问题求解组织机构的解释空间构造上下文推理机5.2专家系统解释机制实现的常用方法
专家系统常用的解释方法包括:
•唱片/预制文本解释法•追踪解释法•策略解释法•自动程序员法1.唱片/预制文本解释法
(1)方法的基本思想
这是一种最简单也是最早的解释方法,通过预先估计所有可解的问题,将每个问题的解释语句存入系统中,这些被存入的语句可随时调出和显示。
当用户使用ES时,“放”出来的唱片句子用来帮助用户:
•回答系统正在做什么;
•跟踪系统运行;
•显示出错信息。
(2)唱片程序(句子)与解释空间的关联问题
•问题求解策略的每一个步骤:一段唱片程序;•问题求解的每个动作:一段唱片程序,说明系统正在做什么,通过显示以说明或提前说明一个动作部分要做的具体工作:—系统调用了哪些函数;—函数的各种参数;—所作的假设;—所运用的推理方式。•结合已有上下文内容的状态变量(对应于唱片程序的不同片段)设置。
(3)唱片解释法的特点与不足
•唱片解释法主要用于回答系统正在做什么;•方法简单明了;•但知识工程师要事先估计所有可解的问题,并对每一问题提供解答;•唱片程序是预制的,运用过程不是生成的,而是“放出”的;•唱片和知识库相互独立修改,不便于维护;•不具备解释的智能性。2.追踪解释法
(1)基本思想
通过重新显示系统问题求解过程的推理路径和通过重新显示系统问题求解过程中知识库中知识的使用情况,来解释系统是怎样求解问题直至得出结论的。•这种方法从系统运行的角度来说明系统的动作;•解释基于系统运行中所产生的动态信息,而唱片法则是基于预制唱片的静态信息。
(2)设计追踪法应解决的关键问题
Ⅰ.解释中基本操作的确定:
•基本操作是解释的基本层次;
•在这一层次上系统的求解行为将得到具体解释;
•在基于不同知识表示模式的ES中,基本操作建议为知识表示中最基本的、独立的数据单元,为框架系统中的框架,产生式系统中的规则。
Ⅱ.对应于基本操作(或所选定的解释层次)的动态信息纪录程序:
•用于记录系统问题求解过程中选定层次上的行为,这些行为包括:—各中间状态下知识的匹配情况;
—各状态的转化情况;
•纪录结果用于系统行为的跟踪。
Ⅲ.设计一个与系统控制结构相对应的/相反的解释控制结构:
•控制对记录信息结果的行为理解;•对于“How”解释,采用“自顶向下”的动态信息树(推理路径)的搜索;•对于“Why”解释,采用动态信息树(推理路经及动态信息)的搜索;
Ⅳ.设计一个接口程序:
根据记录内容和解释控制结构把跟踪结果翻译成用户能理解的解释语句。
(3)追踪解释法特点
•解释基于动态信息;•解释过程简单;•同唱片法相比,能保证问题求解过程与解释代码的一致性;•但把记录内容翻译成用户易理解的解释难以做到,甚至做不到,原因在于:—程序代码(动态信息)与用户领域专用术语间的区别,自然语言接口难以实现;—只能偏重“How”解释,而不能过多过深地进行动作合理化的“Why”解释。3.策略解释法
(1)基本思想
•对应于两级ES结构的ES解释机制;•问题的求解策略由元知识定义;•对元知识库的推理构造了求解任务序列;•所有解释基于元推理产生;•具体求解操作由领域ES完成。
(2)策略解释法实现中应注意的关键问题
•其借用追踪法的基本思想,所以应在元级、领域级注意前后问题;•建立元级、领域级解释间的关联。(3)策略解释法的特点
•具备追踪法的特点;•解释层次抽象度高,解释起点高;•但问题求解策略知识必须能显示抽象出来。4.自动程序员方法
前面几种方法,对“Why”解释的支持性很弱,因为“Why”解释涉及到解释行为的合理性问题,而合理性解释相关于问题求解表层知识之外的深层知识,自动程序员方法是为解决这一问题而提出的。
(1)基本思想
•利用一个自动程序员(程序生成器)来产生ES;•当程序生成器从抽象目标利用领域知识求精产生具体的执行程序时,其保留求精过程的推理轨迹;•这种推理轨迹并不是执行程序用于问题求解所必需的知识,它是用于论证系统动作的合理性。
(2)自动程序员法的结构•ES生成器:产生待求任务的执行程序(其含ES的主要功能);•其中“领域模型”和“领域原则”是领域专门知识,为生成器产生执行程序提供知识;
ES生成器领域模型领域原则英语产生器用户求精结构ES
•求精机构:是生成器产生执行程序过程中所留下的轨迹,它含有产生过程中间轨迹和最终的轨迹程序;•领域模型:是问题领域的描述性事实,包括实体间的因果关系、分类层次等;
•领域原则:
—是领域的问题求解方法和启发式过程,是关于问题求解的过程性知识。—它告诉生成器具体工作的做法;—一条领域原则可看作一种抽象的过程模式;—利用领域模型中的事实填充这种抽象过程可产生具体的过程和操作;
领域模型领域原则生成执行程序
•英语产生器:利用“求精结构”,“领域模型”、“领域原则”构造解释语句,在不同层次上回答“Why”。
(3)特点•能给出“Why解释”的合理性解释,克服因深层知识的缺陷而导致的“Why”解释的薄弱;•但自动求精过程不易实现;•自动程序生成是难点;•利用这种解释方法来构造英语解释语句存在障碍。第六章专家系统的知识获取
本章学习目的:
1.了解ES知识获取的手段、方法、过程等;2.了解机器学习的方法、途径及其在ES知识获取中的地位、作用及应用;3.了解知识获取辅助工具的原理、结构及建立方法。
本章主要讲述以下内容:
1.知识获取的一般性问题;2.知识/学习文本的生成:从知识源确定到概念化;3.知识的形式化过程;4.知识库的建立;5.知识库的调试与维护。6.1知识获取的一般性问题
ES用于领域问题求解必须依赖于其知识库的容量、质量,而知识获取就在于建筑出上述要求的知识库。1.知识获取的概念
•指从人类专家处获取领域知识,并将其转化成知识库的过程;•知识获取是ES建造的关键环节,亦是建造ES的“瓶颈”;•知识工程师在知识获取过程中协调领域专家进行领域知识的形式化,并在知识获取中起关键作用。2.知识获取的过程
知识获取一般经历以下五个阶段:
•知识源的确定•概念化阶段文本形成;
•形式化阶段;
•知识库建立阶段;
•知识库测试、精炼与维护阶段。
(1)知识源的确定
•首先由知识工程师根据待解领域问题选择一个(组)专家;•请教这些专家并学习领域有关的概念、问题等;•制定(与专家一起)系统的设计目标;•确定ES所需的知识源,如:—专家过去的问题求解实例;—教科书中的知识;—隐含在专家大脑中的问题求解经验;
(2)知识文本形成或概念化阶段针对各种知识源,与专家配合,确定系统目标内的主要概念、关系等的描述。
•确定数据类型——知识类型;•分析系统预定的输入输出;•系统目标的分解(子问题的划分);•每个子目标的约束;•领域问题的求解策略;•可使用的局部假设;•问题领域中各实体的相关性;•问题领域中各实体间的因果关系;•问题领域中各实体间的层次、网状结构等;•形成知识文本(以自然跟踪、图形表示的上述内容);•当采用机器学习自动获取知识时,形成学习文本。
(3)形式化阶段
•选择合适的知识表示模式(数据结构)把概念化阶段得出的知识文本表示出来;•或利用学习文本,调出相应的机器学习算法,形成相应的合适的知识表示模式。
(4)知识库建立阶段
•利用知识库编辑机制把由知识文本转化而来的形式化知识输入,以建立知识库;•或利用形式化知识自动录入机制,把经机器学习生成的知识输入到知识库中;
(5)知识库的测试、精炼、维护阶段
•检查、测试知识库的推理路径可达性(用实例);•消除知识冗余——精炼;•消除知识的二义性——精炼;•对新增加知识的测试、精炼——维护。领域问题学习文本形式化知识知识库(2)自动型知识获取(3)混合型知识获取结合两种模型的知识获取。3.知识获取的类型从上述知识获取的过程,我们可得出知识获取的几种类型:
(1)交互式知识获取领域问题知识文本形式化知识知识库环境知识库编辑知识库推理机交互式系统知识获取环境学习元知识库性能元学习系统知识获取4.关于知识获取的交互系统与学习系统的一般结构6.2常用的机器学习方法
如前所述,利用“学习元”可将“学习文本”自动地转换成“形式化知识”。“学习元”的构造取决于:—各种不同的学习算法;—学习策略;—知识表示方法;—应用领域;学习元的构造需使用“机器学习”技术。1.基本概念
所谓机器学习,就是要使计算机能够模拟人的学习行为,自动地通过学习获取知识和技能,不断改善技能,实现自我完善。2.机器学习的分类
目前常用的分类方法:
机械式学习指导式学习示例学习类比学习解释学习基于演绎的学习基于归纳的学习归纳学习分析学习连接学习遗传算法(1)按学习方法分类(2)按推理方式分类(3)按综合属性分类3.机械学习(RoteLearning)
(1)基本概念
这是一种最简单、最原始的学习方法,它通过记忆和评价外部环境所提供的信息达到学习的目的,学习系统(学习元)要做的工作是把经过评价取得的信息存储到知识库,求解问题时就从知识库中检索出相应的知识直接用来求解问题。•机械学习就是记忆;•学习元所做的工作仅仅是存储新的知识;•需要时检索出来即可。
例如:某个计算的输入是:(x1,x2,……,xn),计算后输出是:(y1,y2,……,yn),
如果经评价后得知该结果正确,则把联想对:[(x1,x2,……,xn),(y1,y2,……,yn)]存入知识库,当以后需要做同样的计算时,只要从知识库中检索出来即可,而不需要重新计算了。
(2)利弊
机械式学习实质上是用存储空间来换取处理时间,虽然节省了计算时间,但却多占了存储空间。当因学习而积累的知识逐渐增多时,占用的空间就会越来越大,检索的效率也就随之下降。
2.归纳学习(LearningbyInduction)
归纳学习是应用归纳推理进行学习的一类学习方法,按其有无教师指导可分为示例学习和观察与发现学习。
•环境提供的信息是关于实际例子的输入与输出描述;•输入数据、输出结果规定了一个特殊的知识原则(特殊知识);•学习元从这些特殊知识中假设和归纳出一般性知识。
(1)归纳推理
归纳是指从个别到一般,从部分到整体的一类推论行为。归纳推理是应用归纳方法进行的推理。常用的归纳推理方法有:
枚举归纳联想归纳类比归纳Ⅰ.枚举归纳设a1,a2,
…是某类事物A中的具体事物,若已知a1,a2,
…,an
都有属性P,并且没有发生反例,当n足够大时,就可得出“A中所有事物都有属性P”的结论。这是一种从个别事例归纳出一般性知识的方法,“A中所有事物都有属性P”
是通过归纳得到的新知识。
例如:设有如下已知事例:张三是足球运动员,他的体格健壮。李四是足球运动员,他的体格健壮。……赵十是足球运动员,他的体格健壮。
当事例足够多时,就可归纳出一个一般性知识:
凡是足球运动员,他的体格一定健壮。
考虑到可能会出现反例,可给这条知识增加一个可信度:凡是足球运动员,他的体格一定健壮(0.95)。Ⅱ.联想归纳
若已知两个事物a与b有n个属性相同或相似,即:
a具有属性P1,b也有属性P1
a具有属性P2,b也有属性P2
。。。
a具有属性Pn,b也有属性Pn
并且还发现,a具有属性Pn+1,则当n足够大时,可归纳出:
b也有属性Pn+1
这一新知识。
例如:通过观察发现,两个孪生兄弟都有相同的身高、体重、相貌,都喜欢唱歌、跳舞,且喜欢吃相同的食物,而且发现其中一人喜欢画山水画,虽然我们没有看到另一个也喜欢画山水画,但我们很容易联想到另一个“也喜欢画山水画”,这就是联想归纳。
由于联想归纳是一种主观不充分置信推理,因而经归纳得出的结论可能会有错误。
(2)示例学习(LearningbyExamples)示例学习是通过从环境中取得若干与某概念有关的例子,经归纳得出一般性概念的一种学习方法。
在这种学习方法中,外部环境(教师)提供的是一组例子(正例和反例),这些例子实际上是一组特殊的知识,每一个例子表达了仅适用于该例子的知识,示例学习就是要从这些特殊知识中归纳出适合于更大范围的一般性知识。
例如:我们用一批动物作为示例,并且告诉学习系统哪一个动物是“马”,哪一个动物不是,当示例足够多时,学习系统就能概括出关于“马”的概念模型,使自己能识别“马”。这一学习过程就是示例学习。
Ⅰ.示例学习的学习模型
其学习过程是:首先从示例空间(环境)中选择合适的训练示例,然后经过解释归纳出一般性的知识,最后再从示例空间中选择更多的示例对它进行验证,直到得到可实用的知识为止。
Ⅱ.常用的归纳算法——
强化/弱化算法:—用于归纳产生式规则:学习元的输出为规则;—强化指使规则前提取值范围加大:扩大范围;—弱化指使规则前提取值范围变小:缩小范围;
验证示例空间搜索解释形成知识知识库找一个规则模式用实例匹配判断规则前提范围大?弱化前提强化前提获取一般性规则Stop判断规则前提范围小?YYNN3.类比学习(LearningbyAnalogy)•指在几个对象(实体)间检测相似性;•根据一方对象(实体)所具有的事实和知识,推出相似对象所具有的事实与知识;•环境提供相关领域知识(与当前所学习的问题间有相似性);•学习元找出相似性并得出相似准则/知识。
(1)类比推理类比学习的基础是类比推理。
所谓类比推理是指:
由新情况与记忆中的已知情况在某些方面相似,从而推出它们在其它方面也相似。
类比推理是在两个相似域之间进行的:
•一个是已经认识的域,它包括过去曾经解决过且与当前待解决问题类似的问题以及相关知识,称为源域,记做S;
•另一个是当前尚未完全认识的域,它是遇到的新问题,称为目标域,记做T;
类比推理的目的是:从S中选出与当前问题最近似的问题及其求解方法来求解当前问题,或者建立起目标域中已有命题间的联系,形成新知识。
(2)属性类比学习
属性类比学习是根据两个相似事物的属性实现类比学习的。
我们以1979年温斯顿开发的一个系统为例进行说明。在该系统中:
•原域和目标域都是用框架表示的,分别称为源框架和目标框架;
•框架的槽用于表示事物的属性;
其学习的过程是把源框架中的某些槽值传递到目标框架的相应槽中去。传递分两步进行:
Ⅰ.从源框架中选择若干槽作为候选槽选择方法是相继使用如下启发式规则:
•选择那些具有极端槽值的槽作为候选槽;•选择那些已经被确认为“重要槽”的槽作为候选槽;•选择那些与源框架相似的框架中不具有的槽作为候选槽。如,S为源框架,S’是任一与S相似的框架,如果在S中有某些槽,但S’中不具有这些槽,则就选择这些槽作为候选槽;•选择那些相似框架中不具有这种槽值的槽作为候选槽。如,S为源框架,S’是任一与S相似的框架,如果在S中有某槽,其槽值为a,而S’中虽有这个槽,但其槽值不是a,则这个槽可被选为候选槽;•把源框架中所有槽都作为候选槽。当用上述启发式规则都无法确定候选槽,或所确定的候选槽不够用时,可把源框架中所有的槽都作为候选槽,供下一步进行筛选。
Ⅱ.根据目标框架对候选槽进行筛选筛选按以下启发式规则进行:
•选择那些在目标框架中还未填值的槽;•选择那些在目标框架中为典型事例的槽;•选择那些与目标框架有密切关系的槽,或者与目标框架的槽类似的槽;
通过上述筛选,一般都可得到一组槽值,分别把它们填入到目标框架的相应槽中,即实现了源框架中某些槽值向目标框架的传递。
(3)转换类比学习(略)6.3知识/学习文本的生成
知识/学习文本是构造知识库的基础,概念化阶段以获得完整的(基本上的)文本而结束。文本的获得方法有:
•面谈法(Interview);•模拟法(Simulation);
•协议分析法(ProtocolAnalysis);
1.
面谈式知识/学习文本的生成
(1)面谈式知识文本的生成方法及过程
•知识工程师与专家直接对话;•知识工程师纪录会话内容;•对详细的会话记录进行编辑并定义与领域问题相关的术语、词汇等,形成初始文本;•对初始文本不断更新,形成知识的类自然语言表示(如事实、规则、信念、怀疑、假设等)的知识文本。
(2)面谈式知识文本的生成过程中应考虑的问题
•如何有效的提问,以解决对专家求解问题过程的了解,提问范围:—求解什么(What?);—为什么要这样做(Why?);—为何求解(How?);—求解难点是什么(What?);•应抓住问题的“要害”,使专家叙述的问题有利于知识文本的生成;•解决怎样才能很好的把会谈记录转化为初始文本,即:
—初始字典形成;—初始知识形成;•应考虑下列几方面问题:
—解决不切题意的叙述、矛盾的叙述问题;—解决专家与知识工程师对专门术语理解的一致性;—对模糊表示的切题理解;—对知识可信度的判断。•解决好各阶段知识工程师与专家间的反馈。(3)面谈式知识文本生成的特点
•这是一种最常用的知识获取(概念化)手段,具有直观性、易操作性;•但缺乏宏观上的整体结构;•过程冗长,得出的记录有时难以分析。2.模拟法知识/学习文本的生成模拟法有静态和动态两种形式:
(1)静态模拟法知识/学习文本的生成过程
•知识工程师提出一组实例:
—1.给出所有的好数据;—2.给出不完备的初始数据;•专家针对该问题(实例)进行求解,并说明求解过程所用的知识与步骤,得到一套资料;•知识工程师总结后,形成文本。
(2)动态模拟法知识/学习文本的生成过程•在专家处理某真实问题时,知识工程师观察并记录下其求解步骤与相关知识信息;•分析处理所记录内容;•形成知识文本。
(3)模拟法知识文本的生成的特点
•无论静态、动态法皆能将知识获取集中到所感兴趣的场合中;•文本生成依赖于对问题求解的操作过程,因此,知识文本生成有良好的结构性;•所生成的文本知识专业、面窄(针对实例);•对静态法:工作压力、时间压力不同,可能导致专家在考虑问题中的细节忽略;•对动态法:虽然能了解专家在自然状态下的工作,但费时、费力。3.协议分析法知识文本的生成
协议分析法实质上是静态模拟法的深化。
(1)过程
•首先在专家与知识工程师之间达成一个协议;—专家完成:解决问题的处理知识与手段,讲述思维活动。—知识工程师:记录、分析、归纳相应内容。
•专家根据实验报告、实例求解过程作详解,强调求解理由及深层知识信息,但也包括过程信息;(模拟法强调求解过程,但也包含详细信息)。专家实验报告、案例等知识工程师•知识工程师记录;•知识工程师分析记录内容:—把记录内容据详解分成细目;—分块形成结构化形式;—总结出知识模型;—实现从特殊到一般的抽象;
—写出文本。
(2)特点
•结构化了会谈式知识获取方式;•不仅强调了求解过程的信息,更重要的是强调了求解理由及相关的深层知识;
•但知识工程师从特殊的具体特性到一般概念的抽象不易实现。
6.4知识的形式化及知识库的建立
知识文本是对领域问题的文字性的叙述或描述,而用适当的数据结构表示它们——“知识表示”是形式化的主要工作。1.用于知识形式化的“知识表示”方法的选择原则
(1)根据文本所描述的知识类型选择相应的“知识表示”模式
•深层:描述性知识事实性知识用命题等表示;
•浅层:判断性知识启发性知识用产生式表示。•过程性知识:用启发式算法或其它算法实现。
(2)根据领域问题求解习惯及方便性选择“知识表示”模式
•对带有循环或排序性质的问题求解:如工序顺序安排等,可采用过程型(算法)知识表示方法;•对诊断问题求解,其带有因果链的搜索,可采用因果网等表示;
•对一般性的工艺设计(如工程决策、机床选择、设计方案选择等),可采用“产生式规则+框架”。
应该指出的是:在一般情况下,一个工程ES中混合多种知识表示模式是不可避免的。2.知识形式化文本的建立过程在“知识表示”模式确定后,可将知识/学习文本转变为形式化的新文本,其建立过程为:
Ⅰ.针对知识文本:
(1)首先按ES未来的组织结构将知识文本划分为若干块;(2)对每块选择相应的“知识表示模式”(单独或组合);(3)按符合知识库创建的输入模块的输入格式要求写出每块的知识;(4)对每块知识进行树状、层次式、图状重排;总之,生成形式化后的、符合KB输入模块的输入数据格式要求的新文本。
Ⅱ.针对学习文本主要是根据学习算法模块的输入数据格式要求,把学习文本映射成相应的新文本(过程类同于上)。3.知识库的建立一旦知识的形式化过程完成,则可用三种模式实现KB的建立。
•通过KB编辑模块;
•通过学习算法模块;
•通过知识库管理系统(KBMS)。
(1)利用KB编辑模块建立KB
Ⅰ.
流程:形式化新文本KB编辑模块组织结构
Ⅱ.
KB编辑模块的构造及组成:
•规定一致于形式化文本表示模式的输入格式;•规定一致于形式化文本组织知识块的结构的录入控制机制;•录入知识的语法、句法检验;
•录入或已入库知识的进一步编辑、插入、删除、修改、显示等。
Ⅲ.该方法的特点:•形式化文本、KB编辑器、KB三者在数据格式、组织形式、知识表示模式方面密切相关、不能相互独立;
•
KB编辑器属专用的文本处理器;
•编程实现方便;
•系统在逻辑及具体实现上易行、方便。
Ⅳ.目前一种新的智能KB编辑器的框架:
知识文本用户接口自然语言理解知识入库控制知识管理模块KB
(2)利用学习算法模块建立KB
Ⅰ.流程这是一种智能化知识自动获取及建库模式。
•学习算法模块:—1.由其输入格式决定的形式化学习文本,产生出特定数据结构的知识(最一般的为产生式规则);—2.而学习算法如前所述,为归纳学习中的“强化-弱化算法”。形式化学习文本学习算法模块知识入库模块知识管理模块KB
•知识入库控制模块—1.相关到KB的组织结构;—2.检查新生成知识的合法性;—3.把学习所得的知识存入KB相应位置。
•知识管理模块
用于在特定的KB组织结构和知识表示模式的控制下的显示、修改、删除、插入及语法、语义检查。
Ⅱ.特点
•实现KB的自动获取;•所有模块密切关联;
•但本知识获取方式实现困难,理论支持下降。(3)利用知识库管理系统创建知识库
Ⅰ.流程
•类似于DBMS,首先用KBMS定义知识库模式;—1.KB结构;—2.知识表示模式。
•利用KBMS的库操作语言录入形式化文本信息,并根据所定义的库模式映射出相应的库文件来。
•对KB的管理由KBMS的库操作语言(程序)执行。形式化文本KBMSKB
Ⅱ.特点
•知识获取方式仍为交互式(用知识编辑模块);•但KBMS本身与“形式化文本和KB”相分离,而由KBMS定义的KB模式、子模式(知识模式)与它们有关;•KBMS为知识库建立提供了通用工具;•KBMS实现复杂。
以上用于建立KB的功能模块也称知识获取辅助工具,包括:
•KB编辑模块;
•学习算法模块;
•KBMS;4.关于单条知识的合法性检查
在知识录入过程中,必须对单条知识进行合法性检查:•单条知识的语法是否符合具体的知识表示模式的定义;•单条知识的词法是否符合具体的知识表示模式的定义;•单条知识的语义是否符合具体的知识表示模式的定义;6.5知识库的调试与精炼、知识求精、维护
知识库初建后,还必须进行调试、精炼与维护。1.知识库的调试与精炼
(1)调试与精练的用途
•知识库调试主要是用推理机测试所有可能推理路径的可达性;
•知识库的精炼指:—消除KB中的冗余;—消除知识中的知识二义性;—消除不可达现象。
调试与精炼两者相辅相成。
(2)知识库调试中应考虑的问题
•尽可能多的选择KB能表达的推理目标进行测试;•用于测试的推理机应匹配于KB的组织形式;
•推理机与解释机制能很好结合并方便地进行错误定位。
(3)关于知识库精炼
Ⅰ.冗余知识的消除:
例如:ifa&bthenc,ifathend,ifb&dthencd为与其它规则无关联命题,则最后一组规则冗余,可去除。
Ⅱ.二义性消除修改
例如,ifa&bthencifa&bthend
如果要消除,可通过增加前提,去除一个。
Ⅲ.不可达知识去除修改所有可能的推理路径都不会用到的知识必须去除或修改。
Ⅳ.知识顺序的再组织知识存放顺序影响到:—推理效率;—冲突消除。因此,有时有必要重新组织知识顺序,提高推理效率及方便冲突消除。
Ⅴ.去除矛盾性知识例如:ifa&bthenc,ifa&bthenc应解决。
2.知识求精知识库中除了可能存在上述的冗余、茅盾等问题外,还可能存在知识不完整的问题,以至在系统运行时产生错判或漏判的错误。
•错判:指对给定的不应产生某一结论的条件,但系统运行却得出了这一结论。例如,对一个肝病诊断专家系统来说,把不是肝炎的诊断为肝炎,这就是错判。
•漏判:指在给定条件下,本来应该推出的结论没有推出来。例如把肝炎病人诊断为不是肝炎。
•知识求精:为了找出导致错误的原因,就需要找出产生这些错误的知识,予以改进,以提高知识库的可靠性,这称为知识求精。
•知识求精的一般方法:
用一批有已知结论的实例考核知识库,看有多少实例被知识库错判及漏判,然后对知识作适当修正,以提高知识的精度。
知识求精方法与知识的表示方法有密切关系。3.知识库的维护当调试与精炼完成提供给ES使用后,要对ES进行维护。这些维护包括:
•KB的显示;
•KB知识增加后再调试与精炼;•KB知识删除后再调试与精炼;•KB知识修改后再调试与精炼;具体实现方法使用前述过程。
第七章专家系统开发方法学及典型系统评述
前面各章介绍了ES的各组织环节的原理及开发:
•知识表示;•推理技术•解释机制•问题求解控制策略;•知识获取等。
但如何将他们“集成”起来,创造出面向专门领域的ES,则是专家系统开发方法学应解决的问题。
本章主要内容涉及ES开发方法学部分内容:1.ES的选题与设计原则;2.研制ES的基本步骤;3.深化ES。
4.此外,我们还要介绍一个典型的专家系统:MYCIN(RULE);
7.1专家系统开发方法学1.概述经验表明,ES的开发是一项旷日费时的复杂工作,其具备以下几方面的特点:
(1)开发ES的特点
Ⅰ.在方法学的成熟性方面
•AI及ES各项基本技术的有效性、适用性无法精确说明;•开发ES在很大程度上凭经验和直觉工作;•研制ES不存在可共同遵循的一套完整规范化方法;
Ⅱ.在ES的程序开发方面•不同于传统的基于算法的程序开发;•将知识表示技术、利用知识的推理技术,融于传统的程序设计过程;•有人认为:ES的程序开发与其说是一门科学,还不如说是一门艺术;
Feigonbaum教授曾说:“设计专家系统的艺术既是程序设计艺术的一部分,又是它的扩展,这就是用表示知识的技术和利用知识进行推理的技术来构造复杂的计算机程序的艺术。”
Ⅲ.在ES的知识方面
•“知识”是开发ES的“瓶颈”,这一点在前面已有介绍;•ES要达到专家求解水平,必须掌握专家求解问题的经验知识,它们是:大量的、专门的、非结构化的、隐式的、长期积累的;•知识层不良结构,在专家头脑中无定型形式,KB整理困难;•专门知识建立在经验基础上,缺乏严谨的理论依据;•知识抽取往往凭某些重复出现的因果联系或直觉,而专家在描述这些知识时,很难做到准确无误。
Ⅳ.在ES的发展状况方面•ES的发展正向复杂化、实用化方面发展,并不断进入到新应用领域;•ES的开发更多地利用着当前AI技术的新成果;•ES开发更多地利用AI技术与其它技术(如数据库技术、CAD技术、模式识别技术、数据采集技术及各种接口技术等)的结合。
(2)开发ES的难点
主要定位在知识获取方面,即:专家的知识与ES所用的表示知识的方法在抽象层次上的不一致性,这种层次包括:
•语义描述;•组织结构;•表达形式。实现这种“不一致”的转换极为困难。
(3)专家系统开发方法学涉及的主要内容
Ⅰ.对各项ES单元技术的使用方法:
•知识表示;•推理;•解释。
Ⅱ.集成各项单元技术的方法:问题求解的组织结构与控制策略;
Ⅲ.ES的选题与设计原则;
Ⅳ.研制ES的基本步骤。2.ES的选题与设计原则
(1)ES的选题原则
Ⅰ.
ES的选题原则是:
指出哪种特定的问题比较适合于应用专家系统;
Ⅱ.适合于应用ES的问题须满足三个先决条件:
•存在一个可以与之合作的DE(DomainExpert),通常,不存在公认专家的领域有二:—1.问题求解已有成熟的方法,领域内一般人员均可处理好;—2.问题求解过于复杂,人类无法较好地解决它们。
•DE是通过启发式方法求解问题的,即领域含人类未彻底掌握的,不存在成熟算法的场合;•DE的知识能尽量的用语言表达清楚:
—
这样便于KE整理、形式化知识;—而依赖于感觉、直觉工作的领域,ES求解效果不显著。
Ⅲ.ES选题的其它应考虑的问题
•问题的范围应比较狭窄,因为:—1.AI技术受限,无表示知识、利用知识、获取知识的通用技术;—2.不便于表示大量的、形式多样的常识性知识。
•问题难度适当,因为:—1.太简单,失去应用ES的意义;—2.太复杂,使系统难以构造,且处理效率及水平过低。
•针对特定的应用目的及领域:—1.对缺乏高级专门人才的领域,用ES发挥DE级的应用水平;—2.代替人的部分脑力劳动:涉及到大量重复性劳动,如信号数据解释等。
(2)ES的设计原则
Ⅰ.众所周知,设计ES的基础是:领域专家DE;知识工程师KE;大量的知识(经验、实例等)。这也称开发ES的三个基本要素。Ⅱ.知识库与推理机分离
•它是实现或设计ES的基本原则;
•使解释、可信度传播等能够实现。
Ⅲ.尽量使用统一的知识表示方法;
Ⅳ.
推理机尽量简化,保证解释等工作量小;
Ⅴ.利用冗余以弥补知识的不完整,不精确;3.研制ES的基本步骤
虽然目前还没有一种规范化的开发步骤,但近三十年的开发表明,开发一个成功的ES大致要经历:
准备阶段;研究问题;整理知识;建立模型系统;改进与扩充;测试与评价;商品化;
(1)准备阶段
当KE与DE打算合作开发ES时,双方可着手以下准备工作:•双方共同探讨、选择一种合适的问题;
•初步规划、制定系统求解问题的范围;
•一旦双方确定基本目标,可开始着手知识获取的前两步工作。
(2)研究问题:
KE与DE共同探讨ES开发的细节:范围与难度,开发费用、时间、机器等。
Ⅰ.系统求解范围细化及难度讨论
•细化求解范围;
•确定各子任务求解难度,以得到分配资源的原由;
Ⅱ.合理分配资源、开发费用、时间等•合理的开发资源分配取决于问题求解的难度。一般:
—1.
开发一个难度适中的ES约需5~6人年的工作量;
—2.
开发一个难度较大的ES约需10人年的工作量;
—3.开发一个难度很大的ES约需20人年的工作量;
•一种参考到中等难度的ES的时间分配可为:
时间:2年工作量:6人年人员分配:高级KE:6.5年低级KE:2年人工智能程序员:2年领域专家:3.5年
•合理分配开发ES所用的设备、软件支持、开发资金等。主流类型小型中型大型规则数量50~350(条)500~3000(条)5000~10000(条)工作量3~6(人年)8~15(人年)20人年以上资金$40,000~60,000$500,000~1000,000$2000,000~5000,000机器微型机、小型机小型机、中型机中型机、大型机预算表
(3)整理知识主要完成知识获取从“知识源确定”到“知识概念化”到“知识形式化”的三个阶段。
(4)建立模型系统
Ⅰ.建立模型系统,从三个方面着手:
ⅰ.完成初级知识库的建立;
ⅱ.建立一个初级ES的程序系统;
•知识编辑;
•推理机;•解释机;•简单界面等。
ⅲ.测试该模型系统,证明技术可行性。
这些工作也可由所选择的适当的ES开发工具实现。
Ⅱ.模型系统的作用:
•验证前阶段所形成的系统设计方案的正确性;
•提高ES开发者的兴趣(指领域专家)。
Ⅲ.实现模型应注意的问题:
•不追求系统尽善尽美,尤其是不追求KB的完美无缺;•保持模型系统的简单化,以便随着对系统的修改、对附加功能的修改而增加。
•开发一些简单的辅助功能(如知识编辑、解释功能等);•模型系统的建造是开发ES过程中很重要的一步,它对ES后期的开发有重要影响。
(5)改进与扩充以一种循环工作模式着手下面三方面的工作:
Ⅰ.知识库的逐步深化
Ⅱ.ES程序功能的扩充—1.推理机;—2.解释机;—3.控制策略等;—4.辅助功能。
Ⅲ.构造和应用一些测试工具—1.测试实例库的建立;—2.运行跟踪等。应指出,对于第二方面的工作,“ES的核心部分(KB、推理机等)程序量”<“辅助模块”。例如:Schlumbeiger公司开发的石油测井数据解释专家系统DipmeterAdvisor中:推理机:8%人机接口:40%知识库:22%支持环境:15%检验:15%4.专家系统的评价
ES的开发过程是一个经过长期反馈、逐步进化、完善的过程,对ES的评价(含非正式)实际上贯穿于系统开发的全过程:
(1)ES评价的定义
•检测所开发的ES在各个层次上的正确性、准确性、实用性;•在评价中获得各种基于AI的技术指标。
(2)ES评价的内容
对ES的评价内容有多种不同的考虑,概括为:
•评价系统的性能:了解求解水平是否达到DE水准、可否实际应用;
•评价系统的灵活性:看其是否便于修改和扩充知识库的知识;
•评价系统的透明性:看其解题过程及系统本身是否容易为用户和系统维护人员所理解;•评价系统的可用性,如评价:—1.系统使用方法是否简单易行;—2.人机通信手段是否直观;—3.系统求解问题的效率是否令人满意;—4.系统能否推广应用等。•评价系统的效益:—1.系统能否产生经济效益、社会效益;—2.系统效益与系统造价是否相适应。•评价系统的意义:—1.理论意义:对ES的发展和推广的贡献;—2.现实意义:对国民经济的贡献。上述六项内容依次形成一个“由低到高”的评价层次结构,一般来说,只有通过较低的评价才能进入较高的评价。
(3)ES评价的原则针对上述各层次的评价内容,ES的评价遵循以下各原则:
Ⅰ.复杂的事物或过程不能用某种单一的指标来评价;
Ⅱ.评价的指标越多,评价的等级越细,构成总体评价的信息就越多;Ⅲ.人们根据各自的兴趣产生的评价会有冲突;
Ⅳ.只要准确定义如何评价,评价工作都可根据实验来进行。
根据以上原则,可为各层次的评价内容设计评价方法与指标。
(4)ES的评价方法
•开发者自评价法;
•同行专家评议法(鉴定会法、调查表法);
•用户评价法(实例测试法、调查表法)。
无论哪种方法,都必须:Ⅰ.从低层次到高层次逐次评价;
Ⅱ.设计好相应的评价指标;
Ⅲ.做好对反馈信息的处理;
Ⅳ.借助特定的评估工具(如实例库、Batch程序)。
(5)评价出的ES级别
Ⅰ.演示原型:
•这类系统能解决应用领域中的一部分问题;
•主要作用是说明系统所采用的AI技术适于该领域;•进一步表明该领域可用ES求解以达到目标。
Ⅱ.研究原型:
•对领域问题的求解较完整,且性能可靠;•但未进行完整的测试与认真的修改,系统行为有些脆弱。
Ⅲ.领域原型:
•已在用户环境下接受大范围的测试;•具有足够的可靠性和良好的性能。
Ⅳ.产品模型:
在用户环境下,在性能、求解问题的效率、灵活性、透明性等方面都达到比较令人满意的程度。7.2典型专家系统评述
典型系统的实现对ES技术的发展具有里程碑的作用,这些系统包括:
•MYCIN——(医学诊断专家系统)•PROSPECTOR——(地质勘探专家系统)•DENDRAL——(化学分析专家系统)•AM——(数学发现专家系统)
本节将从知识表示、推理实现、问题求解组织与控制等方面对MYCIN系统作一介绍。医学诊断专家系统MYCIN
(1)研究与开发背景
•1972年开始,由Stanford大学开始开发,1974年基本完成,后经多次改进,最终发展成一个著名系统。MYCIN用LISP开发。•其原始工作基于shortliffe的ph.D论文。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年版影视制作与发行合同
- 美业门店培训课程设计
- 英语加国学课程设计理念
- 感觉统合课程设计大班
- 油画初学者 课程设计
- 2024政法干警考试复习资料
- 系统动力学课程设计总结
- 深圳市政府投资交通建设项目管理模式-第二册
- 大班社会签到课程设计
- 2024年羽绒家纺销售岗位职责(共8篇)
- 湖南省部分学校2023-2024学年高二上学期期末联合考试政治试卷 含解析
- 中学生心理健康教育主题班会课件
- 电大《人力资源管理》期末复习综合练习题答案(2024年)
- 西师版数学(四上题)2023-2024学年度小学学业质量监测(试卷)
- 2022-2023学年广东省广州市白云区华南师大附属太和实验学校九年级(上)期末数学试卷(含答案)
- 东方电影学习通超星期末考试答案章节答案2024年
- 人教版四年级上册数学数学复习资料
- 安徽省安庆市迎江区2023-2024学年四年级上学期期末数学试卷
- SB/T 10439-2007酱腌菜
- 肺炎试题及答案
- 现代CMOS工艺基本流程
评论
0/150
提交评论