专家系统人工智能课件.part_第1页
专家系统人工智能课件.part_第2页
专家系统人工智能课件.part_第3页
专家系统人工智能课件.part_第4页
专家系统人工智能课件.part_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第8章 知识获取与机器学习基本概念学习的主要表现:1.获得新知识2.从感性认识发展到理性认识3.通过反复实践对学习的4种理解:1.学习是一个系统改进其自身性能的任何过程。2.学习是获取明显知识的过程3.学习是技巧的获取4.学习是理论、假说的形成过程学习的一般模式普通理论深层知识表层知识领域专家知识知识的组织程度从学校和书本学习领域无关的定义、基本公式、公理、定律从师傅学习领域有关的事实、经验知识、诀窍、技能无知识8.1 知识获取的一般性问题 ES用于领域问题求解必须依赖于其知识库的容量、质量,而知识获取就在于建筑出上述要求的知识库。1. 知识获取的概念 指从人类专家处获取领域知识,并将其转化成

2、知识库的过程; 知识获取是ES建造的关键环节,亦是建造ES的“瓶颈”; 知识工程师在知识获取过程中协调领域专家进行领域知识的形式 化,并在知识获取中起关键作用。2. 知识获取的过程 知识获取一般经历以下五个阶段: 知识源的确定 概念化阶段文本形成; 形式化阶段; 知识库建立阶段; 知识库测试、精炼与维护阶段。 (1) 知识源的确定 首先由知识工程师根据待解领域问题选择一个(组)专家; 请教这些专家并学习领域有关的概念、问题等; 制定(与专家一起)系统的设计目标; 确定ES所需的知识源,如: 专家过去的问题求解实例; 教科书中的知识; 隐含在专家大脑中的问题求解经验; (2) 知识文本形成或概念

3、化阶段 针对各种知识源,与专家配合,确定系统目标内的主要概念、关系等的描述。 确定数据类型知识类型; 分析系统预定的输入输出; 系统目标的分解(子问题的划分); 每个子目标的约束; 领域问题的求解策略; 可使用的局部假设; 问题领域中各实体的相关性; 问题领域中各实体间的因果关系; 问题领域中各实体间的层次、网状结构等; 形成知识文本(以自然跟踪、图形表示的上述内容); 当采用机器学习自动获取知识时,形成学习文本。 (3) 形式化阶段 选择合适的知识表示模式(数据结构)把概念化阶段得出的知识 文本表示出来; 或利用学习文本,调出相应的机器学习算法,形成相应的合适的 知识表示模式。 (4) 知识

4、库建立阶段 利用知识库编辑机制把由知识文本转化而来的形式化知识输入, 以建立知识库; 或利用形式化知识自动录入机制,把经机器学习生成的知识输入 到知识库中; (5) 知识库的测试、精炼、维护阶段 检查、测试知识库的推理路径可达性(用实例); 消除知识冗余精炼; 消除知识的二义性精炼; 对新增加知识的测试、精炼维护。领域问题学习文本形式化知识知识库 (2) 自动型知识获取(3) 混合型知识获取 结合两种模型的知识获取。3. 知识获取的类型 从上述知识获取的过程,我们可得出知识获取的几种类型: (1) 交互式知识获取领域问题知识文本形式化知识知识库环境知识库编辑知识库推理机交互式系统知识获取环境学

5、习元知识库性能元学习系统知识获取4. 关于知识获取的交互系统与学习系统的一般结构8.2 常用的机器学习方法 如前所述,利用“学习元”可将“学习文本”自动地转换成“形式化知识”。“学习元”的构造取决于: 各种不同的学习算法; 学习策略; 知识表示方法; 应用领域; 学习元的构造需使用“机器学习”技术。1. 基本概念 所谓机器学习,就是要使计算机能够模拟人的学习行为,自动地 通过学习获取知识和技能,不断改善技能,实现自我完善。2. 机器学习的分类 目前常用的分类方法: 机械式学习指导式学习示例学习类比学习解释学习基于演绎的学习基于归纳的学习归纳学习分析学习连接学习遗传算法(1) 按学习方法分类 (

6、2) 按推理方式分类(3) 按综合属性分类机械式学习指导式学习示例学习类比学习解释学习基于演绎的学习基于归纳的学习归纳学习分析学习连接学习遗传算法(1) 按学习方法分类 (2) 按推理方式分类(3) 按综合属性分类3. 机械学习(Rote Learning) (1) 基本概念 这是一种最简单、最原始的学习方法,它通过记忆和评价外部环境所提供的信息达到学习的目的,学习系统(学习元)要做的工作是把经过评价取得的信息存储到知识库,求解问题时就从知识库中检索出相应的知识直接用来求解问题。 继续学习就是记忆; 学习元所做的工作仅仅是存储新的知识; 需要时检索出来即可。 例如: 某个计算的输入是:( x1

7、 , x2 , , xn ) , 计算后输出是:( y1 , y2 , , yn ), 如果经评价后得知该结果正确,则把联想对: ( x1 , x2 , , xn ), ( y1 , y2 , , yn ) 存入知识库,当以后需要做同样的计算时,只要从知识库中检索出来即可,而不需要重新计算了。 (2) 利弊 机械式学习实质上是用存储空间来换取处理时间,虽然节省了计算时间,但却多占了存储空间。 当因学习而积累的知识逐渐增多时,占用的空间就会越来越大,检索的效率也就随之下降。 2. 归纳学习(Learning by Induction ) 归纳学习是应用归纳推理进行学习的一类学习方法,按其有无教师

8、指导可分为示例学习和观察与发现学习。 环境提供的信息是关于实际例子的输入与输出描述; 输入数据、输出结果规定了一个特殊的知识原则(特殊知识); 学习元从这些特殊知识中假设和归纳出一般性知识。 (1) 归纳推理 归纳是指从个别到一般,从部分到整体的一类推论行为。归纳推理是应用归纳方法进行的推理。常用的归纳推理方法有: 枚举归纳 联想归纳 类比归纳 . 枚举归纳 设a1, a2, 是某类事物 A 中的具体事物,若已知 a1, a2, , an 都有属性 P ,并且没有发生反例,当 n 足够大时,就可得出“ A 中所有事物都有属性 P ” 的结论。 这是一种从个别事例归纳出一般性知识的方法, “ A

9、 中所有事物都有属性 P ” 是通过归纳得到的新知识。 例如:设有如下已知事例: 张三是足球运动员,他的体格健壮。 李四是足球运动员,他的体格健壮。 赵十是足球运动员,他的体格健壮。 当事例足够多时,就可归纳出一个一般性知识: 凡是足球运动员,他的体格一定健壮。 考虑到可能会出现反例,可给这条知识增加一个可信度: 凡是足球运动员,他的体格一定健壮 (0.95)。. 联想归纳 若已知两个事物 a 与 b 有 n 个属性相同或相似 ,即: a 具有属性 P1 ,b也有属性 P1 a 具有属性 P2 ,b也有属性 P2 。 a 具有属性 Pn ,b也有属性 Pn 并且还发现, a 具有属性 Pn+1

10、 ,则当 n 足够大时,可归纳出: b也有属性 Pn+1 这一新知识。 例如:通过观察发现,两个孪生兄弟都有相同的身高、体重、相貌, 都喜欢唱歌、跳舞,且喜欢吃相同的食物,而且发现其中一人喜 欢画山水画,虽然我们没有看到另一个也喜欢画山水画,但我们 很容易联想到另一个“也喜欢画山水画”,这就是联想归纳。 由于联想归纳是一种主观不充分置信推理,因而经归纳得出的结论 可能会有错误。 (2) 示例学习(Learning by Examples) 示例学习是通过从环境中取得若干与某概念有关的例子,经归纳得出一般性概念的一种学习方法。 在这种学习方法中,外部环境(教师)提供的是一组例子(正例和反例),这

11、些例子实际上是一组特殊的知识,每一个例子表达了仅适用于该例子的知识,示例学习就是要从这些特殊知识中归纳出适合于更大范围的一般性知识。 例如:我们用一批动物作为示例,并且告诉学习系统哪一个动物是 “马”,哪一个动物不是,当示例足够多时,学习系统就能概括 出关于“马”的概念模型,使自己能识别“马”。这一学习过程就 是示例学习。 . 示例学习的学习模型 其学习过程是: 首先从示例空间(环境)中选择合适的训练示例,然后经过 解释归纳出一般性的知识,最后再从示例空间中选择更多的 示例对它进行验证,直到得到可实用的知识为止。 . 常用的归纳算法 强化/弱化算法: 用于归纳产生式规则:学习元的输出为规则;

12、强化指使规则前提取值范围加大:扩大范围; 弱化指使规则前提取值范围变小:缩小范围; 验证示例空间搜索解释形成知识知识库找一个规则模式用实例匹配 判断规则前提范围大? 弱化前提强化前提获取一般性规则Stop 判断规则前提范围小?YYNN3. 类比学习(Learning by Analogy) 指在几个对象(实体)间检测相似性; 根据一方对象(实体)所具有的事实和知识,推出相似对象所具有的事 实与知识; 环境提供相关领域知识(与当前所学习的问题间有相似性); 学习元找出相似性并得出相似准则/知识。 (1) 类比推理 类比学习的基础是类比推理。 所谓类比推理是指: 由新情况与记忆中的已知情况在某些方

13、面相似,从而推出它们在其它方面也相似。 类比推理是在两个相似域之间进行的: 一个是已经认识的域,它包括过去曾经解决过且与当前待解决问题 类似的问题以及相关知识,称为源域,记做 S; 另一个是当前尚未完全认识的域,它是遇到的新问题,称为目标域, 记做 T; 类比推理的目的是: 从 S 中选出与当前问题最近似的问题及其求解方法来求解当前问题,或者建立起目标域中已有命题间的联系,形成新知识。 (2) 属性类比学习 属性类比学习是根据两个相似事物的属性实现类比学习的。 我们以1979年温斯顿开发的一个系统为例进行说明。在该系统中: 原域和目标域都是用框架表示的,分别称为源框架和目标框架; 框架的槽用于

14、表示事物的属性; 其学习的过程是把源框架中的某些槽值传递到目标框架的相应槽中去。 传递分两步进行: . 从源框架中选择若干槽作为候选槽 选择方法是相继使用如下启发式规则: 选择那些具有极端槽值的槽作为候选槽; 选择那些已经被确认为“重要槽”的槽作为候选槽; 选择那些与源框架相似的框架中不具有的槽作为候选槽。如,S 为源 框架,S 是任一与 S 相似的框架,如果在S中有某些槽,但S 中不具 有这些槽,则就选择这些槽作为候选槽; 选择那些相似框架中不具有这种槽值的槽作为候选槽。如,S 为源框 架,S 是任一与 S 相似的框架,如果在S中有某槽,其槽值为a ,而 S 中虽有这个槽,但其槽值不是 a

15、,则这个槽可被选为候选槽; 把源框架中所有槽都作为候选槽。当用上述启发式规则都无法确定候 选槽,或所确定的候选槽不够用时,可把源框架中所有的槽都作为候 选槽,供下一步进行筛选。 . 根据目标框架对候选槽进行筛选 筛选按以下启发式规则进行: 选择那些在目标框架中还未填值的槽; 选择那些在目标框架中为典型事例的槽; 选择那些与目标框架有密切关系的槽,或者与目标框架的槽类似的槽; 通过上述筛选,一般都可得到一组槽值,分别把它们填入到目标框架的相应槽中,即实现了源框架中某些槽值向目标框架的传递。 (3) 转换类比学习 (略) 8.3 知识/学习文本的生成 知识/学习文本是构造知识库的基础,概念化阶段以

16、获得完整的(基本上的)文本而结束。文本的获得方法有: 面谈法(Interview); 模拟法(Simulation); 协议分析法(Protocol Analysis); 1. 面谈式知识/学习文本的生成 (1) 面谈式知识文本的生成方法及过程 知识工程师与专家直接对话; 知识工程师纪录会话内容; 对详细的会话记录进行编辑并定义与领域问题相关的术语、词 汇等,形成初始文本; 对初始文本不断更新,形成知识的类自然语言表示(如事实、 规则、信念、怀疑、假设等)的知识文本。 (2) 面谈式知识文本的生成过程中应考虑的问题 如何有效的提问,以解决对专家求解问题过程的了解,提问范围: 求解什么(What

17、?); 为什么要这样做(Why?); 为何求解(How?); 求解难点是什么(What?); 应抓住问题的“要害”,使专家叙述的问题有利于知识文本的生成; 解决怎样才能很好的把会谈记录转化为初始文本,即: 初始字典形成; 初始知识形成; 应考虑下列几方面问题: 解决不切题意的叙述、矛盾的叙述问题; 解决专家与知识工程师对专门术语理解的一致性; 对模糊表示的切题理解; 对知识可信度的判断。 解决好各阶段知识工程师与专家间的反馈。(3) 面谈式知识文本生成的特点 这是一种最常用的知识获取(概念化)手段,具有直观性、易操作性; 但缺乏宏观上的整体结构; 过程冗长,得出的记录有时难以分析。2. 模拟法

18、知识/学习文本的生成 模拟法有静态和动态两种形式: (1) 静态模拟法知识/学习文本的生成过程 知识工程师提出一组实例: 1. 给出所有的好数据; 2. 给出不完备的初始数据; 专家针对该问题(实例)进行求解,并说明求解过程所用的知 识与步骤,得到一套资料; 知识工程师总结后,形成文本。 (2) 动态模拟法知识/学习文本的生成过程 在专家处理某真实问题时,知识工程师观察并记录下其求解步骤 与相关知识信息; 分析处理所记录内容; 形成知识文本。 (3) 模拟法知识文本的生成的特点 无论静态、动态法皆能将知识获取集中到所感兴趣的场合中; 文本生成依赖于对问题求解的操作过程,因此,知识文本生成有 良

19、好的结构性; 所生成的文本知识专业、面窄(针对实例); 对静态法:工作压力、时间压力不同,可能导致专家在考虑问题 中的细节忽略; 对动态法:虽然能了解专家在自然状态下的工作,但费时、费力。3. 协议分析法知识文本的生成 协议分析法实质上是静态模拟法的深化。 (1) 过程 首先在专家与知识工程师之间达成一个协议; 专家完成:解决问题的处理知识与手段,讲述思维活动。 知识工程师:记录、分析、归纳相应内容。 专家根据实验报告、实例求解过程作详解,强调求解理由及深层 知识信息,但也包括过程信息;(模拟法强调求解过程,但也包 含详细信息)。专家实验报告、案例等知识工程师 知识工程师记录; 知识工程师分析

20、记录内容: 把记录内容据详解分成细目; 分块形成结构化形式; 总结出知识模型; 实现从特殊到一般的抽象; 写出文本。 (2) 特点 结构化了会谈式知识获取方式; 不仅强调了求解过程的信息,更重要的是强调了求解理由及相关 的深层知识; 但知识工程师从特殊的具体特性到一般概念的抽象不易实现。 8.4 知识的形式化及知识库的建立 知识文本是对领域问题的文字性的叙述或描述,而用适当的数据 结构表示它们“知识表示”是形式化的主要工作。1. 用于知识形式化的“知识表示”方法的选择原则 (1) 根据文本所描述的知识类型选择相应的“知识表示”模式 深层:描述性知识 事实性知识 用命题等表示; 浅层:判断性知识

21、 启发性知识 用产生式表示。 过程性知识:用启发式算法或其它算法实现。 (2) 根据领域问题求解习惯及方便性选择“知识表示”模式 对带有循环或排序性质的问题求解:如工序顺序安排等,可采用 过程型(算法)知识表示方法; 对诊断问题求解,其带有因果链的搜索,可采用因果网等表示; 对一般性的工艺设计(如工程决策、机床选择、设计方案选择等), 可采用“产生式规则+框架”。 应该指出的是:在一般情况下,一个工程ES中混合多种知识表示模式是不可避免的。2. 知识形式化文本的建立过程 在“知识表示”模式确定后,可将知识/学习文本转变为形式化的新文本,其建立过程为: . 针对知识文本: (1) 首先按ES未来

22、的组织结构将知识文本划分为若干块; (2) 对每块选择相应的“知识表示模式”(单独或组合); (3) 按符合知识库创建的输入模块的输入格式要求写出每块的知识; (4) 对每块知识进行树状、层次式、图状重排; 总之,生成形式化后的、符合KB输入模块的输入数据格式要求的新文本。 . 针对学习文本 主要是根据学习算法模块的输入数据格式要求,把学习文本映 射成相应的新文本(过程类同于上)。3. 知识库的建立 一旦知识的形式化过程完成,则可用三种模式实现KB的建立。 通过KB编辑模块; 通过学习算法模块; 通过知识库管理系统(KBMS)。 (1) 利用KB编辑模块建立KB . 流程:形式化新文本KB编辑

23、模块组织结构 . KB编辑模块的构造及组成: 规定一致于形式化文本表示模式的输入格式; 规定一致于形式化文本组织知识块的结构的录入控制机制; 录入知识的语法、句法检验; 录入或已入库知识的进一步编辑、插入、删除、修改、显示等。 . 该方法的特点: 形式化文本、KB编辑器、KB三者在数据格式、组织形式、知识 表示模式方面密切相关、不能相互独立; KB编辑器属专用的文本处理器; 编程实现方便; 系统在逻辑及具体实现上易行、方便。 . 目前一种新的智能KB编辑器的框架: 知识文本用户接口自然语言理解知识入库控制知识管理模块KB (2) 利用学习算法模块建立KB . 流程 这是一种智能化知识自动获取及

24、建库模式。 学习算法模块: 1. 由其输入格式决定的形式化学习文本,产生出特定数据结 构的知识(最一般的为产生式规则); 2. 而学习算法如前所述,为归纳学习中的“强化-弱化算法”。形式化学习文本学习算法模块知识入库模块知识管理模块KB 知识入库控制模块 1. 相关到KB的组织结构; 2. 检查新生成知识的合法性; 3. 把学习所得的知识存入KB相应位置。 知识管理模块 用于在特定的KB组织结构和知识表示模式的控制下的显示、 修改、删除、插入及语法、语义检查。 . 特点 实现KB的自动获取; 所有模块密切关联; 但本知识获取方式实现困难,理论支持下降。(3) 利用知识库管理系统创建知识库 .

25、流程 类似于DBMS,首先用KBMS定义知识库模式; 1. KB结构; 2. 知识表示模式。 利用KBMS的库操作语言录入形式化文本信息,并根据所定义的 库模式映射出相应的库文件来。 对KB的管理由KBMS的库操作语言(程序)执行。 形式化文本KBMSKB . 特点 知识获取方式仍为交互式(用知识编辑模块); 但KBMS本身与“形式化文本和KB”相分离,而由KBMS 定义的 KB 模式、子模式(知识模式)与它们有关; KBMS 为知识库建立提供了通用工具; KBMS 实现复杂。 以上用于建立KB 的功能模块也称知识获取辅助工具,包括: KB 编辑模块; 学习算法模块; KBMS;4. 关于单条知识的合法性检查 在知识录入过程中,必须对单条知识进行合法性检查: 单条知识的语法是否符合具体的知识表示模式的定义; 单条知识的词法是否符合具体的知识表示模式的定义; 单条知识的语义是否符合具体的知识表示模式的定义;8.5 知识库的调试与精炼、知识求精、维护 知识库初建后,还必须进行调试、精炼与维护。1. 知识库的调试与精炼 (1) 调试与精练的用途 知识库调试主要是用推理机测试所有可能推理路径的可达性; 知识库的精炼指: 消除KB中的冗余; 消除知识中的知识二义性; 消除不可达现象。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论