版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 知识工程方法知识工程方法温有奎温有奎一、知识工程概念的提出知识工程概念的提出 知识工程就是探索关于知识的表示、获取(包括学知识工程就是探索关于知识的表示、获取(包括学习、保存及交换)和运用(包括检索、推理以及其它习、保存及交换)和运用(包括检索、推理以及其它各种形式的加工)的理论、方法及实现技术。各种形式的加工)的理论、方法及实现技术。 在在19751975年第五届国际人工智能会议上,有美国斯坦年第五届国际人工智能会议上,有美国斯坦福大学计算机系教授哥鲍姆作了关于福大学计算机系教授哥鲍姆作了关于“人工智能技艺人工智能技艺”的演讲,提出了知识工程这一概念,由此出现了知的演讲,提出了知识工程这一
2、概念,由此出现了知识工程的学科,并在近些年来迅速发展和演化。从传识工程的学科,并在近些年来迅速发展和演化。从传统意义上讲,知识工程与信息系统的发展有关,在信统意义上讲,知识工程与信息系统的发展有关,在信息系统中,知识和推理扮演着关键的角色。息系统中,知识和推理扮演着关键的角色。v v CommonKADSCommonKADS是一系列国际研究和知识工程应用是一系列国际研究和知识工程应用项目的结晶。项目的结晶。CommonKADSCommonKADS的实际应用表明许多系统的实际应用表明许多系统项目之所以失败是因为一种叫做技术推动的方法。项目之所以失败是因为一种叫做技术推动的方法。只有清楚系统的角色
3、和它对组织的潜在影响,并且只有清楚系统的角色和它对组织的潜在影响,并且在系统开发之前和系统开发期间两者达到高度的一在系统开发之前和系统开发期间两者达到高度的一致,一个组织才能成功的应用信息和知识技术。因致,一个组织才能成功的应用信息和知识技术。因此对于组织的分析而言,引入面向知识的方法和技此对于组织的分析而言,引入面向知识的方法和技术是一个很大的进步。术是一个很大的进步。 组织的分析组织的分析目的是建立一个应用推动的方法。目的是建立一个应用推动的方法。这种方法可以面向用户、客户和项目相关人员保证这种方法可以面向用户、客户和项目相关人员保证新系统能够解决实际问题或者利用组织内真正的机新系统能够解
4、决实际问题或者利用组织内真正的机会。这个方法的其他有用的功能是可以解决复杂人会。这个方法的其他有用的功能是可以解决复杂人机交互的建模问题,解决新规范技术的引入问题,机交互的建模问题,解决新规范技术的引入问题,解决灵活性、风险驱动定义以及可配置的生命周期解决灵活性、风险驱动定义以及可配置的生命周期管理方法的定义问题,该方法替代了用于信息系统管理方法的定义问题,该方法替代了用于信息系统项目的项目的瀑布模型瀑布模型(该模型很经典,但过于严格)。(该模型很经典,但过于严格)。 4.1 知识工程的含义与原理知识工程的含义与原理 CommonKADSCommonKADS方法学提供了一种结构化方法。它基方法
5、学提供了一种结构化方法。它基于几个基本思想或原则,而这些基本思想或原则是于几个基本思想或原则,而这些基本思想或原则是从长年的经验中得到的。我们简要地介绍作为现代从长年的经验中得到的。我们简要地介绍作为现代知识工程基础的基本原则。知识工程基础的基本原则。 知识工程不是知识工程不是“从专家的头脑中挖掘从专家的头脑中挖掘”的某种的某种东西,东西,而是由构造人类知识不同方面的模型组成。而是由构造人类知识不同方面的模型组成。 v 习惯上,知识工程被视为一种从专家的头脑中习惯上,知识工程被视为一种从专家的头脑中“提取提取”或或“挖掘挖掘”出来并以可计算形式传送到机出来并以可计算形式传送到机器的过程。这已被
6、证明是原始和相当幼稚的观点。器的过程。这已被证明是原始和相当幼稚的观点。v 今天,今天,知识工程被视为一种建模活动。知识工程被视为一种建模活动。模型是模型是对现实的某一部分进行的一种有目的的抽象。建模对现实的某一部分进行的一种有目的的抽象。建模是对知识的少数几个方面建立一种好的描述(即能是对知识的少数几个方面建立一种好的描述(即能够清楚地表达你的目的),而又忽略其他方面。够清楚地表达你的目的),而又忽略其他方面。v 按照按照CommonKADSCommonKADS的观点,知识项目用于构造某的观点,知识项目用于构造某些方面的模型,这些模型应成为项目所提交的产品些方面的模型,这些模型应成为项目所提
7、交的产品的一个重要部分。的一个重要部分。CommonKADSCommonKADS模型套件是分解和结模型套件是分解和结构化知识工程过程的方便工具构化知识工程过程的方便工具。v知识级原则:知识级原则:v在知识建模中,首先要集中考虑知识的概念在知识建模中,首先要集中考虑知识的概念结构,而把编程细节留在以后考虑结构,而把编程细节留在以后考虑。 知识级原则首先是由知识级原则首先是由AlanNewellAlanNewell(19821982)提出提出的,他说:的,他说:知识要在概念级上建模知识要在概念级上建模,而不应依赖于,而不应依赖于特殊的计算结构和软件实现。知识建模中所使用的特殊的计算结构和软件实现。
8、知识建模中所使用的概念应参照和反映现实世界领域,并用相关人员可概念应参照和反映现实世界领域,并用相关人员可理解的词汇进行表达。按照理解的词汇进行表达。按照CommonKADSCommonKADS的观点,知的观点,知识系统的制品的设计应当称为保持结构的设计,因识系统的制品的设计应当称为保持结构的设计,因为它遵循和保持了所分析的知识的概念结构。为它遵循和保持了所分析的知识的概念结构。 尽管知识的体系结构明显比基于规则的系统的尽管知识的体系结构明显比基于规则的系统的结构更为复杂,但知识确实有可以理解的结构,这结构更为复杂,但知识确实有可以理解的结构,这就是我们进行成功的知识分析的出发点。从概念上就是
9、我们进行成功的知识分析的出发点。从概念上来说,来说,知识级模型通过知识分类可帮助我们理解人知识级模型通过知识分类可帮助我们理解人类解决问题的世界类解决问题的世界。现代知识工程的一个重要结果。现代知识工程的一个重要结果是:人的专长可根据知识的稳定和通用的种类、模是:人的专长可根据知识的稳定和通用的种类、模式和结构来进行明确的分析。因此,我们把知识看式和结构来进行明确的分析。因此,我们把知识看作是具有良好结构的函数模型,其不同部分在人类作是具有良好结构的函数模型,其不同部分在人类问题求解中担当着不同的、有限制的和专门的角色问题求解中担当着不同的、有限制的和专门的角色。 开发简单或非常著名的信息系统
10、通常遵循一种固开发简单或非常著名的信息系统通常遵循一种固定的管理路线。这就是所谓的系统开发的瀑布模型。定的管理路线。这就是所谓的系统开发的瀑布模型。它由按照预先定义好顺序的一些预先定义的阶段组成它由按照预先定义好顺序的一些预先定义的阶段组成:项目的准备和计划;找出客户需求;详细说明和设:项目的准备和计划;找出客户需求;详细说明和设计系统;编程、测试和交付使用计系统;编程、测试和交付使用并且只能按这种并且只能按这种顺序进行。顺序进行。 知识非常丰富,直接套用这种严格的方法非常困难。知识非常丰富,直接套用这种严格的方法非常困难。快速原型法快速原型法在知识系统中非常流行,因为它能进行现场在知识系统中
11、非常流行,因为它能进行现场学习,并能根据需要随时改变流程。快速原型法的缺点学习,并能根据需要随时改变流程。快速原型法的缺点是难以预测和管理,这是它特定的本质。是难以预测和管理,这是它特定的本质。 因此,因此, ComnonKADSComnonKADS采用的一种可配置的、平衡的采用的一种可配置的、平衡的项目管理方法,它比瀑布模型更灵活,比快速原型法更项目管理方法,它比瀑布模型更灵活,比快速原型法更易于控制。知识项目管理遵循螺旋式方法,这种方法支易于控制。知识项目管理遵循螺旋式方法,这种方法支持结构化学习,即持结构化学习,即CoommonKADSCoommonKADS模型的暂时结果或模型的暂时结果
12、或“状状态态”可作为下一步来采取什么步骤的信号。在确定这些可作为下一步来采取什么步骤的信号。在确定这些步骤时,目标和风险概念起着关键作用步骤时,目标和风险概念起着关键作用。 我们主要对知识抽取这一技术进行。我们主要对知识抽取这一技术进行。知识抽取知识抽取是由一组技术和方法组成的是由一组技术和方法组成的. .这些技术和方法通过这些技术和方法通过与专家不同形式的交互来抽取该领域专家的知识。与专家不同形式的交互来抽取该领域专家的知识。领域专家是指掌握特定知识的人,这些知识可以用领域专家是指掌握特定知识的人,这些知识可以用来解决我们感兴趣的应用任务。来解决我们感兴趣的应用任务。 从始至终,我们将重点放
13、在执行抽取的实际方法从始至终,我们将重点放在执行抽取的实际方法和方式上。在知识建模方法论语境中,我们使用例和方式上。在知识建模方法论语境中,我们使用例子来说明不同的技巧和工具是怎样在一起协调。子来说明不同的技巧和工具是怎样在一起协调。 知识抽取的特征知识抽取的特征 知识抽取可以为知识建模提供素材知识抽取可以为知识建模提供素材。这些素材不全是。这些素材不全是“未加工未加工”的,使用抽取技术后的结果通常是得到一种结的,使用抽取技术后的结果通常是得到一种结构化的数据,例如,标记、图表、术语表、公式和非正式构化的数据,例如,标记、图表、术语表、公式和非正式的规则等。意识到脱离了抽取技巧,一个人就无法得
14、到真的规则等。意识到脱离了抽取技巧,一个人就无法得到真正且正式的描述是很重要的。在抽取上强加正式的表示将正且正式的描述是很重要的。在抽取上强加正式的表示将会在抽取过程中导致偏见,甚至经常会得到错误的数据。会在抽取过程中导致偏见,甚至经常会得到错误的数据。抽取应该要集中化和结构化,但是也要尽可能的开放。将抽取应该要集中化和结构化,但是也要尽可能的开放。将抽取的原材料转化成问题解决过程中更正式的描述是知识抽取的原材料转化成问题解决过程中更正式的描述是知识建模的一个任务。建模的一个任务。 v执行知识抽取和知识分析的知识工程师执行知识抽取和知识分析的知识工程师(或者叫知(或者叫知识分析员)实质上不需要
15、掌握很深的应用领域知识。识分析员)实质上不需要掌握很深的应用领域知识。 v在大多数情况下,他(她)实际上需要请教资深专在大多数情况下,他(她)实际上需要请教资深专家。这也许是因为当时没有可用的文档,或者他们家。这也许是因为当时没有可用的文档,或者他们意识到在从事的领域中真正的专家来自与实践,而意识到在从事的领域中真正的专家来自与实践,而不是死读书本。不是死读书本。 以下两个问题在知识抽取过程中相当以下两个问题在知识抽取过程中相当突出突出v(1 1)我们怎样让专家们告诉我们或者给我们演示)我们怎样让专家们告诉我们或者给我们演示他们做什么?他们做什么?v(2 2)我们怎样决定他们解决问题的能力是由
16、什么)我们怎样决定他们解决问题的能力是由什么形成的?形成的?v这个任务是非常艰巨的,特别是在大的应用语境中这个任务是非常艰巨的,特别是在大的应用语境中显得尤为突出。有很多情况会使问题变得更加难以显得尤为突出。有很多情况会使问题变得更加难以处理。许多技术知识是从多年积累的经验中获得的,处理。许多技术知识是从多年积累的经验中获得的,并且是以直观推断的形式表示的。直观推断是一种并且是以直观推断的形式表示的。直观推断是一种经验规则或者是一种已证明了的方法这些规则和方经验规则或者是一种已证明了的方法这些规则和方法可以用来获得特定信息的结果。通常,专业技术法可以用来获得特定信息的结果。通常,专业技术变得如
17、此墨守成规,以至于专家们都无法知道他们变得如此墨守成规,以至于专家们都无法知道他们做什么或者为什么做做什么或者为什么做。v。知识库知识库(KB)知识库管理系统知识库管理系统(KBMS) v要用计算机进行知识处理和智能处理,则必须要有要用计算机进行知识处理和智能处理,则必须要有个个“能对知识进行系统化地组织与管理、能存储、能对知识进行系统化地组织与管理、能存储、增、删、改、查询和检索知识的机构,这就是知识增、删、改、查询和检索知识的机构,这就是知识库和知识库管理系统的功能。因此,研究、开发知库和知识库管理系统的功能。因此,研究、开发知识库相知识库管理系统就是迫切而又必须要做的事识库相知识库管理系
18、统就是迫切而又必须要做的事情。情。 知识的系统化组织与管理知识的系统化组织与管理 v所谓知识,是人们对自然现象的认识和从中总结出规所谓知识,是人们对自然现象的认识和从中总结出规律、经验。人类的知识是极其丰富与庞杂的,如何规律、经验。人类的知识是极其丰富与庞杂的,如何规范地描述这些认识、规律、经验,一直是人们所探讨范地描述这些认识、规律、经验,一直是人们所探讨的问题。至今还没有一个统一的格式,但常用的问题。至今还没有一个统一的格式,但常用 v K KF F十十R R十十C Cv模式来表达,其中;模式来表达,其中;K K表式知识项表式知识项(Knowledge)(Knowledge),F F表表事
19、实事实(Fact)(Fact),R R表示规则表示规则(Rules)(Rules),C C表示概念表示概念(Concepts)(Concepts)。这里的概念主要指术语的含义、规则的这里的概念主要指术语的含义、规则的语义说明等。语义说明等。 知识的系统化的组织与管理机制知识的系统化的组织与管理机制包括包括: v知识的结构化的存储。由于人类的知识太庞杂了,知识的结构化的存储。由于人类的知识太庞杂了,首先要对知识进行分类,再进行结构化处理,抽象首先要对知识进行分类,再进行结构化处理,抽象出来,以便能由计算机进行有效的存储,这要与所出来,以便能由计算机进行有效的存储,这要与所用的知识表示的方式结合起
20、来,在知识表示里大家用的知识表示的方式结合起来,在知识表示里大家可能已经知道了,但还要考虑知识库的存储结构,可能已经知道了,但还要考虑知识库的存储结构,在下面小节里将对此进行介绍在下面小节里将对此进行介绍。 技术工具(方法、硬件、软件、系统)包括技术工具(方法、硬件、软件、系统)包括:对知识库里存放的知识进行快速有效的查询与检索,对知识库里存放的知识进行快速有效的查询与检索,对用户提供行之有效的查询与检索工具,是知识库对用户提供行之有效的查询与检索工具,是知识库最基本的功能。还应考虑在查询中用户提出的各种最基本的功能。还应考虑在查询中用户提出的各种约束条件的处理,这个过程就包含了推理的因素,约
21、束条件的处理,这个过程就包含了推理的因素,所以有人把这称为所以有人把这称为“智能性查询智能性查询”。是有道理的。是有道理的。v对知识库进行增、删、改操作,这是知识库的生命对知识库进行增、删、改操作,这是知识库的生命力的体现。因为人类的知识的变化与更新是很频繁力的体现。因为人类的知识的变化与更新是很频繁的,对知识库里存放的知识进行增、删、改的操作的,对知识库里存放的知识进行增、删、改的操作是不可避免的,而且操作的次数还不会少,因此,是不可避免的,而且操作的次数还不会少,因此,向用户提供方便的增、删、改操作就显得特别重要向用户提供方便的增、删、改操作就显得特别重要了。了。 v在对知识库的增、删、改
22、操作过程中必然会发生矛在对知识库的增、删、改操作过程中必然会发生矛盾,即非一致性问题。还会出现知识的不完整性问盾,即非一致性问题。还会出现知识的不完整性问题,这就要进行一致性与完整性处理,这是保证知题,这就要进行一致性与完整性处理,这是保证知识库所提供知识的正确性、完整性的重要措施。识库所提供知识的正确性、完整性的重要措施。 对知识进行结构化处理的方法对知识进行结构化处理的方法v 引入引入“元规则元规则”(MetaRu1e)(MetaRu1e),即阐述规则的即阐述规则的规则,用来指导规则的存储;构成具有层次结构的规则,用来指导规则的存储;构成具有层次结构的规则库,以便于查询、检索和运用;规则库
23、,以便于查询、检索和运用;v 组成组成“树形结构树形结构”,如马里兰大学的,如马里兰大学的CSACSA系统,系统,将规则组成将规则组成“激发树激发树”;v 采用采用“树形结构树形结构”,如利用语义网络方法来表,如利用语义网络方法来表达和存储知识;达和存储知识;v适当地分类组织知识,如卡内基适当地分类组织知识,如卡内基 梅隆大学的梅隆大学的AMAM系系统,将数学核心概念知识以框架方式存放在事实库统,将数学核心概念知识以框架方式存放在事实库中;中;v 采用数据库技术,利用各种索引、目录、词典采用数据库技术,利用各种索引、目录、词典等技术,提高存储、检索效率等技术,提高存储、检索效率。 下面介绍的一
24、种规则连接表和谓词规则索引下面介绍的一种规则连接表和谓词规则索引技术的方法,就是一种在一阶谓词逻辑的表示形式技术的方法,就是一种在一阶谓词逻辑的表示形式下,利用关系数据库提供的存储与管理数据的功能下,利用关系数据库提供的存储与管理数据的功能来对规则、事实、概念进行有效管理的一种方法。来对规则、事实、概念进行有效管理的一种方法。v在一阶谓词逻辑中,谓词是最基本的语句表示单位,在一阶谓词逻辑中,谓词是最基本的语句表示单位,所有的规则和事实都是用谓词表达的。因此,通过所有的规则和事实都是用谓词表达的。因此,通过谓词将规则库和知识库联系起来,能改变知识库的谓词将规则库和知识库联系起来,能改变知识库的组
25、织化程度,提高知识检索的效率组织化程度,提高知识检索的效率。 v 假设知识库假设知识库KBKB中所有的谓词集合为中所有的谓词集合为P Pv (1) (1)事实库事实库FBFB可表示成:可表示成:v FBFBf(Pi)f(Pi), PiPi属于属于P Pv其中,其中,(f(Pi)(f(Pi)表示所有的以谓词表示所有的以谓词PiPi打头的事打头的事实;实;v (2)(2)规则库规则库RBRB可表示为:可表示为:v RBRB r(pir(pi) ;Pi) ;Pi属于属于 P Pv其中其中r(Pi)r(Pi)(Pi(Pi,ci1ci1,ci2ci2,cincin) )表表示以示以pipi为结论谓词,以
26、为结论谓词,以cilcil,ci2ci2,cincin为为条件谓词的一条规则:条件谓词的一条规则: vr(Pi)r(Pi)表示所有的以谓词表示所有的以谓词PiPi为结论谓词的规则;为结论谓词的规则;规定规则连接图的结点表示规则库中的一条规则。规定规则连接图的结点表示规则库中的一条规则。若若cici是规则是规则r(Q)r(Q)的一个条件谓词。并且的一个条件谓词。并且r(cir(ci) )属于属于RBRB,则在规则连接图中,从结点则在规则连接图中,从结点r(Q)r(Q)到结点到结点r(cir(ci) )画画条有向弧。这样,就可以建立起对应于规则库条有向弧。这样,就可以建立起对应于规则库RBRB的规
27、则连接图的规则连接图RcGRcG; ;同时,建立从结论谓词到规则同时,建立从结论谓词到规则的谓词规则索引,就可以一次性地快速检索出与的谓词规则索引,就可以一次性地快速检索出与某谓词有关的所有事实和规则。某谓词有关的所有事实和规则。 v根据这些谓词很容易从事实库中找出所有以根据这些谓词很容易从事实库中找出所有以它们打头的事实来。用这种方法,可以快速、它们打头的事实来。用这种方法,可以快速、一次性地找出所有与某谓词有关的事实和规一次性地找出所有与某谓词有关的事实和规则来。即使出现递归的情况,也不会影响算则来。即使出现递归的情况,也不会影响算法的正确性和效率,因此,这是一种非常有法的正确性和效率,因
28、此,这是一种非常有效的知识检索算法。效的知识检索算法。 知识库和知识库管理系统的功能知识库和知识库管理系统的功能v知识表示功能;应能提供用户一种或多种知识表示知识表示功能;应能提供用户一种或多种知识表示方法,目前已有的知识表示方法有谓词逻辑方法、方法,目前已有的知识表示方法有谓词逻辑方法、以框架为基础的知识表示方法、产生式规则、语义以框架为基础的知识表示方法、产生式规则、语义网络方法、脚本方法等等。常用的是谓词逻辑方法网络方法、脚本方法等等。常用的是谓词逻辑方法( (尤以一阶谓词逻辑用得最为普遍尤以一阶谓词逻辑用得最为普遍) )、框架方式和产、框架方式和产生式规则。生式规则。v 2 2对知识有
29、系统化的、组织管理机制,包括对知识有系统化的、组织管理机制,包括事实管理,规则管理,及概念管理,还有知识字典事实管理,规则管理,及概念管理,还有知识字典的管理工作。大容量知识的存储与管理是人们必须的管理工作。大容量知识的存储与管理是人们必须重视的。重视的。 v3 3知识库的操作:知识库的建立与撤消,知知识库的操作:知识库的建立与撤消,知识的插入、删除和修改,知识库的重组工作。识的插入、删除和修改,知识库的重组工作。 v4 4能向用户提供对知识项进行查问、检索的能向用户提供对知识项进行查问、检索的功能,例如功能,例如“知识查询语言知识查询语言”,还应能对用,还应能对用户的查询请求进行语法检查,并
30、给出出错信户的查询请求进行语法检查,并给出出错信息。将来,系统会用声、图、文的形式与用息。将来,系统会用声、图、文的形式与用户进行交互活功。户进行交互活功。v 5 5知识的获取与学习功能,知识的编辑功知识的获取与学习功能,知识的编辑功能,在获取新知识的过程中要对知识的完整能,在获取新知识的过程中要对知识的完整性、新旧知识的一致性进行处理。性、新旧知识的一致性进行处理。v 6 6知识库与知识库管理系统的维护与诊知识库与知识库管理系统的维护与诊断,包括日常的系统事务管理、出错处理等断,包括日常的系统事务管理、出错处理等等。等。v7 7知识库和知识库管理系统的安全控制用户知识库和知识库管理系统的安全
31、控制用户的使用权限管理。的使用权限管理。知识模型组件知识模型组件 “知识知识”与与“信息信息”紧密相关,我们说:一个患者紧密相关,我们说:一个患者体温达到体温达到39.039.0C C的事实是一条信息的事实是一条信息, ,但内科医生有但内科医生有相应的知识推断出是否患者发烧。从系统工程的观相应的知识推断出是否患者发烧。从系统工程的观点来看:知识最可能被看作是一种特殊类型的信息点来看:知识最可能被看作是一种特殊类型的信息,叫做,叫做“关于信息的信息关于信息的信息”。知识告诉我们关于特。知识告诉我们关于特定信息的事情。将知识整合到一个子类体系中,这定信息的事情。将知识整合到一个子类体系中,这通常会
32、成为知识建模的工具。两类之间子类链接提通常会成为知识建模的工具。两类之间子类链接提供这两类的信息。因此知识具有典型的供这两类的信息。因此知识具有典型的“关于关于”特特征:它告诉我们关于理解一些其他信息的方式:征:它告诉我们关于理解一些其他信息的方式: 四、知识系统的开发步骤v进入与知识建模相关的详细内容之前,我们先来看进入与知识建模相关的详细内容之前,我们先来看一个简单例子。试想一个提供贷款的财务应用。这一个简单例子。试想一个提供贷款的财务应用。这个领域中的两个类和其他一些典型属性如个领域中的两个类和其他一些典型属性如图图4.14.1 所所示。该图还表示了信息和知识的区别。示。该图还表示了信息
33、和知识的区别。信息通常是信息通常是一个某人一个某人X X 有一笔贷款有一笔贷款Y Y。我们用一个信息我们用一个信息typetype(类型)做这个信息的模型,在这个例予中,在类型)做这个信息的模型,在这个例予中,在personperson(人)和人)和loanloan(贷款)之间有贷款)之间有has_loanhas_loan(借借贷)关系。贷)关系。图中还包含被我们直觉地称为知识的三图中还包含被我们直觉地称为知识的三个陈述。例如,所有申请贷款者至少个陈述。例如,所有申请贷款者至少1818周岁。周岁。 知知识作为识作为“关于信息的信息关于信息的信息”的观点在这里得到支持。的观点在这里得到支持。这些
34、陈述告诉我们一些关于上面所列信息的一些情这些陈述告诉我们一些关于上面所列信息的一些情况。这些知识片断告诉我们关于人和贷款的一般信况。这些知识片断告诉我们关于人和贷款的一般信息,而不仅仅是关于特定的人息,而不仅仅是关于特定的人- -贷款实例。贷款实例。v v 借贷 人人年龄年龄收入收入贷款贷款数量数量利息利息v信息信息v JohnJohn有有$1750$1750贷款贷款vHarryHarry有有$2500$2500贷款贷款v知识知识v贷款人年龄至少满贷款人年龄至少满1818岁岁v收入达到收入达到$10000$10000的人可贷款的最高限额为的人可贷款的最高限额为$2000 $2000 v收入在收
35、入在$10000$10000到到$20000$20000之间的人贷款最高限之间的人贷款最高限额为额为$3000$3000知识模型知识模型v知识模型本身是一个帮助我们阐明知识知识模型本身是一个帮助我们阐明知识- -密集密集型信息型信息- -处理任务结构的工具。一个应用的知处理任务结构的工具。一个应用的知识模型可提供应用所需要的数据和知识结构识模型可提供应用所需要的数据和知识结构的规范说明。模型开发成为分析过程的一部的规范说明。模型开发成为分析过程的一部分。因此它在应用词汇中表示,包含领域分。因此它在应用词汇中表示,包含领域(如汽车、房屋、船舶)和推理任务(如评(如汽车、房屋、船舶)和推理任务(如
36、评估、配置、诊断)估、配置、诊断)两层意思两层意思。 组织模型任务模型主体模型知识模型通信模型设计模型可行性分析选择原任务,在任务和主体模型中进一步介绍知识密集型任务推理函数的需求规范说明交互函数的需求规范说明v知识模型在本质上与软件工程中传统分析模知识模型在本质上与软件工程中传统分析模型具有相似的结构型具有相似的结构.推理任务通过对函数或推理任务通过对函数或“过程过程”的层次分解来描述。功能操作的数的层次分解来描述。功能操作的数据和知识类型通过一个类似于数据模型或对据和知识类型通过一个类似于数据模型或对象模型的方案来描述。这些概念与其他现代象模型的方案来描述。这些概念与其他现代方法所采取的概
37、念在目的上是相似的。当然方法所采取的概念在目的上是相似的。当然也有许多关键的区别。也有许多关键的区别。 一个知识模型包括三部分一个知识模型包括三部分v每一部分包含一组相关的知识结构。我们将每一部每一部分包含一组相关的知识结构。我们将每一部分称为知识范畴。分称为知识范畴。v第一个范畴称为第一个范畴称为领域知识领域知识。这个范畴详细说明特定。这个范畴详细说明特定领域知识和在一个应用中我们所讨论的信息类型。领域知识和在一个应用中我们所讨论的信息类型。例如,一个涉及医疗诊断应用的领域知识将会包含例如,一个涉及医疗诊断应用的领域知识将会包含相关相关疾病、症状和检验疾病、症状和检验以及这些类型之间关系的定
38、以及这些类型之间关系的定义。一个领域知识的描述在某种程度上类似于软件义。一个领域知识的描述在某种程度上类似于软件工程中的工程中的“数据模型数据模型”或或“对象模型对象模型”。v知识模型的第二个范畴包含知识模型的第二个范畴包含推理知识推理知识。v推理知识描述了使用领域知识的基本推理步推理知识描述了使用领域知识的基本推理步骤。最好是将这些推理看作推理机的构件。骤。最好是将这些推理看作推理机的构件。在软件工程术语中,推理表示功能分解的最在软件工程术语中,推理表示功能分解的最低水平。在医疗诊断应用中的两个推理的例低水平。在医疗诊断应用中的两个推理的例子,是子,是将症状和某种可能疾病相联系的将症状和某种
39、可能疾病相联系的“假假设设”推理和用于确定某种特定疾病确实是引推理和用于确定某种特定疾病确实是引起所看到的症状的因素的试验的起所看到的症状的因素的试验的“检验检验”推推理理。 v知识模型的第三个范畴是知识模型的第三个范畴是任务知识任务知识。任务知识描述。任务知识描述一个应用所要达到的目标是什么以及如何通过将任一个应用所要达到的目标是什么以及如何通过将任务分解成子任务和推理来实现这些目标。这个务分解成子任务和推理来实现这些目标。这个“如如何何”包含了任务的动态行为描述,即它们的内在控包含了任务的动态行为描述,即它们的内在控制。例如,一个简单的医疗诊断应用制。例如,一个简单的医疗诊断应用可将可将D
40、IAGNOSISDIAGNOSIS(诊断)作为其最高层任务,并且认为诊断)作为其最高层任务,并且认为这个诊断可以通过一连串重复执行的这个诊断可以通过一连串重复执行的“假设假设”和和“检验检验”推理来实现。任务知识类似于软件工程中推理来实现。任务知识类似于软件工程中功能分解的较高水平,但还包含对相关功能的控制功能分解的较高水平,但还包含对相关功能的控制。 三个知识范畴的简要概括和每个范畴的一三个知识范畴的简要概括和每个范畴的一些实例知识元素些实例知识元素 任务知识 任务目标 诊断 任务分解 (任务) 任务控制推理知识 基本推理 假设 检验 角色 (推理) (推理)领域知识 领域类型 症状 疾病
41、检验 领域规则 (类型) (类型) (类型) 领域事实任务知识与任务方法任务知识与任务方法v推理总有一个推理总有一个“原因原因”。换句活说,知识的一个重。换句活说,知识的一个重要方面是我们想用它做什么。我们想应用知识达到要方面是我们想用它做什么。我们想应用知识达到什么目标?什么目标?v我们下面就提出知识的典型目标:我们下面就提出知识的典型目标: 我们想评估一个贷款应用,将损失的风险最小化。我们想评估一个贷款应用,将损失的风险最小化。 我们想找到复印机的故障原因,以尽快恢复服务。我们想找到复印机的故障原因,以尽快恢复服务。 我们想给新建筑设计电梯。我们想给新建筑设计电梯。v任务和任务方法可分别理
42、解为关于推理任务任务和任务方法可分别理解为关于推理任务的的“需要做什么需要做什么”和和“怎样做怎样做”。 v任务定义复杂推理功能。高层任务通常与任任务定义复杂推理功能。高层任务通常与任务模型中定义的任务一致。任务规范说明告务模型中定义的任务一致。任务规范说明告诉我们任务的输入和输出时什么。例如,医诉我们任务的输入和输出时什么。例如,医疗诊断任务的输出不是:疗诊断任务的输出不是:“疾病疾病”,而是类,而是类似似“错误范畴错误范畴”之类的抽象名称。之类的抽象名称。 diagnosisdiagnosisthroughgenerate-and-testcovercomparepreditobtain任
43、务任务方法推理传递函数分解知识模型模板知识模型模板 v1.1.任务摸板任务摸板v任务模板形成了一种有关模型元素的可复用组合的任务模板形成了一种有关模型元素的可复用组合的公共类型。公共类型。一个任务模板就是一个部分的知识模型,一个任务模板就是一个部分的知识模型,其中已经指定了推理知识和任务知识其中已经指定了推理知识和任务知识。任务模板给。任务模板给知识工程师提供解决某个问题的典型的推理和任务。知识工程师提供解决某个问题的典型的推理和任务。此外,任务模板还规定一种任务观点所要求的典型此外,任务模板还规定一种任务观点所要求的典型的领域模式。知识工程师可用任务模板作为一个新的领域模式。知识工程师可用任
44、务模板作为一个新应用的模板,进行支持自顶向下的知识分析。应用的模板,进行支持自顶向下的知识分析。 v2.2.任务类型任务类型v一般来说,当知识工程同软件工程相比时,一般来说,当知识工程同软件工程相比时,其优点就在任务类型的范围有限。在认知心其优点就在任务类型的范围有限。在认知心理学专著中给出了有关知识密集(人类)型理学专著中给出了有关知识密集(人类)型的推理任务的任务类型学。许多作者已经采的推理任务的任务类型学。许多作者已经采用并进行了细化以应用在知识工程中。用并进行了细化以应用在知识工程中。v我们将任务分成两类:分析(我们将任务分成两类:分析(analytic)任任务和综合(务和综合(syn
45、theic)任务。任务。v分析任务分析任务 一个很有名的分析任务类型就是一个很有名的分析任务类型就是classfication(分类)。分类)。 v 图图4.74.7所示的任务层次结构所示的任务层次结构知识密集型任务分析任务综合任务分类评估诊断预测监控设计规划分配配置设计建模调度分析任务类型一览分析任务类型一览 分析任务分析任务v分析任务分析任务 一个很有名的一个很有名的分析任务类型就是分析任务类型就是classfication(分类)分类)。这种任务类型的原。这种任务类型的原型例子是动物和植物的分类。在分类中,一型例子是动物和植物的分类。在分类中,一个对象需要用他所属的类别来描述其特征。个对
46、象需要用他所属的类别来描述其特征。基础知识通常为每一类别提供对对象特征值基础知识通常为每一类别提供对对象特征值的约束。分类经常涉及到的约束。分类经常涉及到“自然的自然的”(而不(而不是人造的)对象。是人造的)对象。 vDiagnosis(诊断诊断) 和分类的不同之处在于诊断想要和分类的不同之处在于诊断想要得到的输出是该系统的一个故障。该任务类型的一得到的输出是该系统的一个故障。该任务类型的一个例子是诊断某个电路网络中的故障。在诊断时,个例子是诊断某个电路网络中的故障。在诊断时,基础知识一般都包含于析系统行为的知识。例如一基础知识一般都包含于析系统行为的知识。例如一个因果关系模型。诊断的输出(故
47、障类别)有很多个因果关系模型。诊断的输出(故障类别)有很多种形式:它可以是一个故障组件,一个故障状态,种形式:它可以是一个故障组件,一个故障状态,一个因果关系链,甚至一个抽象的标签,而这个标一个因果关系链,甚至一个抽象的标签,而这个标签没有任何内部系统含义。诊断任务经常出现在技签没有任何内部系统含义。诊断任务经常出现在技术系统领域。术系统领域。 vAssessment(评估评估) 这个任务类型经常在财这个任务类型经常在财政和社会服务领域出现。政和社会服务领域出现。评估的目标是用一评估的目标是用一个决策的类别来描述一个案例的特征。个决策的类别来描述一个案例的特征。例如,例如,在贷款评估时,任务的
48、输入是一个关于某人在贷款评估时,任务的输入是一个关于某人申请贷款的案例,输出是一个诸如申请贷款的案例,输出是一个诸如“是否是否需要更多信息需要更多信息”之类的决策类别,以显示之类的决策类别,以显示是否给该人发放贷款。基础知识一般都包括是否给该人发放贷款。基础知识一般都包括一个用于评估的规范集或标准集。一个用于评估的规范集或标准集。 vmonitor(监控监控)时,被分析的系统具有动态的时,被分析的系统具有动态的性质,一般都有一个正在进行的过程。核电性质,一般都有一个正在进行的过程。核电厂监控和一个软件项目的监控都是监控任务厂监控和一个软件项目的监控都是监控任务的例子。的例子。每个监控周期看起来
49、都像一个评估每个监控周期看起来都像一个评估任务。任务。主要区别是在监控时,输出只是一个主要区别是在监控时,输出只是一个差异(系统是否工作正常?)差异(系统是否工作正常?)而不是一个决而不是一个决策类别。前一周期的数据可以用在新的周期策类别。前一周期的数据可以用在新的周期中。中。 v 虽然虽然 prediction (预测预测)有一些综合任务的特性,但有一些综合任务的特性,但是我们还是把他归于分析任务这一类。是我们还是把他归于分析任务这一类。在预测时,在预测时,可以分析现在的系统行为以便描述系统在将来某个可以分析现在的系统行为以便描述系统在将来某个时间点的状态。时间点的状态。天气预报就是一个预测
50、任务。预测天气预报就是一个预测任务。预测任务经常出现在教学系统(如物理学)的知识密集任务经常出现在教学系统(如物理学)的知识密集型模块中。与预测任务相反的任务也存在,即回推型模块中。与预测任务相反的任务也存在,即回推(retrodiction)大爆炸理论就是一个著名的例子。大爆炸理论就是一个著名的例子。 综合任务综合任务v综合任务综合任务 design(设计)就是一个综合任务,其设计)就是一个综合任务,其中要构建的系统是一些物理制品。设计任务的一个中要构建的系统是一些物理制品。设计任务的一个例子是设计一辆汽车。例子是设计一辆汽车。设计任务一般包括组件的创设计任务一般包括组件的创造性设计造性设计
51、,就像汽车设计一样。创造性设计对现在,就像汽车设计一样。创造性设计对现在的知识技术来说是个非常难解决的问题。为了使系的知识技术来说是个非常难解决的问题。为了使系统构建可行,我们假设制品所有的组件预先定义好统构建可行,我们假设制品所有的组件预先定义好了这种设计的子类型称为配置设计(了这种设计的子类型称为配置设计(configuration design).用一系列用一系列Lego 木块造一条船就是一个配木块造一条船就是一个配置设计的任务的著名例子。另外一个例子是计算机置设计的任务的著名例子。另外一个例子是计算机系统的配置。系统的配置。 vassignment(分配)分配)是一个相对比较简单的是一
52、个相对比较简单的综合任务,综合任务,其中有两个对象集,我们需要在其中有两个对象集,我们需要在它们之间建立一个(部分的)映射。比如给它们之间建立一个(部分的)映射。比如给职员分配办公室、给飞机分配跑道都是分配职员分配办公室、给飞机分配跑道都是分配的例子。分配必须同约束保持一致(的例子。分配必须同约束保持一致(“波音波音747”不能放在不能放在3538的跑道上),也要符的跑道上),也要符合偏好(荷兰航空公司的飞机应该停靠在航合偏好(荷兰航空公司的飞机应该停靠在航空集散站空集散站1)。)。 vplanning(规划)有许多和设计一样的特性,规划)有许多和设计一样的特性,主要区别在于所构建的系统类型。
53、设计主要主要区别在于所构建的系统类型。设计主要关注物理对象的构建,而关注物理对象的构建,而规划则关注活动和规划则关注活动和它们的时间依赖性它们的时间依赖性。规划任务的例子有旅行。规划任务的例子有旅行规划和建筑活动的规划。而且,规划任务的规划和建筑活动的规划。而且,规划任务的自动化只有在基本的规划都预先定义好了才自动化只有在基本的规划都预先定义好了才可行。因为它们之间存在相似性,所以设计可行。因为它们之间存在相似性,所以设计模型有时能用于规划,反之亦然。模型有时能用于规划,反之亦然。 vscheduling (调度)调度) 经常放在规划之后经常放在规划之后。规划交。规划交付一系列活动;付一系列活
54、动; 在调度时,需要在一定的时间间隔在调度时,需要在一定的时间间隔里给这些活动(里给这些活动(“作业作业”)分配好资源。输出是一)分配好资源。输出是一个在活动和时间槽之间的映射,同时遵守约束(个在活动和时间槽之间的映射,同时遵守约束(A 必须在必须在 B 之前)而且尽可能满足偏好(之前)而且尽可能满足偏好(C 的讲座更的讲座更适合安排在星期五)因此,调度同分配有密切的关适合安排在星期五)因此,调度同分配有密切的关系,主要的区别在于调度具有面向时间的特征。调系,主要的区别在于调度具有面向时间的特征。调度的例子有大学某个系的讲座调度和某工厂生产线度的例子有大学某个系的讲座调度和某工厂生产线的工作的
55、工作休息调度。休息调度。 v为了保持完整性,我们把为了保持完整性,我们把 modelling(建模)也作建模)也作为一种综合任务。为一种综合任务。在建模时,我们构建一个系统的在建模时,我们构建一个系统的抽象描述以便解释和预测该系统的属性或现象抽象描述以便解释和预测该系统的属性或现象。知。知识建模本身就是建模任务的一个例子。另外一个例识建模本身就是建模任务的一个例子。另外一个例子是构建一个核事故的模拟模型。建模任务很少在子是构建一个核事故的模拟模型。建模任务很少在系统中自动运行,但是有时也用在知识管理的语境系统中自动运行,但是有时也用在知识管理的语境中。中。 我们所涉及的一个实际例子是构建一个核
56、事故我们所涉及的一个实际例子是构建一个核事故模拟领域退休专家的建模专门技术的知识模型。模拟领域退休专家的建模专门技术的知识模型。 分类分类v目标目标 分类主要是为一个对象确定正确的类别(或分类主要是为一个对象确定正确的类别(或者种类)。对象能够用于检查。分类以对象的特征者种类)。对象能够用于检查。分类以对象的特征为基础。为基础。v典型例子典型例子 苹果的分类。一块岩石中矿物质的分类苹果的分类。一块岩石中矿物质的分类v术语术语 对象:要找到类别或种类的那个物体,对象:要找到类别或种类的那个物体,比如某个苹果。比如某个苹果。v类别:类别:一组特征相似的对象,比如一种一组特征相似的对象,比如一种Gr
57、annySmithGrannySmith苹果。苹果。v属性属性:一个能被观察或推测的特征,比如苹果的颜:一个能被观察或推测的特征,比如苹果的颜色。色。v特性:特性:某个对象具有的一个属性某个对象具有的一个属性-值对,如值对,如“颜色颜色绿色绿色” v输入输入 需要确定类别的对象。需要确定类别的对象。v输出输出 找到的类别。找到的类别。v特性特性 分类是最简单的分析任务之一,并包含了许分类是最简单的分析任务之一,并包含了许多方法。其他的分析任务有时可以简化为一个分类多方法。其他的分析任务有时可以简化为一个分类问题。尤其是诊断任务经常可以进行这样的简化:问题。尤其是诊断任务经常可以进行这样的简化:
58、完整的诊断需要关于因果行为的知识,但是如果将完整的诊断需要关于因果行为的知识,但是如果将它简化为症状和故障的直接关联,它就可以被看成它简化为症状和故障的直接关联,它就可以被看成是一个分类问题。是一个分类问题。 v默认方法默认方法 首先要做的一个决定是是否选择一首先要做的一个决定是是否选择一种数据驱动或者方案驱动的方法。数据驱动种数据驱动或者方案驱动的方法。数据驱动的方法从一些初始特性开始,这些特征用来的方法从一些初始特性开始,这些特征用来产生一组候选方案。方案的驱动方法从所有产生一组候选方案。方案的驱动方法从所有可能的方案集合开始,然后在所收集的信息可能的方案集合开始,然后在所收集的信息的基础
59、上尽量简化这个集合。的基础上尽量简化这个集合。 指定属性指定属性 v专家们一般可以提供这种类型的属性顺序信息专家们一般可以提供这种类型的属性顺序信息。规。规范知识则以一棵决策树的形式呈现。更复杂范知识则以一棵决策树的形式呈现。更复杂的方法是计算有最高信息潜能的属性。有许的方法是计算有最高信息潜能的属性。有许多用于该方法的算法。最后一种方法非常有多用于该方法的算法。最后一种方法非常有效,但是可能导致与用户和专家相悖的系统效,但是可能导致与用户和专家相悖的系统行为(虽然在理论上是最优的)。行为(虽然在理论上是最优的)。 对象属性候选真值特性产生匹配指定获取v获取特性获取特性 一般要让用户输入一个一般要让用户输入一个“未知未知”值。有值。有时,也有领域知识建议某些属性应该一起或得。时,也有领域知识建议某些属性应该一起或得。v匹配匹配 这个推理要为每一个候选方案执行,并产这个推理要为每一个候选方案执行,并产生一个真值来指示候选类别是否与收集到的信息保生一个真值来指示候选类别是否与收集到的信息保持一致。该推理应该能处理关于某些属性的持一致。该推理应该能处理关于某些属性的“未知未知”值。标准的方法是每一候选方案都与一个值。标准的方法是每一候选方案都与一个“未知未知”值保持一致。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度展览馆场地租赁合同范本11篇
- 二零二五年度环保型民爆物品供应商合作协议4篇
- 2025年度电梯安装与绿色建筑认证合作协议4篇
- 头皮护理产品配方优化-深度研究
- 2024版酒店物业综合服务合作合同版B版
- 2025年度商场店面窗帘改造合同3篇
- 2025年度新型木材绿色采购与销售合同范本4篇
- 2025年度智能储罐租赁服务合同模板4篇
- 二零二五年度商业地产物业管理与品牌合作合同4篇
- 二零二五版门卫信息化服务与安保培训承包3篇
- 南安市第三次全国文物普查不可移动文物-各乡镇、街道分布情况登记清单(表五)
- 选煤厂安全知识培训课件
- 项目前期选址分析报告
- 急性肺栓塞抢救流程
- 《统计学-基于Python》 课件全套 第1-11章 数据与Python语言-时间序列分析和预测
- 《形象价值百万》课件
- 红色文化教育国内外研究现状范文十
- 中医基础理论-肝
- 小学外来人员出入校门登记表
- 《土地利用规划学》完整课件
- GB/T 25283-2023矿产资源综合勘查评价规范
评论
0/150
提交评论