(应用数学专业论文)亲属关系逻辑推理专家系统的研究.pdf_第1页
(应用数学专业论文)亲属关系逻辑推理专家系统的研究.pdf_第2页
(应用数学专业论文)亲属关系逻辑推理专家系统的研究.pdf_第3页
(应用数学专业论文)亲属关系逻辑推理专家系统的研究.pdf_第4页
(应用数学专业论文)亲属关系逻辑推理专家系统的研究.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

(应用数学专业论文)亲属关系逻辑推理专家系统的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

妒 7 3 9 二0 6 河南大学研究生硕士学位论文第i 页 摘要 专家系统是一种具有特定领域内大量知识与经验的程序系统,它应用人工智 能技术,通过模拟人类专家求解问题的思维过程来求解领域内的各种问题,其水 平可以达到甚至超过人类专家的水平。现在它已成为人工智能研究中最活跃的领 域之一。其发展促进了人工智能基本理论和技术的研究与发展。 亲属关系与人们的社会牛活联系非常密切,它的表达形式多样化。本文基于 专家系统,研究亲属关系的推理。准确地提取亲属关系知识,正确地分析用厂1 的 意图,恰当地回答用户各种形式的提问,是本文的研究重点。 作者的创新性工作主要有: 1 介绍了决定亲属关系的五种亲属因子渭词,它们既可以表示个体之间的联 系,又可以表示亲属关系知识。并根据常见的亲属关系,总结了近六十种谓词规 则。 2 根据普通的亲属关系表达形式的分析,提出了亲属关系知识获取的方法, 包括自动知识获取和非自动知识获取相结合。亲属关系知识经知识获取后可以分 解为亲属园子谓词实例和结论谤词实例。并设计了自学习策略。 3 作者设计了亲属关系的推理机制,并对三种常见的逻辑推理类型提出了有 效的算法:顺向链式推理、逆向链式推理和混合链式推理。这些推理算法可以解 决大部分亲属关系的求解问题。 4 亲属关系知识可以存储入知识库,作者设计了库结构,构造了亲属关系逻 辑推理专家系统的模型及本系统的计算机处理流程。 关键词;专家系统;逻辑推理;知识获取:亲属关系 第1 i 页河南大学硕士研究生学位论文 a b s t r a c t t h ee x p e r t s y s t e m ( e s ) i s ak i n do fs o f t w a r e s y s t e m w h i c hi n c l u d e sl o t so f k n o w l e d g ea n de x p e r i e n c ei ne s p e c i a lf i e l d s i ta p p l i e sa r t i f i c i a li n t e l l i g e n c e ( a i ) t e c h n o l o g ya n d s i m u l a t e st h e t h i n k i n gp r o c e s s o f h u m a n e x p e r t st os o l v ep r o b l e m si n s o m ef i e l d s ,t h ec a p a b i l i t yo f w h i c hc a na p p r o a c ha n de v e ne x c e e dt h a to f h u m a n e x p e r t s e sb e c o m e s o n eo f t h em o s ta c t i v ef i e l d so f a i r e s e a r c h ,w h i c ha c c e l e r a t e s d e v e l o p m e n t o ft h eb a s i ct h e o r ya n d t e c h n o l o g y o f a i t h ek i n d r e d r e l a t i o n s h i p ( k r ) c o n t a c t sc l o s e l yw i t hp e o p l e ss o c i a ll i f e ,a n dt h e r e a l ea l lk i n d s o f e x p r e s s i o n so f k r t h i sp a p e rs t u d i e st h er e a s o n i n go f k r b a s e do ne s , a n d e m p h a s i z e sh o w t oc o r r e c t l y a c q u i r ek n o w l e d g e f r o mas e n t e n c ew h i c hc o m e sf r o m au s e r , a n a l y z et h ei n t e n t i o no f t h eu s e r , a n da n s w e ra l lk i n d s o f q u e s t i o n s f r o mt h eu s e l t h ea u t h o rh a ss o m ee r e a t i v ew o r k s 器f o l l o w s : a c c o r d i n g t oc o m m o nk 艮t h ea u t h o r p r o p o s e sf i v ek rg e n ep r e d i c a t e sw h i c h d e c i d ek ra n ds t i l lc a n e x p r e s sb o t hr e l a t i o n s h i po f i n d i v i d u a l sa n d k r k n o w l e d g e a l s oa b o u t s i x t yp r e d i c a t er u l e s a r e b r o u g h t f o r w a r d am e t h o do f k r k n o w l e d g ea c q u i s i t i o ni si n t r o d u c e da c c o r d i n g t oe x p r e s s i o n f o r m so f k r ,w h i c hi n c l u d e sb o t ha u t o m a t i ck n o w l e d g ea c q u i s i t i o na n dn o n - a u t o m a t i c k n o w l e d g ea c q u i s i t i o n t h ea c q u i r e dk rk n o w l e d g e i sc h a n g e di n t ok r g e n ep r e d i c a t e s i n s t a n c e sa n dc o n c l u s i o np r e d i c a t e si n s t a n c e s s e l f - l e a r n i n gs t r a t e g yi sp r o v i d e d t h ew r i t e rd e s i g n sk r r e a s o n i n gm e c h a n i s m ,a d v a n c e s t h r e ek i n d so f e f f i c i e n t a r i t h m e t i ca c c o r d i n gt oc o m m o n r e a s o n i n gt y p e s :p o s i t i v el i n kr e a s o n i n g ,n e g a t i v el i n k r e a s o n i n g ,c o m b i n e d l i n kr e a s o n i n g t h e s ea r i t h m e t i cc a r ls o l v em a n y p r o b l e m s t h ek r k n o w l e d g e c a nb es t o r e di n t ok n o w l e d g eb a s e ,a n dt h ep a p e rd e s i g n st h e s t r u c t u r e so fs o m ek i tk n o w l e d g eb a s e sa n dp u t su pt h em o d e lo f k r l o g i c a lr e a s o n i n g e x p e r ts y s t e ma n dc o m p u t e r - p r o c e s s i n g k e y w o r d s :e x p e r ts y s t e m ;l o g i c a lr e a s o n i n g ;k n o w l e d g ea c q u i s i t i o n ; k i n d r e d r e l a t i o n s h i p : 河南大学研究生硕士学位论文第1 页 1 1 论文研究的背景 第1 章绪论 专家系统是一种具有特定领域内大量知识与经验的程序系统,它应用人工智 能技术,模拟人类专家来求解问题的思维过程求解领域内的各种问题,其水平可 以达到甚至超过人类专家的水平。 专家系统是人工智能研究领域的一个重要分支。自从1 9 6 8 年美国斯坦福大学 的费根鲍姆( e a f e i g e n b a u m ) 等人研制成功第一个专家系统d e n d r a l 以来,专 家系统技术已经获得了迅速发展,广泛地应用于医疗诊断、图象处理、石油化工、 地质勘探、金融决策、实时监控、分子遗传工程、教学、军事等多种领域,产生 了巨大的社会效益和经济效益,同时也促进了人工智能基本理论和基本技术的研 究与发展。目前,它已成为人工智能中一个最活跃且最有成效的研究领域。 专家系统一般具有以下特征:具有专家水平的专门知识,能进行有效的推理, 具有获取知识的能力,具有交互性,实用性,并具有一定的复杂性和难度m 1 。 本文设计的亲属关系推理系统模型正是基于专家系统,应用其基本理论和技 术,对于常见的亲属关系加以研究,并能够提取常见的亲属关系知识,通过推理 过程可以回答一些常见的问题。 1 2 国内外研究现状和发展趋势 1 2 1 研究现状和发展趋势 随着人工智能研究的深入发展,专家系统技术也取得了长足的进步。2 0 世纪 7 0 年代中期以前的专家系统多属于解释型和故障、疾病诊断型,它们所处理的问 题基本上是可分解的问题。7 0 年代后期相继出现了其它类型的专家系统,如设计 第2 页河南大学研究生硕士学位论文 型、规划型、控制型等。这期间,专家系统的体系结构也发牛了深刻的变化,由 最初的单一知识库及单推理机发展为多知识库及多推理机,由集中式专家系统 发展为分布式专家系统【4 l 。近几年来随着人工神经网络研究的再度兴起,人们开始 研制神经网络专家系统以及把符号处理与神经网络相结合的专家系统【4 9 1 。 我国在专家系统的研制开发方面虽然起步较晚,但也取得了很好的成绩。例 如:中国科学院合肥智能机械所开发的旅肥专家系统,南京大学开发的新构造找 水专家系统,吉林大学开发的勘探专家系统及油气资源评价专家系统,浙江大学 开发的服装剪裁专家系统及花布图案设计系统等都取得了明显的经济效益及社会 效益,对推动专家系统与人工智能理论及技术的研究起到了重要作用【2 4 】【4 们。 近些年来,随着机器学习研究的进展,人们逐渐用半自动方式取代原来的手 工方式,提高了知识获取的速度与质量。在知识表示及推理方面,也已由原来的 精确表示及推理或较简单的不精确模型发展为多种不确定性处理理论,建立了分 别适用于不同情况下的不确定性推理模型,对非单调推理、归纳推理等也都开展 了研究。取得了一定的进展【2 4 】f 3 9 】。 社会人物关系错综复杂,其中亲属关系与人们的生活联系最密切。各个家庭 之间因婚姻、血缘而产生了各种复杂的亲属关系,需要对其进行分析和研究嘲【3 3 】。 近年来,国内外研究机构针对亲属关系开展了相关的研究。国外丰要是在亲 属范围内对一个家族的人物关系网进行研究,调查一些知名人物,包括与对他们 同姓且有血缘或姻缘关系的人物”,注重研究人物历史。由于文化的差异而造成语 言中表示亲属关系的词汇相对来说比中国要少得多,也没有中国更细致地区分【5 ”。 围内主要是在一定文化背景的角度下研究某些人物的亲属关系,中国人不习 惯笼统的亲属关系词,往往需要把它们加以更加细致地区分。在中国人看来,英 语的亲属关系词不能准确地表达人们相互之间的关系疏密程度,所以汉语中有许 多称呼来指各种具体的关系。困内的研究以家族的家谱、亲属的历史变迁及人物 历史居多,而且研究样本大多以红楼梦中的四大家族人物关系为例。另外, 河南大学研究生硕士学位论文第3 页 还有一些研究的角度是从家谱( 系谱、家系、宗谱) 的角度来研究某一姓氏的起 源、发展、现状等。如:中国家谱信息网( w w w j p w z c o m ) 对此开展了系列的研 究,其中包括姓氏起源,家谱谱籍,寻根问祖,大陆寻亲等,构成了中华民族传 统文化的一个重要组成部分。 与专家系统技术相结合的亲属关系研究却是刚刚起步,中科院有人研究红 楼梦中四大家族的人物关系。不过他们的研究在于针对特定家族【4 7 】【5 6 】。利用的 是已处理好的格式化的文本知识,没有与知识库相结合,不具有普遍性,表示能 力相对来说较为单一。 1 2 2 存在的主要问题 知识获取一直是专家系统建造的一个瓶颈问题,软件工作者为了开发一个专 家系统,几乎要从头学习一门新的专业知识,大大延长了开发周期,而且还不能 完全保证知识的质量,对知识库的维护也带来诸多不便1 2 】。 当然,专家系统在其发展过程中还存在其它有待解决的问题。如,知识的完 备性问题,深层知识的表示与利用问题,分布式知识的处理问题,多专家的合作 与综合问题,常识性知识的推理问题等。这些问题有待于人工智能其它研究领域 的共同发展。 在国外及国内的亲属关系研究中,着重于对历史人物亲属关系的调查与记录, 主要是沿着血统关系寻找感兴趣的研究对象。在研究过程中只是简单地把事实保 存起来,没有与专家系统技术相结合,不能进行推理。这样会产生很多冗余的数 据,不利于进行智能查询。如果用户换一种提问方式,就可能无法回答用户的问 题,必须借助人工查找的方式。 1 3 本文的研究工作 一阶谓词演算表示法是人工智能技术中的一种知识表示方法。对解决类似亲 第4 页河南大学研究生硕士学位论文 属关系问题提供了新的思路。作者构造出一个亲属关系推理的系统模型【饥,以一阶 填词演算的形式来表示亲属知识,定义了亲属关系与亲属称谓,提出了亲属因子 谓词,总结了谓词规则。能够从用户提供的简单事实句子中提取相关的亲属关系 知识,对虚拟个体、夫妻合一现象作了阐述,并对几种常见的亲属关系问题进行 分析,利用一阶谓词演算进行推理,并提供了有效的相关推理算法【2 l 。 本文结合自然语言理解技术【40 1 ,以专家系统为原型,以对话系统龇6 删为目标, 研究普通的亲属关系,总结出人物之间的亲属关系规则,结合p r o l o g 系统技术【2 6 】, 进行有益的探索。 1 4 本文的内容安排 本文的内容安排如下: 第1 章绪论部分 本章介绍了困内外关于专家系统及亲属关系的研究进展情况和本文的研究工 作。 第2 章亲属关系逻辑推理专家系统的模型 木章定义了亲属关系、亲属因子谓词、谓词规则等几个重要概念,构造了亲 属关系推理系统的模型及本系统的计算机处理流程。 第3 章亲属关系的知识表示及自学习 本章讨论了关于亲属关系的知识表示方法,尤其是一阶谓词演算表示法,对 亲属关系的知识库作了设计,重点介绍知识获取和自学习功能。 第4 章亲属关系的逻辑推理机制与算法 本章详细介绍了作者提出的亲属关系推理机制,并对三种常见的推理类型提 出了有效的算法:顺向链式推理、逆向链式推理和混合链式推理。对推理中遇到 的二义性策略作了简单讨论。 河南大学研究生硕士学位论文第5 页 第5 章亲属关系推理系统的实现及应用 本章介绍了亲属关系推理系统中用到的两种关键技术:s q l 查询技术和 p r o l o g 语言。重点介绍了一个具体的亲属关系实例在本亲属关系推理系统环境下的 实现过程,并提供了本系统在儿童自然语言对话智力玩具和家谱管理方面的应用。 第6 页河南大学研究生硕士学位论文 第2 章亲属关系推理系统的模型 2 1 亲属关系推理系统的有关定义 为了恰当地描述作者所做的研究工作,本文提出了如下定义: 定义2 1 1 亲属:是指跟自己有血统关系或婚姻关系的人f 2 3 1 1 5 7 。 定义2 1 2 亲属关系:一个人如果是另外一个人的亲属,那么他们之间的关系 表现为亲属关系。比如:预个人之间可以是堂兄弟、表姐妹、夫妻、父子、母女 等亲属关系中的一种。 定义2 1 3 个体:指在亲属关系中的一个研究对象,是某个具体的人。 定义2 1 4 群体:指满足某种亲属关系的多个个体的集合,如:某个体的孩子、 兄弟、姑姑等,他们可能不止是一个个体而是多个个体的集合。 文献【1 9 】中指出,称呼是从表示亲属关系的名词里派牛出来的一种亲属间的行 为,和礼貌等意义相同。 定义2 1 5 亲属称谓:是指具有亲属关系的两个个体中,其中一个个体对另一 个个体的称呼,且每种称呼是标准化的,唯一的。如:一个个体可以称呼对方为: 爷爷、妈妈、哥哥、妹妹等其中之一。而“妈妈”有的地方也以“妈眯”、“母亲”、 “娘”等同义形式来代替,在本文统一以“妈妈”来表示这种亲属关系。亲属称 谓是亲属关系的一种具体表现形式。 定义2 1 6 亲属因子:指的是决定两个个体之间构成亲属关系的性别、婚姻、 亲子( 指两个个体具有矗系血统) 和大小等因素。 定义2 1 。7 亲属因子渭词:是指描述个体性别,及描述两个个体之间婚姻、亲 子、大小亲属因子的一阶原子谓词。 设x 和y 表示两个个体人名,大写字母组合表示一阶原于谓词。这五种亲属因 河南大学研究生硕士学位论文第7 页 子谓词的含义如下: ( 1 ) m a l e ( x ) 表示x 的性别是男性。 ( 2 ) f e m a l e ( x ) 表示x 是女性。 ( 3 ) m a r r a g e ( x ,y ) 表示x 和y 有婚姻关系,x 为男性,y y 0 女性。 ( 4 ) c h i l d ( x ,y ) 表示x 和y 有亲子关系,u r j x 是y 的孩子,x 可能是男性 或女性,y 为男性。 ( 5 ) e l d e r ( x ,y ) 表示x 与y 之间的大小关系,x 比y 年龄大。 这些谓词清晰地描述了亲属因子。亲属因子谓词可以用来表示亲属知识。 定义2 1 8 谓词规则:形女i i a :- b l a b 2 a a b q ( q 三1 ) 的表达式为谓词规则, 其中a 代表一个一阶原子谓词,b 。( 1 兰i 乌) 代表亲属因子滑词。它表示的含义是, 如果b i a b z a a b 。成立,那么a 也是成立的。如: b a b a ( x 。y ) :m a l e ( x ) 八c h i l d ( y ,x ) 上式表示,如果x 是男性,且y 是x 的亲予,那么x 是y 的爸爸。 又如:g e g e ( x ,y ) :- m a l e ( x ) a c h i l d ( x ,p ) a c h i l d ( y ,p ) 八 e l d e r ( x ,y ) 上式表示,如果x 是男性,x 是p 的亲子,y 也是p 的亲子,上k x l b y 大,那么x 是y 的哥哥。 定义2 1 9 条件谓词:是指在谓词规则中的b i a b 2 八a b 。( q 1 ) ,它们构成 了谓词规则中的条件部分,称为条件谓词。条件谓词在p r o l o g 语言中也称为h o m 子旬。如: m a l e ( x ) 八c h i l d ( y ,x ) m a l e ( x ) a c h i l d ( x ,p ) a c h i l d ( y ,p ) a e l d e r ( x ,y ) 定义2 1 1 0 结论谓词:指的是在淆词规则中与每一个条件谓词对应的a ,卸结 论部分,故称为结论谓词。每个结论谓词皆对应一个标准的称谓。如: b a b a ( x ,y ) 对应“爸爸”,g e g e ( x ,y ) 对应“哥哥”。 第8 页河南大学研究生硕士学位论文 分析人们在询问亲属关系时常用的句式,可以归结为以下三类具有普遍性的 问题: 1 已知两个相关个体的名字,求解以下问题: ( 1 ) 个体l 对个体2 的称谓? ( 2 ) 个体2 对个体1 的称谓? ( 3 ) 个体1 与个体2 之闻的亲属关系? 如: 刘强叫刘刚什么? 刘刚叫刘强什么? 刘刚与刘强是什么关系? 2 已知一个个体的名字和相关的亲属关系,求另一个群体的姓名。 如: 刘运龙的儿子是谁? 刘刚的弟弟是谁? 3 已知一个个体的名字,求与其相关的亲属关系及个体。 刘强有哪些亲属啊? 本文重点处理前两类问题。作者设计了一个“亲属关系逻辑推理专家系统” 模型,然后给出该模型下的知识库结构,最后讨论系统的移植和扩充性。 为叙述方便,本文有时把“亲属关系逻辑推理专家系统”简称为“亲属关系推 理系统”。 2 2 亲属关系推理系统的体系结构 专家系统的结构无论怎样变化,其基本组成皆如图2 1 所示: 河南大学研究生硕士学位论文第9 页 图2 - 1 专家系统的基本结构 在这个基本结构中,最核心的部分是推理机和知识库,这是任何专家系统都 不可缺少的。推理机反映专家的思维、解题过程,它在知识库上操作,利用这些 知识束分析问题数据并得到相应的结论。知识库存储了系统所必备的知识,需要 知识库管理系统的支持,它的主要功能是对知识进行检测,是否有冗余或矛盾等, 还可以进行知识检索。知识获取是知识工程的瓶颈,是获取知识的途径和方法, 按获取知识的自动化程度可分为自动知识获取和非自动知识获取。解释器向用户 解释推理结果和在推理过程中发生的一切。界面主要指的是图形和自然语言接口。 网络接口是面向计算机网络中其它节点的通道,这些节点可以是数据库、知识库 或别的专家系统。这些部分组成了专家系统的基本结构。 研究亲属关系,从用户给出关于亲属关系的句子提问开始,至得出合理答案 结束。作者设计了一个问题求解的推理系统模型,该推理系统模型主要包括以下 各部分i 5 5 1 : 1 。词法分析子系统 2 句法与语义分析子系统 3 知识获取子系统 4 控制予系统 5 知识存储子系统 6 推理子系统 第1 0 页河南大学研究生硕士学位论文 7 应答子系统 系统各部分之州的关系如下图2 2 所示i 1 。 系统在进行处理时。涉及到亲属关系知识库中的些主要数据表,如图2 2 右 部所示,具体参见第三章第三节相关部分内容。 本系统推理模型还可以进行扩充,使之能够处理更加复杂的亲属关系问题, 并且由于做到了数据与程序相分离,具有良好的可移植性。 l r 一i 控制子系统+ i是需要自学 n i爿? i y 知识存储 。开始 词法分析j 心答生成 “结束1 自然语言理解通用知识库1 1 切分标注c u t b 2 重叠词r e p e a t b 3 前后缀a f f i x b; 4 词类共现矩阵c l a s s b1 5 其它知识库1 亲属关系知识库 1 亲属因子知识库i n t a b 2 ,亲属事实知识库c o m p b 3 谓词规则库p r e d b 4 域名标识符库f i e l d i d b 5 同义词库s y n o b 2 6 反义称谓库s y m m b 7 句子知识模板库s e n t b 8 应答模板库a n s w e r b 9 应用领域分词库d c u t b 1 0 个人信息库p e r s o n b 图2 - 2 亲属关系推理系统模型 河南大学研究生硕士学使论文第1l 页 2 3 亲属关系推理系统的处理流程 本推理系统各个部分工作的丰要流程如下: 1 词法分析子系统 对用户的句子进行词语切分词性标注,把一个句子切分成一个个的词,然后 根据词在句子中的位置标注词性口0 1 2 7 1 。利用h e n u 汉语自动分词软 牛,对用户的 句子进行处理。 2 句法与语义分析子系统 句法分析是对切分过的句子进行处理,去掉无用信息和虚词,对同义概念替 换,指代消解,省略句补充【2 2 】【4 4 】【5 1 1 1 5 5 1 。 语义分析是指根据语义规则,把非标准的句子转换为如下标准形式【4 2 】: l l l l + 1 1 1 2 + n ( 如:刘刚是刘强的哥哥) ,n r i ,n r 2 表示姓名的名词,n 表示亲属关系 或称谓的名词。 这部分分析的结果以链表形式存储,丰要存储的是个体与他们之间的亲属关 系。 3 知识获取子系统 对描述亲属关系的句子事实部分,提取亲属关系知识,存储于集合r s ,然后 根据知识提取算法,获取相关的亲属因子知识,临时存储于集合k s 中。 4 控制子系统 根据自学习策略,判断提取的知识是否只是临时存储到集合k s 9 ,还是永久 存入知识库中,并调用相关的算法。 5 知识存储子系统 建立基于关系的亲属关系知识库。把集合k s 中的亲属因子谓词实例转化为 记录的形式存储入亲属因子知识库i n t a b 中,把集合r s 中的亲属事实知识存储入亲 属事实知识库c o m p b 。 第12 页河南大学研究生硕士学位论文 6 推理子系统 根据对亲属关系提问目标的分析,求解时均应当先在亲属事实知识库e o m p b 查询是否有符合条件的知识。如果有就可以直接绘出答案,否则就应当调用下面 的相关算法: 如果已知两个个体,求解他们之间的亲属关系,则需要进行顺向链式推理。 如果已知一个个体和称谓,求解相关的群体,则要用到逆向链式推理。 如果己知一个个体,求孵具有亲属关系的群体,则要用到混合链式推理。 其中逆向链式推理的算法思想在本文中也用作提取亲属关系知识。 7 应答子系统 根据推理结果和用户的提问句型,模拟人回答问题的习惯。生成答句,完成 一次人机问答的处理过程【5 8 】。 2 4 本章小结 本章定义了系统中用到的亲属关系,亲属因子谓词,谓词规则等几个概念 给出了亲属关系推理系统的模型及本系统在计算机中的处理流程3 1 。 河南大学研究生硕士学位论文第1 3 页 第3 章亲属关系的知识表示及知识获取 3 1 知识及知识表示方法 3 1 1 知识的有关概念 知识是人们在长期的生活、实践、科学研究及实验中积累起来对客观世界的 认识与经验,是人们总结出来的带有规律性的东西。一般认为,知识是经过j 3 n 7 - 的信息。从知识库的观点来看,知识是某论域中所涉及的有关方面、状态的一种 符号表示。 一个智能程序高水平的运行需要有关的事实知识,规则知识,控制知识和元 知识。 事实知识:是有关问题环境的一些事物的知识。常以“是”的形式出现。 如,事物的分类、属性、事物间关系、科学事实、客观事实等。 规则知识:是有关问题中与事物的行动、动作相联系的因果关系知识,是动 态的,常以“如果那么”的形式出现。 控制知识:有关问题的求解步骤、技巧性知识,告诉怎么做一件事。也包括 当有多个动作同时被激活时应选哪一个动作来执行的知识。 元知识:是有关知识的知识,是知识库中的高层知识。包括怎样使用规则、 解释规则、校验规则,解释程序结构等知识。元知识与控制知识是有重迭的,对 一个大的程序来说,以元知识或者元规则形式体现控制知识更为方便,因为元知 识存于知识库中,而控制知识常与程序结合在一起出现,从而不容易修改1 。 3 1 2 知识表示方法 知识表示,是指面向计算机的知识描述或表达形式和方法。知识表示是人工 智能研究的一个重要课题,无论应用人工智能技术解决什么问题,首先遇到的问 第14 页河南大学研究生硕士学位论文 题就是所涉及的各类知识如何加以表示。不同的知识应有不同的表示方法,研究 知识的表示方法。不单是将知识存储在计算机中的问题,更重要的是应该能够方 便并且正确地使用知识的问题。合理的知识表示,可以使问题的求解变得容易, 并且有较高的求解效率。研究知识表示的丰要目的是为用户提供一种有利于进行 逻辑推理,能够充分表示领域内知识和便于高效率进行程序设计的知识表示f 2 9 1 。 目前用的较多的知识表示方法丰要有:一阶谓词演算表示法、产生式表示法、 框架表示法、语义网络表示法、面向对象表示法等。 1 一阶谓词演算表示 一条知识一般可由具有完整意义的一句话或几句话表示出来,而这些知识要 用谓词表示出来,一般是一个谓词公式。所谓谓词公式就是用谓词联接符号将一 些谓词联接起来形成的公式。 用谓词公式既可以表示事物的状态、属性、概念等事实性的知识,也可以表 示事物之间因果关系的规则性知识。前面定义的条件谓词就是谓词公式。 2 产生式表示 产生式表示法又称为产生式规则表示法。产生式通常用来表示具有因果关系 的知识,其基本形式为: p - q 或者i f p t h e n q 其中p 是产生式的前提,用于指出该产牛式是否可用的条件;q 是一组结论或 操作,用于指出当前提p 被满足时,应该得出的结论或应该执行的操作。整个产生 式的含义是:如果前提p 被满足,则可推出结论q 所规定的操作。本文中的谓词规 则就是采用产生式表示的。 3 框架表示 框架是一种描述所论对象属性的数据结构。所论的对象可以是一个事物、一 个事件或一个概念。一个框架由若干个槽组成。每个槽又可划分为若干个侧面。 一个槽用于描述所论及对象的某一方面的属性,一个侧面用于描述相应属性的一 河南大学研究生硕士学位论文第1 5 页 个方面。 框架理论将框架视作知识的单位,将一组有关的框架联结起来便形成框架系 统。系统中不同框架可以有共同节点系统的行为由系统内框架的变化来表现。 推理过程是由框架间的协调来完成的。 4 语义网络表示 语义网络是通过概念及其语义关系来表示知识的一种网络图,它是一个带标 注的有向图。其中有向图的各节点用来表示各种概念、事物、属性、情况、动作、 状态等,节点上的标注用来区分各节点所表示的不同对象,每个节点可以带有若 下个属性,以表征其所代表的对象之持性。弧是有方向、有标注的,方向用来体 现节点闻的丰次关系,面其上的标注则表示被连接的两个节点间的某种语义联系 或语义关系。 5 脚本表示 脚本表示法是夏克( r c s c h a n k ) 依据他的概念依赖理论提出的一种知识方法。 概念依赖理论的基本思想:把人类生活中各类故事情节的基本概念抽取出来,构 成一组原子概念,确定这些原子概念间的相互依赖关系,然后把所有故事情节都 用这组原子概念及其依赖关系表示出来。 6 面向对象表示 在面向对象方法中,类、子类、具体对象构成了一个层次结构。而且予类可 以继承父类的数据及操作。这种层次结构及继承机制直接支持了分类知识的表示, 丽且其表示方法与框架表示法有许多相似之处,知识可按类以一定层次形式进行 组织,类之间通过链实现联系【5 4 1 。 知识表示方法既要利于进行自然语言处理,又要利于系统进行查询和推理, 还要有利于进行模块化设计。因此本文针对不同的知识,采用不同的知识表示方 法。 知识存储在知识库中,包括事实知识和规则知识。事实知识一方面可以直接 第16 页河南大学研究生硕士学位论文 存储在亲属事实知识库中,另一方面可以用一阶渭词演算来表示事实知识,并把 这样的知识转化为记录,存储在亲属因子知识库中。由一阶谓词演算构成的产生 式可以表示规则知识,存储在谓词规则库中。 3 2 亲属关系的知识表示方法 一阶谓词演算是一种形式语言,也是到目前为止能够表达人类思维活动规律 的一种最精确的语言,它与人们的自然语言比较接近,又可方便地存储到计算机 中并被计算机精确处理。因此,它成为最早应用于人工智能中表示知识的种方 法。 用谓词演算表示知识实质上就是把人类关于世界的认识变成一个包含个体、 函数和谓词的概念化形式。其基本步骤是: 1 给出有关世界的个体、函数和谓词: 2 构造一阶谓词演算公式: 3 对公式给出解释,使该解释是相应公式的个模型。 同时,阶谓词演算具有以下特点: 1 谓词演算与数据库,特别是关系数据库具有密切的联系。在关系数据库中, 逻辑代数表达式是谓词演算表达式之。因此,如果采用谓词演算作为系统的理 论骨架。则可将数据库系统改造成知识库。这也是本文的工作之一。 2 一阶渭词演算具有完备的逻辑推理算法,如果对逻辑的某些外延扩展后, 则可把大部分的知识表示成一阶谓词演算的形式。 3 谓词演算术身具有比较坚实的数学基础,知识的表达方法决定了系统的丰 要结构。 4 逻辑推理是从公理集合中演绎出结论的过程。由于逻辑及形式系统具有的 重要性质,可以保证知识库中新旧知识在逻辑上的一致性以及所演绎出来的结论 河南大学研究生硕士学位论文第1 7 页 的正确性川。 由于两个相关个体之间的亲属关系是确定的,可以从中归纳出决定亲属关系 存在的因素,这就是亲属因子。结合一阶谓词演算的相关知识,本文定义五种亲 属因子谓词,具体见第二章中的有关定义。 对于这样的知识:刘运龙是刘刚的爸爸,刘刚是刘强哥哥。 在事实知识库中可以表示为: r s = ( 刘运龙,刘刚,爸爸) ,( 刘刚,刘强,哥哥) ) 事实知识集合r s 中的元素经知识获取后,存储入集合k s 中,用亲属因子谓词 表示就是: k s = ( m a l e ( 支运龙) ,c h i l d ( 文冈0 ,j j :0 运龙) ,m a l e ( 支恫0 ) ,c h h 。d ( 刘强,刘运龙) ,e l d e r ( 刘刚,刘强) ) 这些知识最后要经过格式转换算法变成记录格式,存储到知识库中。 亲属因子谓词和记录格式的类型定义如下: s t r u c tt e r n a r y 亲属因子谓词类型定义 s t r i n gs e m a n t e m e ;f 语义祷 s t r i n gr t r l ;第一个人物 s t r i n gn r 2 ;第二个人物 s t r u c tt e r n a r yr e c o r d ,记录类型定义 s t r i n gn r l ;第一个人物 s t r i n gr t r 2 ;第二个人物 s t r i n gs e m a n t e m e ;语义符 算法思想:把实例亲属因子知识转换成知识库记录的格式 输入:集台k s 第18 页河南大学研究生硕士学位论文 输出:集合r s 初始化,新建! 芟量t e m a r yt ,t e r n a r y _ r e c o r dr ,t = k s g e t n e x t ( 、; k s = 妒;r s = ; w h i l et n u l l i f ( t s e m a n t e m e = i m a l e ”) t h e nr n r 2 = 男”e l s ei f ( t s e m a n t e m e = = ”f e m a l e ”) t h e nr 1 3 r 2 = 女”e l s e ( r n r 2 = t n r 2 ,转) ; r r t r l = t n r l ;r s e m a n t e m e = t s e m a n t e m e ;转; r s a d d ( r ) ;t = k s g e t n e x t ( ) ;转; 结束。 集合k s 中的元素经过转换为记录之后,就成了集合k r 中的元素: r s = ( ( 刘运龙,男,m a l e ) ,( 刘刚,刘运龙。c h i l d ) ,( 刘刚,男,m a l e ) , ( 刘强。刘运龙,c h i l d ) ,( 刘强,刘运龙,c h i l d ) ,( 刘刚,刘强。e l d e r ) ) 集合r s 中的元素可根据系统需要存储入库。 对亲属关系的事实知识进行获取和表示后,还必须对用户句子意图进行识别 和表示。 3 3 用户句子意图的识别及表示方法 用户句子意图在本文表现为提问目标 3 0 1 1 5 3 l 。 定义3 3 1 提问目标:把提问表现个体之间的亲属关系或与某个体有亲属关系 的另一个体的人名,称为提问目标。根据提问目标的求解过程可分为结论目标和 条件目标。 定义3 3 2 结论目标:利用顺向链式推理,在现有事实知识条件下条件谓词成 立,相应的结论谓词也成立,其对应的亲属关系即为所求目标。 定义3 3 3 条件目标:利用逆向链式推理,根据亲属关系从结论谓词出发,在 实例化后的条件渭词中仪得到一个含有参数的亲属因子谓词,实例亲属因子谓词 经查询都成立,那么含参数的实例亲属因子谓词对应的个体,即为条件目标。 河南大学研究生硕士学位论文第1 9 页 对用户提问目标的识别主要采用模式匹配的方法。 定义3 3 4 模式匹配:是指对两个知识模式的比较与耦合,即检查这两个知识 模式是否完全一致或近似一致。如果两者完全一致,或者虽不完全一致但其相似 程度落在指定的限度内。就称它们是可匹配的,否则为不可匹配。模式匹配是推 理中必须进行的一项重要工作,因为只有经过模式匹配才能从知识库中选出当前 使用的知识,才能进行推理f 4 9 l 。 现有的模式匹配技术中,一种是关键字匹配。系统中预先存放了一定数目的 含有关键词的基本模式,每一个模式都与一个或多个解释相对应。系统将句子与 这些模式逐一匹配,一旦成功即可得到这个句子的解释。至于句子中那些不属于 关键词的成分,系统则不考虑。这种技术的优点是处理简单、效率高:缺点是不 考虑非关键词成分,容易漏掉重要信息。一个文法上不完全正确的句子,只要它 含有特定的关键字,就能做出相应的处理。另一种是句法模式匹配。它要求句子 必须符合系统允许的一个句法模式,否则系统将不予接受。这种技术的缺点首先 在于要求系统中的句法模式不能太少,否则将导致系统理解效率低下:其次句子 必须严格遵循句法模式的要求1 4 6 1 。 无论形式如何变换,用户句子是由两部分组成的:事实部分和提问部分。一 般来说,它们在用户句子中是分开的,事实部分在前,提问部分在后。提问部分 具有如下特征: ( 1 ) 句子结尾的标点符号:“? ”; ( 2 ) 句子开头:“那么”,“那麽”,“那末” ,“请问”或者上面 几个词语的组合; ( 3 ) 句子中包含:“什么”,“谁”,“是还是”,“哪”,“吗” a t 晡b u t e 所指的称谓对应 的辈分p r e d b p o s i t i o n ,i f ( ( p r e d b p o s i t i o n = 子辈”) a n d ( f e m a l e ( q - o b j e c t ) ) ) t h e n c h i l d ( q s u b j e c t ,p i ) ,m a r r i a g e ( p i ,q - o b j e c t ) 成立,p l 或为已存在 的个体,或为虚拟个体,并加入到集合r s 中,q - o b j e c t = p i ,i = i + l q - ;q - n e x t ,转;令指针h p 指向m l e 的旨位置; 结束。 如:刘强是谢焕萍的儿子,先判断谢焕萍的性别。如果谢焕萍为女性,则其 丈夫可能已存在,如果不存在可设为虚拟个体p ,表示为:m a l e ( 刘强) ,c h i l d ( 刘强,p 1 ) ,m a r r i a g e ( p t 。谢焕萍) 。f e m a l e ( 谢焕萍) ,在以后的知识 表示中如果发现p l = 刘运龙,则可以将以前的p l 替换成刘运龙。如果谢焕萍为男性, 可表示为;m a l e ( 刘强) ,c h i l d ( 刘强,谢焕萍) 。 按获取知识的自动化程度划分,可分为自动知识获取和菲自动知识获取两种 方式。 所谓自动知识获取是指系统自身具有获取知识的能力,它不仅可以直接与领 域专家对话,从专家提供的原始信息中“学习”到专家系统所需的知识,而且还 能从系统自身的运行实践中总结、归纳出颞的知识。发现知识中可能存在的错误, 不断自我完善,建立起性能优良、知识完备的知识库。自动知识获取是一种理想 河南大学研究生硕士学位论文第3 l 页 的知识获取方式,就目前已经取得的研究成果而言,尚不足以真正实现自动知识 获取。 文字、幽 领域专家 图3 1 自动知识获取 在本文中,作者对自动知识获取技术做了初步的探讨,把自动知识获取分为 两个阶段:知识提取和自学习阶段。 非自动知识获取的过程大致可以分为两步;知识工程师负责从领域专家或科 技文献里面获取知识,并用合适的模式把知识表示出来:专家系统中的知识转换 机构负责把知识转换为计算机可存储的内部形式,然后把它存入知识库中【他】。 科技文献 领域专家 i 知识工程师h 知识编辑器h 知识库l 丽吾l j l jl 图3 - 2 非自动知识获取 本文中的事实知识主要是通过自动知识获取来获得,由一阶谓词演算的形式 转化为记录存储入知识库中。规则知识与控制知识是通过非自动获取得到的,是 作者对大多数常见的亲属关系知识进行分析与研究,以产生式规则的形式存储。 3 5 1 亲属关系知识的自动提取 根据用户的句子是否提供事实知识,可分为两种: ( 1 ) 有事实子句:可根据事实进行知识提取,然后进行推理,当事实知识不 足时再决定是否到知- i : 库中查询相关知识,最后得出两人之间的亲属关系。 ( 2 ) 无事实于句:利用自学习的成果,可按关系优先集进行一定顺序的推理, 从而得出两人之间的关系。 第3 2 页河南大学研究生硕士学位论文 亲属关系知识主要是从用户句子中的事实部分自动提取得到的。事实部分可 能是以“如果”,“并且”开头,但不是以“? ”作为句子结尾标点符号的那部 分句子。 对描述亲属关系的句子事实部分,以链表的形式存储事实部分。然后从中提 取亲属事实知识,存储到临时的集合和亲属事实知识库中,再利用“逆向链式推 理”可提取有关的亲属因子知识,存储在一个临时的集合中,并根据系统策略存 储知识入库,完成知识的自动获取跚1 。 亲属关系中涉及最多的是中文姓名。中文姓名的识别是一个非常复杂的问题。 首先,汉语文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论