版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章:知识表示《知识图谱》配套讲义1提纲概述经典知识表示理论语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结2提纲概述经典知识表示理论语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结3知识表示的五个主要角色一种代理一组本体论约定的集合智能推理的组成部分高效计算的媒介人类表达的媒介RandallDavis,“WhatisaKnowledgeRepresentation?”MITAILab,AIMagazine,19934知识类型陈述性知识(declarativeknowledge):用于描述领域内有关概念、事物的属性和状态等事实。太阳从东方升起一年有春夏秋冬四个季节过程性知识(proceduralknowledge):用于指出如何处理与领域相关的信息,以求得问题的解。主要描述过程和规则知识。菜谱中的炒菜步骤如果信道畅通,请发绿色信号5知识类型语言知识(linguisticknowledge):用于描述刻画词语之间的语义联系。开心、喜悦、欢喜、快乐、高兴悲痛、痛苦、难过、悲伤、哀伤世界知识(proceduralknowledge):用于描述具体实体,包括实体的属性、实体间的关系、以及一些重大事件等。姚明的妻子是叶莉第24届冬季奥林匹克运动会在中国举办常识知识(metaknowledge):还有许多对人类来说不言自明,但长期难以被机器处理的知识。(大多数)鸟会飞翔6语言知识主要由语言学专家编纂,刻画词语之间的语义联系聚合语义:关注词语、概念的层次关联组合语义:关注框架和语义角色WordNet(语义网络)FrameNet(框架)7世界知识我们熟知的通用目的知识库(DBpedia、Wikidata等)主要关注世界知识*主要描述具体实体,包括实体的属性、实体间的关系,以及一些重大事件等基于语义网络理论,遵守语义网标准,共享技术栈(RDF、OWL、SPARQL、SHACL等),开放互联例1YAGO4:
yago:London,schema:location,yago:Great_Britain例2Wikidata:[<Q58590>,<P26>,<Q986169>],<P580>,“2007”
[(姚明)(配偶)(叶莉)](起始时间)20078世界知识例3wikipedia:9常识知识对人类来说不言自明,但长期难以被机器处理的知识所谓的“常识知识”(大多数)鸟会飞翔生病的人会想要去医院买书的前提是前往书店吃一顿饭需要几分钟到一两小时的时间不能把一整头大象放入家用冰箱有许多工作致力于组织、收集常识知识:CYC、ConceptNet(OMCS、MIT)、Atomic(AI2、华盛顿大学)等10常识知识常识知识的很难被精确地定义Wikipedia:“所有人都应当知道的,有关日常世界的事实。”DARPA:“……这些共享的,不表达的背景知识(常识知识)包括对物理世界如何工作的一般理解(直观物理学),对人类动机和行为的基本理解(直观心理学),以及普通成年人应当了解的一般事实。”11常识知识特点概括性:常识通常是一类事物共享的事实、规律,而非特定实例独有隐含性:常识知识对交流者显而易见,很少去专门直接表达普遍性:大多数人都普遍掌握的知识不确定性:许多常识知识是默认或可能成立的事实,而非必然的真理(大多数)鸟会飞、发生车祸可能引起交通拥堵12常识知识现有研究关注的常见类型:事物的类属、相似、部分-整体关系:鸟是一种脊椎动物物体的用途、生物的能力:鱼会潜水物体的物理属性:颜色、形状、材质、大小物体的常见空间位置:盘子放置于橱柜事件与状态的时序联系:起床之后洗漱、出门事件与状态的前提、因果联系:地震会引发海啸事件参与者的意图、目标:买食品的目的是为了充饥社交活动中的影响、感受:拥抱朋友会感到快乐……13常识知识早期常识知识项目采用较形式化的表示方案著名的Cyc项目,使用扩展的一阶逻辑语言表示需要经过专业训练的专家编写知识,成本高昂当下活跃的常识项目主要采用“自由形式”的表示用预定义关系连接自然语言短语,减轻了为常识设计形式化方案的负担使得大众可以参与到常识知识的收集工作中ConceptNet(语义网络)ATOMIC(语义网络)14知识表示从四个层次介绍各种知识表示方法:人工智能和知识工程中的经典知识表示理论产生式规则、语义网络、框架、脚本一阶谓词逻辑、描述逻辑语义网的知识描述体系XML、RDF、RDFs、OWL、RIF知识图谱中的知识表示方法DBPediaWikiData数值化知识表示方法15知识表示从四个层次介绍各种知识表示方法:人工智能和知识工程中的经典知识表示理论产生式规则、语义网络、框架、脚本一阶谓词逻辑、描述逻辑语义网的知识描述体系XML、RDF、RDFs、OWL、RIF知识图谱中的知识表示方法DBPediaWikiData数值化知识表示方法16提纲概述经典知识表示理论产生式规则表示法语义网络表示法框架表示法脚本表示法一阶谓词逻辑表示法描述逻辑表示法语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结17产生式系统依据人脑认知中的各种知识之间大量存在的因果关系,以规则序列的形式来描述问题的思维过程,并据此进行问题求解的一种人工智能系统。其中,系统中的每一条规则称为一个产生式规则。产生式规则表示法是专家系统最常用的知识表示方式,也是人工智能中应用最多的一种知识表示方式。18专家系统专家系统:是早期人工智能的一个重要分支,它可以看作是一类具有专门知识和经验的计算机智能程序系统,一般采用人工智能中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。一般来说,专家系统=知识库+推理机,因此专家系统也被称为基于知识的系统。产生式规则表示法是专家系统最常用的知识表示方式。19基本术语:事实事实:断言一个语言变量的值或断言多个语言变量之间关系的陈述句。雪是白的语言变量:雪;语言变量的值:白的小王与小张同龄语言变量:小王、小张;语言变量之间的关系:同龄农行电话是95599语言变量:农行;语言变量的值:95599农行与建行同属中国四大银行语言变量:农行、建行;语言变量之间的关系:同属中国四大银行20基本术语:事实事实的符号化表示确定性事实:一般用三元组的形式表示为(对象,属性,值)或(关系,对象1,对象2)(雪,颜色,白的),(同龄,小王,小张)(农行,电话,95599),(同属中国四大银行,农行,建行)不确定性事实:一般用四元组的形式表示为(对象,属性,值,置信度)(关系,对象1,对象2,置信度)(今年营业额并列全国第一,农行,建行,0.00006)-此处概率仅教学示例,非真实数据21基本术语:规则
22基本术语:规则
23产生式系统结构产生式系统(productionsystem)由数据库、规则库和推理机三部分组成。数据库:用来存放问题的初始状态、已知事实、推理的中间结果和最终结论等。规则库:用来存放与求解问题有关的所有规则。推理机:用来控制整个系统的运行,决定问题求解的线路,包括匹配、冲突消解、路径解释等。数据库规则库推理机24正向推理的产生式系统正向推理:从已知事实出发,通过规则求得结论,也称为数据驱动方式或自底向上的方式。推理过程:规则库中的规则前件与数据库中的事实进行匹配,得到匹配的规则集合;使用冲突消解算法,从匹配规则集合中选择一条规则作为启用规则;执行启用规则的后件,并将该规则的后件送入数据库;重复上述过程直至达到目标。25反向推理的产生式系统反向推理:从目标出发,反向使用规则,求得已知事实,也称为目标驱动方式或自顶向下的方式。推理过程:规则库中的规则后件与目标事实进行匹配,得到匹配的规则集合;使用冲突消解算法,从匹配规则集合中选择一条规则作为启用规则;将启用规则的前件作为子目标;重复上述过程直至各子目标均为已知事实。26产生式规则表示法特性优点:有效性:既可以表示确定性知识,又可以表示不确定性知识,有利于过程性知识的表达。自然性:用“如果…,则…”表示知识,直观、自然。一致性:所有规则具有相同的格式,并且数据库可被所有规则访问,便于统一处理。模块化:各条规则之间只能通过数据库发生联系,不能相互调用,便于知识的添加、删除和修改。缺点:表示的局限性:不能表示结构性或层次性知识。效率低:求解是反复进行的“匹配—冲突消解—执行”过程,执行效率低。27提纲概述经典知识表示理论产生式规则表示法语义网络表示法框架表示法脚本表示法一阶谓词逻辑表示法描述逻辑表示法语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结28语义网络(SemanticNetwork)是Quillan1966年在研究人类联想记忆时提出的一种心理学模型。这种思想受到以下两点的启发:1)人脑记忆的一个重要特征是人脑中不同信息片段之间的高度连接;2)高度相关的概念能够比不太相关的概念更快地回忆起来。因此,该模型认为人类的记忆是由概念间的联系实现的,进而他提出语义网络的知识表示方法。29语义网络语义网络是一种有向图表示的知识系统,节点代表的是概念,而边则表示这些概念之间的语义关系。语义网络中最基本的语义单元称为语义基元,可以用三元组形式表示:<节点1,关系,节点2>。PersonmanagerTomemployeeJohnpunchingeventisaisobjectagentManage-ofisisisa30语义网络的关系isa:具体-抽象关系,或者隶属关系,体现某种层次分类。鸟类动物ISA银行金融机构ISA农行银行ISA31语义网络的关系part-of:部分-整体关系。显示器电脑Part-of柜台银行Part-ofATM银行Part-of32语义网络的关系属性关系:事物和属性之间的关系。老张40年龄农行1951成立时间建行北京总部位于33语义网络的关系语义基元可以是事实或规则,它们的语义网络表示是相同的,区别只是边上的标注事实:规则:雪白色颜色ATM取款锁卡密码输错超过5次农行95599电话号码华为P40Pro+5G网络34语义网络对多元关系的表达可以按照论元个数把关系分为一元、二元和多元关系。一元关系:
“鸟有翅膀”
“鱼能游泳”
“银行有柜台”
“华为P40Pro+支持5G网络”二元关系:
“北京是中国的首都”,首都(中国,北京)“农行是中国国有银行”,国有银行(农行,中国)
35语义网络对多元关系的表达可以按照论元个数把关系分为一元、二元和多元关系。多元关系:“第24届冬季奥运会2022年在北京举办。”包含了举办地和举办时间两个二元关系“农行1951年在北京成立。”包含了成立地和成立时间两个二元关系36语义网络对多元关系的表达一元关系和二元关系可以方便地用语义网络进行表示多元关系转化为多个二元关系的组合,然后利用合取把这种多元关系表示出来。1951X北京银行成立事件成立时间成立地点是一个2022X北京冬奥会举办事件举办时间举办地点是一个37语义网络系统语义网络系统由知识库和推理机两部分构成。知识库:语义网络表示推理机:求解问题的程序问题求解过程:把求解目标表示为一个语义网络子图,其中有些节点或者边的标识是缺失的,表示求解目标。基于求解问题子图,从知识库中搜索可以匹配的网络片段,从而找出目标信息。这种匹配一般是不完全的,具有不确定性,需要考虑不确定匹配问题。38语义网络系统的特性优点:使用直观的图结构来描述知识,表达自然,而且方便于计算机的存储和检索,有较为成熟的应用。缺点:由于缺少形式化的语义定义,不同的语义网络之间难以互相操作,表示不完善。用节点及其关系描述知识,并通过临时性(ad-hoc)的过程对数据结构进行操作,从而实现推理。推理过程复杂。39提纲概述经典知识表示理论产生式规则表示法语义网络表示法框架表示法脚本表示法一阶谓词逻辑表示法描述逻辑表示法语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结40框架表示法是以框架理论为基础发展起来的一种结构化知识表示方式,适用于表达多种类型的知识。框架理论认为人们将现实生活中各种事物的背景知识以某种框架形式存储在记忆中,当面临一个新事物时,就从记忆中找出一个适合的框架,并根据实际情况对其细节加以修改补充,从而对当前事物进行解释和理解。41框架框架(frame):是一种描述所论对象属性的数据结构。框架名:用来指代某一类或某一个对象。槽:用来表示对象的某个方面的属性。侧面:有时一个属性还要从不同侧面来描述。值:槽/侧面的取值,可以为原子型,也可以为集合型。<框架名>槽名1侧面名11侧面值11侧面名12侧面值12槽名2侧面名21侧面值21侧面名22侧面值22槽名n42框架框架分为两种类型:类框架(classframe):用于描述一个概念或一类对象。实例框架(instanceframe):用于描述一个具体的对象。框架的层次结构:子类-subclassof->父类:类框架之间的包含关系。实例-instanceof->类:实例框架和类框架的从属关系。下层框架可以从上层框架继承某些属性和值。后文对两者不做区分,统称为“类属”关系。43框架示例框架名:<灾难>时间:地点:伤亡:死亡人数:受伤人数:失踪人数:损失:直接经济损失:间接经济损失:框架名:<地震>类属:<灾难>震级:震源深度:断层:框架名:<汶川地震>类属:<地震>时间:2008年5月12日14时28分04秒地点:汶川伤亡:死亡人数:69227人受伤人数:374643人失踪人数:17923人损失:直接经济损失:8452亿元震级:8.0级汶川地震是中华人民共和国自建国以来影响最大的一次地震,发生于2008年5月12日14时28分04秒,里氏震级8.0级,直接严重受灾地区达10万平方公里。这次地震危害极大,共遇难69227人,受伤374643人,失踪17923人。其中四川省68712名同胞遇难,17921名同胞失踪,共有5335名学生遇难,1000多名失踪。直接经济损失8452亿元。44框架系统学生框架教职工框架师生职工框架计算机系学生电子系学生硕士生本科生学生-N学生-145框架系统银行框架证券机构框架金融机构框架商业银行政策性银行中国建设银行中国农业银行46框架系统的推理机制继承推理:框架表示具有分类、分层的特点,下层框架可以继承上层框架的信息。匹配推理:推理目标:找出“震级在7级以上,死亡人数在1-万人以上的地震”框架名:<汶川地震>类属:<地震>时间:2008年5月12日地点:汶川伤亡:死亡人数:69227人受伤人数:374643人失踪人数:17923人损失:直接经济损失:8452亿元震级:8.0级框架名:<唐山地震>类属:<地震>时间:1976年7月28日地点:唐山开平区伤亡:死亡人数:242769人受伤人数:435556人失踪人数:损失:直接经济损失:30亿元震级:7.8级框架名:<??>类属:<地震>时间:地点:伤亡:死亡人数:10万人以上受伤人数:失踪人数:损失:直接经济损失:震级:7级以上47框架表示法特性优点:自然性:框架理论符合人类认知的思维过程。结构化:分层次嵌套式结构,既可以表示知识的内部结构,又可以表示知识之间的联系。继承性:下层框架可以从上层框架继承某些属性或值,也可以进行补充修改,减少冗余信息并节省存储空间。模块化:每个框架是相对独立的数据结构,便于知识的添加、删除和修改。缺点:框架表示法也有不可避免的缺陷,由于真实世界的多样性和复杂性,许多实际情况与框架原型存在较大的差异,在框架设计中难免引入错误或冲突。不能表示过程性知识。缺乏明确的推理机制。48代表性知识库:FrameNet¹针对词汇的概念进行框架形式的建模¹/fndrupal/49代表性知识库:FrameNet¹针对词汇的概念进行框架形式的建模¹/fndrupal/框架名Frameelements:框架元素50代表性知识库:FrameNet¹针对词汇的概念进行框架形式的建模¹/fndrupal/非核心框架元素51代表性知识库:FrameNet¹针对词汇的概念进行框架形式的建模¹/fndrupal/框架间关系词法单元,表示最能触发该框架的词52提纲概述经典知识表示理论产生式规则表示法语义网络表示法框架表示法脚本表示法一阶谓词逻辑表示法描述逻辑表示法语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结53脚本是一种与框架类似的知识表示方法,由一组槽组成,用来表示特定领域内一些事件的发生序列,类似于电影剧本。脚本表示的知识有明确的时间或因果顺序,必须是前一个动作完成后才会触发下一个动作。与框架相比,脚本用来描述一个过程而非静态知识。54脚本Winston一个脚本(script)是一个事件序列,包含了紧密相关的动作及改变状态的框架。Luger-Stubblfield一个脚本是一个描述特定上下文中的原型事件序列(ste-reotypedeventsequence)的结构化表示。55脚本组成进入条件:给出脚本中所描述事件的前提条件。角色:用来描述事件中可能出现的人物。道具:用来描述事件中可能出现的相关物体。场景:用来描述事件发生的真实顺序。一个事件可以由多个场景组成,而每个场景又可以是其他事件的脚本。结果:给出在脚本所描述事件发生以后所产生的结果。56脚本示例例:用脚本表示去餐厅吃饭(1)进入条件:①顾客饿了,需要进餐;②顾客有足够的钱。(2)角色:顾客,服务员,厨师,老板。(3)道具:食品,桌子,菜单,账单,钱。(4)场景:场景1:进入——①顾客进入餐厅;②寻找桌子;③在桌子旁坐下。场景2:点菜——①服务员给顾客菜单;②顾客点菜;③顾客把菜单还给服务员;④顾客等待服务员送菜。场景3:等待——①服务员告诉厨师顾客所点的菜;②厨师做菜,顾客等待。场景4:吃饭——①厨师把做好的送给服务员;②服务员把菜送给顾客;③顾客吃菜。场景5:离开——①服务员拿来账单;②顾客付钱给服务员;③顾客离开餐厅。(5)结果:①顾客吃了饭,不饿了;②顾客花了钱;③老板赚了钱;④餐厅食品少了。57脚本示例例:用脚本表示去银行柜台存钱(1)进入条件:①客户有大额的现金;②客户有时间。(2)角色:客户,柜员,保安。(3)道具:取号机,椅子,凳子,证件材料,凭条,银行卡。(4)场景:场景1:取号——①客户进入银行;②寻找取号机;③用取号机取号。场景3:等待——①拿走号码;②寻找椅子坐下;③等待叫号。场景4:办理业务——①机器叫号;②到对应窗口凳子坐下;③出示银行卡和证件材料;
④办理存钱业务。场景5:离开——①拿好凭条;②客户离开银行。
(5)结果:①顾客身上没有了大额现金;②顾客花了时间;③银行多了钱。58脚本表示法的推理事件的预测给定一个场景,如果已知某个脚本适应这个场景,则可以据此预测没有提及的事件发生。“约翰订购牛排”可以预测“约翰付清账单”“小明要存大量现金”可以预测“小明去银行柜台”指明事件之间的联系脚本存储了事件表达的因果链“某人订购牛排”和“某人吃牛排”之间是因果关系“某人要存大量现金”和“某人去银行”之间是因果关系59脚本表示法的推理鉴别特殊事件的发生“约翰走进餐厅。他被带到餐桌旁。订了一大块牛排之后,他坐在那儿等了很久。后来,他生气地走了。”这个情节中的重要部分是:改变了曾预测的餐厅事件序列,“付账单”事件没有出现,说明是一个非常规的事件。“小明走进银行。他看到很多人在等待。他不耐烦地走了。”这个情节中的重要部分是:改变了曾预测的银行事件序列,“取号”等事件没有出现,说明是一个非常规的事件。60脚本表示法特性优点:在非常狭小的领域内,脚本表示却可以更细致地刻画步骤和时序关系,适合于表达预先构思好的特定知识或顺序性动作及事件,如故事情节理解、智能对话系统、机票酒店预订等。缺点:相较于框架表示,脚本表示表达能力更受约束,表示范围更窄,不具备对于对象基本属性的描述能力,也难以描述复杂事件发展的可能方向。61基于槽的表示语义网络、框架和脚本都属于基于槽的表示方法。主要区别在于槽是否具有层次、时序、控制关系(条件分支结构)。语义网络是最简单的一种,它的每个三元组都可以看成一个槽结构。框架系统由一组相关的框架联结而成,其中每个框架是由若干节点和关系构成的网络。因此,框架可以看成是层次化的语义网络,是语义网络的一般化形式。脚本是按照一定的时间流程对事件的发展和变换控制进行的建模,因此,可以认为是定义了时间和控制条件的槽结构,与语义网络也没有本质区别。62提纲概述经典知识表示理论产生式规则表示法语义网络表示法框架表示法脚本表示法一阶谓词逻辑表示法描述逻辑表示法语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结63一阶谓词逻辑是人们发明的一套悠久而成熟的形式系统,是经典逻辑学的核心,在数学、哲学、语言学和计算机科学等领域有广泛的研究和应用。相比语义网络、框架和脚本等经典知识表示方法,一阶谓词逻辑有精确的形式化定义,容易用算法实现,便于机器理解和操作,支持精确推理,因此也很适合在人工智能系统中表示知识。64命题逻辑:基本概念命题(proposition):具有真假意义的陈述句,是对客观事实的描述。这款手机价格低廉。这款手机配置好且价格低廉。如果这款手机配置好且价格低廉,那么它的销量就好。农行是国有银行。农行是国有银行且服务好。如果农行是国有银行且服务好,那么客户就多。65命题逻辑:基本概念原子命题:又称简单命题,不包含其他命题作为其组成部分的命题,即在结构上不能再分解出其他命题的命题。P:这款手机配置好。Q:这款手机价格低廉。R:这款手机销量好。P:农行是国有银行。Q:农行服务好。R:农行客户多。66命题逻辑:基本概念
67命题逻辑:表示法命题逻辑:由命题及其逻辑关联表示客观事实的一种知识表示方法。简单命题的逻辑值:直接以事实为根据来判定其真假。复合命题的逻辑值:由原子命题的逻辑值以及原子命题之间的逻辑关联共同决定。与原子命题的真值关系表真真假真真真真真假假真假假假假真真真假真假假假真假假真真68命题逻辑:推理演算等值演算:考察逻辑关系符
等值定理等值公式析取范式和合取范式推理演算:考察逻辑关系符→
基本推理公式(三段论及其证明方法)基于规则的推理演算归结推理法69命题逻辑→谓词逻辑一阶谓词逻辑(FOL),又称一阶逻辑、谓词逻辑,由于其在逻辑学里的重要地位,又称经典逻辑。一阶谓词逻辑:在谓词逻辑中,命题分解成谓词和个体的组合,其中,谓词表示个体的特性或个体间的关系。更重要的是,一阶谓词逻辑通过引入量词,可以对个体进行类化。因此,一阶谓词逻辑可以建模一类对象之间的特性之间的逻辑关系。50年代人工智能兴起时,McCarthy、Robinson等人就已经开始用FOL构造常识推理等原型系统。70谓词逻辑:基本概念个体词:领域内可以独立存在的具体或抽象的客体。太阳从东方升起:太阳小王与小张同龄:小王、小张农行是金融机构:农行农行与建行同属国有:农行、建行MATE7可以正常上网:MATE771谓词逻辑:基本概念
72谓词逻辑:基本概念
73谓词逻辑:基本概念
74谓词逻辑:基本概念
75谓词逻辑:表示法谓词逻辑:用个体、谓词和量词表示客观事实的知识表示方法。用谓词逻辑既可以表示事物的状态、属性、概念等事实性知识(陈述性知识),也可以表示事物间具有因果关系的规则性知识。用谓词逻辑表示知识的一般步骤:定义谓词及个体,确定每个谓词及个体的确切含义。根据所要表达的事物或概念,为每个谓词中的变量赋以特定的值。根据所要表达的知识的语义,用适当的逻辑联结词将各个谓词连接起来形成谓词公式。76谓词逻辑:表示法示例
77谓词逻辑:表示法示例
78谓词逻辑:表示法示例
79谓词逻辑:表示法示例
80谓词逻辑:表示法示例
81谓词逻辑:表示法示例
82谓词逻辑:推理演算等值演算:考察逻辑关系符
否定型等值式量词分配等值式范式推理演算:考察逻辑关系符→
基本推理公式基于规则的推理演算归结推理法83谓词逻辑:表示法特性优点:精确性:可以较准确地表示知识并支持精确推理。通用性:拥有通用的逻辑演算方法和推理规则。自然性:是一种接近于人类自然语言的形式语言系统。模块化:各条知识相对独立,它们之间不直接发生联系,便于知识的添加、删除和修改。缺点:表示能力差:只能表示确定性知识,不能表示非确定性知识、过程性知识。管理困难:缺乏知识的组织原则,知识库管理困难。推理效率低:一阶逻辑表示不能用多项式时间判断任何逻辑公式的真伪。84提纲概述经典知识表示理论产生式规则表示法语义网络表示法框架表示法脚本表示法一阶谓词逻辑表示法描述逻辑表示法语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结85描述逻辑通过概念类别来描述物理世界,又具有形式化的模型论语义,因此称为描述逻辑。为了处理一类对象,一阶逻辑需要借助变量、全称量词和谓词;而描述逻辑舍弃了变量,直接处理概念,避免了一些复杂度较高的操作。因此虽然描述逻辑的表现力比一阶逻辑要弱,但具备了一阶逻辑不具备的可判定性,推理算法效率更高,是语义网的基础。86描述逻辑与一阶逻辑描述逻辑(Description
Logic)直观上是为描述“类”而发展出的逻辑系统,没有变量和谓词概念。其语法和语义绝大部分有等价的一阶逻辑表示。因此可以粗略地说描述逻辑是一阶逻辑的子集。类似地,命题逻辑和霍恩逻辑(Horn
Logic)也都是一阶逻辑的子集。可判定性(Decidability)指能用多项式时间判断任何逻辑公式的真伪,这是一阶逻辑与描述逻辑的最大区别。任意的一阶逻辑表示仅是“半可判定的”。描述逻辑的表现力有所限制,是可判定的。在构建大规模语义网时,为了保证推理算法的效率,描述逻辑的优点使其成为了语义网的基础。87描述逻辑:概念描述、属性、个体属性语言AL(Attribute
Language):是最简单的一种描述逻辑,包括概念描述、属性、个体三个基础部分。概念描述(ConceptDescription):表示一类事物而非个体,类似面向对象编程语言中的“类”。例如:
书籍、小说、中国文学等是图书领域的概念证券、银行、国有机构等是金融领域的概念手机、平板、基站等是通讯设备领域的概念丄(bottom):表示底层概念,指空集。丅(top):表示全体概念,指领域的全集。88描述逻辑:概念描述、属性、个体概念描述构造器:用两个概念描述构造出一个新的概念。交集构造器⊓:表示两个概念描述的交集,得到一个新概念。例如:
小说
⊓
中国文学,其交集表示“中国的小说”
银行
⊓
国有机构,其交集表示“国有银行”
手机
⊓
国产通讯设备,其交集表示“国产手机”并集构造器U例如:
男人U女人,其并集表示人否定构造器¬例如:
¬男人
,其否定表示女人89描述逻辑:概念描述、属性、个体属性/角色(Role):作用于概念,以取值来限定概念范围。属性必须要搭配量词
∀
或∃使用。例如“作者”是一个属性,则:“所有作者都是中国人的书”记作:书籍⊓∀
作者.中国人“作者不可考的书”记作:书籍⊓∀作者.⊥“至少有一个作者的书”记为:书籍⊓∃作者.⊤例如“客户”是一个属性,则:“所有客户都是中国人的银行”记作:银行⊓∀
客户.中国人“没有客户的银行”记作:书籍⊓∀作者.⊥“至少有一个客户的银行”记为:银行⊓∃客户.⊤90描述逻辑:概念描述、属性、个体个体(individual):是一个概念的实例。描述逻辑中使用断言形式来记录个体的外延知识。例如,著名小说《边城》的知识记为:
“小说(边城)”和“作者(边城,沈从文)”例如,国有银行农行的知识记为:
“国有银行(农行)”和“成立时间(农行,1951年)”例如,华为手机的知识记为:
“智能手机(华为手机)”和“制造于(华为手机,中国)”91描述逻辑的知识库:TBox和ABox描述逻辑的知识库(Knowledge
Base):包括术语(Terminological)部分和断言(Assertional)部分。术语部分称为TBox。主要包含概念和公理:概念的定义(definition):使用≡符号定义一个新的概念。例如:
中国小说≡小说
⊓
中国文学。中国小说就是一个新的概念定义。国有银行≡银行
⊓
国有机构。国有银行就是一个新的概念定义。国产手机≡手机
⊓
国产通讯设备。国产手机就是一个新的概念定义。一般包含公理(general
inclusion
axiom):用包含于
⊑符号表示两个概念的子集关系。例如:
中国小说
⊑
中国文学。表示中国小说是中国文学的子集。银行
⊑
金融机构。表示银行是金融机构的子集。国产手机
⊑
国产通讯设备。表示国产手机是国产通讯设备的子集。92描述逻辑的知识库:TBox和ABox断言部分称为ABox。断言用于描述个体的知识,因此ABox是个体的知识集合,并不处理概念。小说(边城),作者(边城,沈从文)银行(农行),成立时间(农行,1951年)手机(华为手机),制造于(华为手机,中国)93描述逻辑的推理针对描述逻辑知识库中TBox和ABox,分别有一些常见的推理需求。TBox相关推理:最基本:判断一个概念是否是另一个概念的子类检验一个新加的概念C与Tbox是“一致”还是“矛盾”,例如:原来Tbox中有IsA(柴犬,犬),犬和猫是不相交的,如果新增IsA(柴犬,猫),那么新增的概念关系是矛盾的。IsA(熊猫,猫)与猫的概念定义矛盾,因为IsA(熊猫,熊)。检验两个概念是否等价检验两个概念是否毫不相关(disjoint,即交集为空)94描述逻辑的推理ABox相关推理:最基本:判断某个个体是否属于某个概念检验ABox是否与TBox相一致。例如ABox中有两条断言:中国小说(边城),美国小说(边城),而TBox中定义了中国小说和美国小说是disjoint的,那么Abox和Tbox就矛盾了。中国银行(中国农业银行),美国银行(中国农业银行),而TBox中定义了中国银行和美国银行是disjoint的,那么Abox和Tbox就矛盾了。例如ABox中有两条断言:国产手机(华为),进口手机(华为),而TBox中定义了国产手机和进口手机是disjoint的,那么Abox和Tbox就矛盾了。常用推理算法:Tableau95描述逻辑系统使用规范定义的语法和语义定义知识库。使用定义的知识库进行逻辑推理。中国小说≡小说
⊓
中国文学作者不可考的书籍≡书籍⊓∀作者.⊥作者不可考的书籍(诗经)中国96描述逻辑的扩展以属性语言AL为基础,每加入一种新的语法扩展所得的语言就加上对应的字母,如加入了否定的AL就是ALC。扩展命名符号语法含义并集:UC⊔D任意概念C和D可取并集全存在量化:E∃R.C∃可以用于任意概念C否定:C¬C所有非C的概念数量限制:N⩾nR或⩽nR个体x必须有多或少于n个个体y满足R(x,y)标准数量限制:Q⩾或⩽nR.C对个体x,满足R(x,y)且C(y)的个体数目多于或少于n个数据类型:(D)-把整数、字符串等数据类型当作概念描述逆属性:IR−1属性R的反向ALC+传递闭包:SR+应用1次或多次有传递性的R属性属性层次:HR⊑S属性之间有包含关系属性组合:RR.S多个属性可以进行函数组合名词:OII概念对应一阶逻辑中的常量,方便使用97描述逻辑和一阶谓词逻辑描述逻辑:直观上是为描述“类”而发展出的逻辑系统,没有一阶谓词逻辑中的变量和谓词概念。描述逻辑中的断言与谓词相似,但不返回真假,且只能作用于个体,不能接受变量输入。描述逻辑:可以通过属性/角色描述事实,但是只能描述一元或二元事实;但是不能描述规则。一阶谓词逻辑:可以描述多元事实,也可以描述规则。描述逻辑:虽然表现力比一阶逻辑要弱,但具备了一阶逻辑不具备的可判定性,推理算法效率更高,是语义网的基础。98知识表示方法的衡量首先需说明,以自然语言作为知识表示方法是困难的。人表示知识、处理知识均使用自然语言,如果以这种表示直接引入计算机是最理想了。但是自然语言有歧义性、语法语义也难以有完善的描述,从而给机器内部表示带来难以克服的困难,需另行考虑知识表示方法。表示方法的衡量维度表达能力:较强的表达能力和做够的精细度推理和计算:保证推理和计算的正确性和效率使用者:可读性好,模块性好等99提纲概述经典知识表示理论语义网中的知识表示方法知识图谱中的知识表示方法知识图谱的数值化表示方法总结100语义网:从万维网开始TimBerners–Lee创造了万维网(WorldWideWeb)(1989-1990)统一资源定位符(URL)超文本标记语言(HTML)超文本传输协议(HTTP)特色:文本(网页)之间通过超链接进行关联能够在网上冲浪触发了Google等Web搜索引擎2016,图灵奖101Web1.0Web3.0Web1.0:服务商产生内容,用户被动接受Web2.0:用户在服务商平台生成和贡献内容大众参与,诞生了维基百科(Wikipedia),社区问答(百度知道)等典型应用Web1.0和2.0存在的问题网页内容面向人,缺乏语义标记Web数据难以重用,计算机难以理解HTML文档内容Web3.0:语义网,赋予Web信息明确的含义,使计算机和人更好地协同工作SemanticWebprovidesacommonframeworkthatallowsdatatobesharedandreusedacrossapplication,enterprise,andcommunityboundaries102语义网的概念来源于万维网(worldwideweb),是万维网的变革与延伸,是Webofdocuments向Webofdata的转变,其目标是让机器或设备能够自动识别和理解万维网上的内容,使得高效的信息共享和机器智能协同成为可能。语义网(semanticweb)≠语义网络(semanticnetwork)语义网103语义网本质:以Web数据的内容(即语义)为核心,用机器能够理解和处理的方式链接起来的海量分布式数据库。特征:Web上的事物拥有唯一的URI事物之间由链接关联(如人物、地点、事件、建筑物)事物之间链接显式存在,并拥有不同语义类型104语义网体系结构语义网提供了一套为描述数据而设计的表示语言和工具,用于形式化地描述一个知识领域内的概念、术语和关系。105语义网体系结构第一层:Unicode和URI
(uniformresourceidentifier,通用资源标识符),是整个语义网的基础Unicode:处理资源的编码,实现信息的统一编码URI:负责标识资源,支持网上对象和资源的精细标识第二层:语法,用于表示数据的内容和结构用XML标记语言或其他格式记录网络资源信息第三层:数据交换层,是网络数据语义描述的基础通过RDF抽象语言,以“资源-属性-属性值”的三元组形式描述网络资源第四层:(数据的语义)分类RDFS扩展了RDF语言,提供了类、实例、子类等关系描述,便于构造一个分类体系106语义网体系结构第五层:本体和规则使用OWL更丰富地扩展了RDFS,揭示资源本身及相互之间更为复杂和丰富的语义联系使用RIF定义了人工规则的表现格式第六层:统一逻辑层利用下层的本体、规则等资源,执行一定推理任务,或验证推理结果第七层:证明层提供一系列建立信任的灵活框架,用于证明数据真实性、完成用户授权等第八层:信任层注重于提供信任机制,以保证身份、内容治理、隐私问题等相关事宜核心部分为XML、RDF、RDFS、OWL,RIF107XMLHTML:最常用的文档标记语言重点是网页的显示样式和布局描述结构不明显,难以解析,因此生成的文档只有人能看得懂XML:eXtensibleMarkupLanguage,可扩展标记语言最早的语义网表示语言理解数据的首要条件是理解数据的结构与类型。区别于HTML,XML重点描述数据的语义和元素的结构用树状结构来描述数据,并预定义基本的数据类型(如date,string等),易于机器解析XMLSchema:XML预定义的基本数据类型不能很清楚地描述数据类型。XMLSchema提供了自定义数据类型的机制,易于解析器解析
108XMLHTMLXML用于显示数据侧重于如何表现信息用于存储和传输数据侧重于如何结构化地描述信息109XML:元素XML的元素代表XML文档所描述的“事物”,比如书籍、作者和出版商一个元素由起始标签、元素内容和结尾标签构成
<author>ThomasB.Passin</author>用户可以随意地选择标签名,只有很少的限制元素具有嵌套结构,并且没有约束嵌套的深度<author><name>ThomasB.Passin</name><gender>Male</gender><phone>+61-7-3875507</phone></author>110XML特性优点:结构化的数据表示方式,使得数据内容与其形式分离良好的可扩展性,使用者可创建和使用自己的标记,可定义行业领域特殊的标记语言,进行数据共享和交换包含文档类型声明,其数据可被任何XML解析器提取、分析、处理,可以轻松地跨平台应用111XML特性缺点:XML是一种元标记语言,任何组织或个人都可以用它来定义新的标记和标准,容易产生冲突和混乱XML文档作为数据集合使用时,相当于一个数据库,却不具备数据库管理系统那样完备的功能数据是以树状结构存储的,插入和修改比较困难XML只定义了文档结构和数据类型,没有定义数据的语义,机器仍然无法理解文档的内容。为了让应用程序理解数据的语义,定义了RDFResourceDescriptionFramework(RDF)112RDFRDFResourceDescriptionFramework资源描述框架利用当前的多种元数据标准来描述各种网络资源,形成人机可读,并可由机器自动处理的文件核心思想利用Web标识符(URI)来标识事物通过指定的属性和相应的值描述资源的性质或资源之间的关系113RDF数据模型RDF的基本数据模型包括资源、属性和陈述资源(resource):一切能够以RDF描述的对象都叫资源,用唯一的URI来表示属性(property):用来描述资源的特征或资源之间的关系,每一个属性都有特定的意义陈述(statement):特定的资源加上一个属性和相应的属性值就是一个陈述,其中资源是主体(subject),属性是谓词(predicate),属性值是客体(object)114RDF描述示例考查以下陈述的RDF图表示这篇文章(Document_001)的作者(Author_001)名为EricMiller,他的工作单位是Home,Inc.,他的电子邮件地址是em@,他的头衔是Dr.115RDFSchemaRDFS是RDF的扩展,它在RDF的基础上提供了一组建模原语,用来描述类、属性以及它们之间的关系Class,subClassOf:描述类别层次结构Property,subPropertyOf:描述属性层次结构domain,range:声明属性所应用的资源类和属性值类type:声明一个资源是一个类的实例116RDFSchemaRDFS是RDF的扩展,它在RDF的基础上提供了一组建模原语,用来描述类、属性以及它们之间的关系。Class,subClassOf:描述类别层次结构Property,subPropertyOf:描述属性层次结构domain,range:声明属性所应用的资源类和属性值类type:声明一个资源是一个类的实例RDF117RDFSchemaRDFS是RDF的扩展,它在RDF的基础上提供了一组建模原语,用来描述类、属性以及它们之间的关系。Class,subClassOf:描述类别层次结构Property,subPropertyOf:描述属性层次结构domain,range:声明属性所应用的资源类和属性值类type:声明一个资源是一个类的实例RDFRDFS118RDFSchema示例<rdf:DescriptionID="MotorVehicle"><rdf:typeresource="/...#Class"/><rdfs:subClassOfrdf:resource="/...#Resource"/></rdf:Description><rdf:DescriptionID="Truck"><rdf:typeresource="/...#Class"/><rdfs:subClassOfrdf:resource="#MotorVehicle"/></rdf:Description><rdf:DescriptionID="registeredTo"><rdf:typeresource="/...#Property"/><rdfs:domainrdf:resource="#MotorVehicle"/><rdfs:rangerdf:resource="#Person"/></rdf:Description><rdf:DescriptionID=”ownedBy"><rdf:typeresource="/...#Property"/><rdfs:subPropertyOfrdf:resource="#registeredTo"/></rdf:Description>119RDFS词汇表RDFS允许定义自己的词汇表(vocabulary):类别集合和属性集合与其它词汇表中词汇的关系词汇表示例:Dublincoreterms:creator,date,…FOAFterms:characterizationofpersonsGoodrelations:e-CommercetermsCreativecommons:copyrightclasses,licenserelations,…terms:events,organizations,places,reviews,…120RDF,RDFS和XMLRDF并不是一种语言,只是一种书写规范。RDF是一个抽象的数据模型,其基本构造为陈述,即资源-属性-属性值三元组,表示这是一个什么事物,它具有什么属性,这些属性应该有什么样的属性值。XML用来做为描述这种抽象的数据模型的具体书写方式(除了XML,也有如Turtle、JSON-LD、NTriples等流行格式)。同样因为现实世界的超级复杂性,预定义的词汇根本不够用,我们就使用RDFSchema来自定义词汇。
121RDF(S)特性优点:简单:资源以三元组的形式描述,简单、易控制易扩展:描述和词汇集分开,具备良好的可扩展性包容性:允许定义自己的词汇集,并可以无缝使用多种词汇集来描述资源易综合:RDF认为一切都是资源,这样很容易综合描述缺点:不能准确描述语义:同一个概念有多种词汇表示,同一个词汇有多种含义(概念)没有推理模型,不具备推理能力122RDF(S)特性优点:简单:资源以三元组的形式描述,简单、易控制易扩展:描述和词汇集分开,具备良好的可扩展性包容性:允许定义自己的词汇集,并可以无缝使用多种词汇集来描述资源易综合:RDF认为一切都是资源,这样很容易综合描述缺点:不能准确描述语义:同一个概念有多种词汇表示,同一个词汇有多种含义(概念)没有推理模型,不具备推理能力WebOntologyLanguage(OWL)123本体(Ontology)Studer:本体是共享概念模型的明确的形式化规范说明Anontologyisaformal,explicitspecificationofasharedconceptualization.概念模型(conceptualization):本体是通过抽象客观世界的概念而得到的模型,其含义独立于具体的环境状态明确性(explicit):本体所使用的概念及使用这些概念的约束都有明确的定义,没有二义性形式化(formal):本体是计算机可处理的,而非自然语言共享(shared):本体体现的是共同认可的知识,反映的是相关领域中公认的概念集合,它所针对的是团体而非个体124本体的结构和功能本体通过对概念的严格定义和概念与概念之间的关系的描述来确定概念的精确含义,从而表示共同认可的、可共享的知识。本体通常是一套完整的知识体系,一般包括:类或概念:教师、学生、演员、作家等概念类的实例:张三、李四都是学生的实例实例的属性值:张三身高1.78m词语有一词多义和一义多词的问题。而对于本体来说,author,creator和writer是同一个概念,而doctor在大学和医院分别表示的是两个概念。因此在语义网中,ontology具有非常重要的地位,是解决语义层次上Web信息共享和交换的基础125本体的语言:OWLOWL(WebOntologyLanguage,Web本体语言)是在语义网上表示本体的推荐语言,作为RDF(S)的扩展,其目的是:提供更多原语以支持更加丰富的语义表达并支持推理。OWL的三个子语言:OWLLite:提供一个分类层次和简单属性约束。OWLDL:提供推理系统,保证计算完备性和可判定性,与描述逻辑(DL)密切相关,故称OWLDL,具备所有OWL
Lite的功能。OWLFull:支持完全自由的RDF语法,但是不具备可计算性保证,具备所有OWLDL的功能。表达能力:OWLLite<OWLDL<OWLFull126OWL:头部OWL有独特的描述结构,主要包括头部和主体两部分头部:OWL描述本体时,会利用命名空间中预定义的标签来形成本体头部,对本体进行声明一个篮球运动员本体的头部,以XML形式书写为:上例给出了一些常用的说明,如注释、标签,还可以加入修改时间、版本控制、引入外部本体等<owl:Ontologyrdf:about=“/basketballPlayer”><rdfs:comment>一个本体的例子</rdfs:comment>
<rdsf:label>篮球运动员本体</rdfs:label></owl:Ontology>127OWL:主体主体:OWL的核心,描述本体的具体内容,即定义类(class)、个体(individual)和属性(property),添加约束和关联等。“篮球运动员”本体的主体部分将定义类:运动员、篮球运动员个体:姚明、易建联、赵继伟属性:身高、教练、队友属性的约束条件:对称性、队友的个数限制等128OWL:类类的定义:通常使用
owl:Class和
rdfs:subClassOf
标签,本例的定义仅标记了概念之间的联系:OWL中定义了所有类的基类owl:Thing,以及空类owl:Nothing<owl:Classrdf:ID=“运动员”/><owl:Classrdf:ID=“篮球运动员”><rdfs:labelxml:lang="en">basketballPlayer</rdfs:label><rdfs:labelxml:lang=”jp">バスケットボール選手</rdfs:label><rdfs:subClassOfrdf:resource=“#运动员”/></owl:Class>129OWL:个体个体的实例化定义必须基于某个类,以声明它是其一员。下面的两种定义方式等价:子类与个体的争议:青霉素是抗生素的子类还是个体?“生产批号为AB123的青霉素”是青霉素的子类还是个体?这类问题一般以实际应用需求为准。OWL
Full中允许一个个体作为类使用可以把青霉素作为一个类,而某一批号的青霉素作为实例<篮球运动员
rdf:ID=“姚明”/><owl:Thingrdf:ID=“姚明”/><owl:Thingrdf:about=“#姚明”><rdfs:typerdf:resource=“#篮球运动员”/></owl:Thing>定义姚明为Thing基类个体为“姚明”增加补充说明该个体同时也是篮球运动员实例等价定义130OWL:属性属性(Property):属性是二元关系,需标明定义域和值域定义域:指明某个属性可用于哪个类值域:分为两类数据类型属性(DatatypeProperty):连接个体和数据类型,对象属性(ObjectProperty):连接个体与另一个个体<owl:DatatypePropertyrdf:ID=“运动员身高”><rdfs:domainrdf:resource=“#运动员”><rdfs:rangerdf:resource=“&xsd;unsignedLong”/></owl:DatatypeProperty><owl:ObjectPropertyrdf:ID=“对应教练”><rdfs:domainrdf:resource=“#运动员”><rdfs:rangerdf:resource=“#教练员”/></owl:ObjectProperty>131OWL:属性特征属性可能有一些特征,如传递性、对称性等,通过type标签指定OWL预定义的属性特征。例如:属性特征并非OWL强制要求,但尽量多的属性特征描述有助于推理算法的实现<owl:ObjectPropertyrdf:ID=“队友”><rdfs:domainrdf:resource=“#运动员”><rdfs:rangerdf:resource=“#运动员”/>
<rdf:typerdf:resource="&owl;SymmetricProperty"/></owl:ObjectProperty><运动员rdf:ID=“易建联”><队友rdf:resource=“赵继伟”/></运动员><运动员rdf:ID=“赵继伟”><队友rdf:resource=“易建联”/></运动员>132OWL:属性限制属性的值域可以在某个类的定义中以继承的方式进一步限制,仅对这个类的个体有效。限制包括基数限制等,例如一个篮球队必须有12名球员:<owl:Classrdf:ID=“篮球队”><rdfs:labelxml:lang="en">basketballTeam</rdfs:label><rdfs:subClassOfrdf:resource=“#球队”/><rdfs:subClassOf><owl:Restriction>
<owl:onPropertyrdf:resource=“#现役球员"/>
<owl:cardinalityrdf:datatype="&xsd;int">12</owl:cardinality></owl:Restriction></rdfs:subClassOf></owl:Class>这个类是“限制”的“子类”,限制仅作用于这个类的个体该类的个体是限制的“子类”133其他OWL建模原语(primitives)OWL还提供了其他的原语来建模类别、个体及属性。按照不同的表现力,有的原语在OWLLite中有限制或不可用,OWL
DL和OWL
Full中可用所有的原语。类别描述式(classdescriptions):枚举owl:oneOf(DL)属性值约束owl:allValuesFrom(Lite),owl:someValuesFrom(Lite),owl:hasValue(DL)属性基数约束(Lite中仅能取0或1,DL中可以取任意值)owl:maxCadinality,owl:minCadinality,owl:cadinality交集、并集、补集owl:intersectionOf,owl:unionOf(DL),owl:complementOf(DL)134其他OWL建模原语类公理(classaxioms):子类、等价类、不相交类rdfs:subClassOf(Lite),owl:equivalentClass(DL),owl:disjointWith(DL)属性公理(propertyaxioms):RDFS属性构造(Lite)rdfs:subPropertyOf,rdfs:domain,rdfs:range与其他属性的关系(Lite)owl:equivalentProperty,owl:inverseOf针对属性的全局基数限制(Lite)owl:FunctionalProperty,owl:InverseFunctionalProperty属性的逻辑特征(Lite)owl:TransitiveProperty,owl:SymmetricProperty个体公理:个体同一性(Lite)owl:sameAs,owl:differentFrom,owl:allDifferent135OWL小结OWL是RDF的扩展,提供了更广泛的定义RDFS词汇的功能——可以定义词汇之间的关系,类与类间的关系,属性与属性之间的关系,属性的特征和约束等,从而使得数据的语义定义更加丰富,并且构成一个知识系统并支持推理OWL最新的版本为OWL2原OWL改称OWL
1,OWL
2兼容OWL
1OWL2引入了一些新的语法糖,并增强了表现力。如新的函数式语法,子类关系可以表示为“SubClassOf(:篮球运动员:运动员)”136OWL
2子语言OWL2还包含三种概要(profile)子语言,根据应用场景不同,它们在表达能力和计算复杂度上有较好的平衡OWL2EL:保证一切标准推理任务都有多项式时间的算法,适合本体规模很大,可以用表现力换取效率的情况。OWL2QL:使用标准数据库技术,可以较好完成合取查询(Conjunction
Query),适合本体规模小但个体很多的情况,以及必须使用关系数据库技术的情况。OWL2RL:针对直接操作RDF三元组的数据库,可实现多项式时间的推理算法。适合本体规模小但个体多,以及必须直接处理RDF三元组的情况。137RIF规则RuleInterchangeFormatRIF是W3C定义的一套针对规则的抽象语言。它与OWL兼容,可结合OWL公理进行推理。RIF规则是一个文档,其中有多个组(Group),每个组是多条规则的合取∧,而单条规则往往包含“如果…那么”Document(Prefix(rdfs</2000/01/rdf-schema#>)Prefix(imdbrel</imdbrelations#>)Prefix(dbpedia</ontology/>)
Group(Forall
?Actor
?Film
?Role(IfAnd(imdbrel:playsRole(?Actor
?Role)imdbrel:roleInFilm(?Role
?Film))Thendbpedia:starring(?Film
?Actor))))单条规则:对于任意演员、电影、角色如果该演员出演了该角色,
且该角色在该电影中那么该演员出演了该电影138RIF规则规则的应用场景的多样的,难以用一种语言囊括,因此RIF被定义为统一可扩展的语言族,注重不同语法的规则互相交换。W3C将规则语言分为两类,定义了两套方言(Dialect):声明类(如一阶逻辑及其子集)
方言为RIF-BLD,Basic
Logic
Dialect产生式类(如计算机语言的指令,IBMILogs、Drools等系统)
方言为RIF-PRD,Production
Rule
Dialect这两类方言,及其超集、公共子集,形成一套复杂的规则交换体系,既有相同又有区别,
以应对不同的商业应用场景。
本节略去对其的详细介绍。139SPARQL就像关系数据库有SQL语言一样,SparQL是W3C定义的一组针对RDF数据的查询语言。该语言工作在逻辑层之下,仅操作RDF数据,不提供推理功能,也不强求底层使用图存储技术。SparQL可直接对任何RDF三元组
“资源-属性-属性值”进行筛选。中国有哪些数学家?prefixns:</ns#>
SELECT?sWHERE{
?srdfs:typens:数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学三年级上册心理健康教育教案(适合北京教育出版社)
- 二年级书法教案
- 安徽公务员面试模拟29
- 湖南公务员面试模拟61
- 广西申论真题2021年(B卷)
- 专利转让合同协议书2024年
- 2024年标准离婚协议书(范本)
- 2024年酒水购销合同样本一
- 2024年材料买卖合同
- 2024年聘请经济与法律顾问合同「样本」
- 2023年国企招聘宁波慈溪市诚安燃气服务有限公司招聘考试真题
- 高考英语三轮冲刺读后续写爱与责任类 一个人和一只德国牧羊犬的故事 讲义
- W -S-T 442-2024 临床实验室生物安全指南(正式版)
- 培育发展新质生产力宣讲稿
- 宪法学 形考作业2答卷
- 2024年中考语文复习专题21:叙事性散文阅读(二)含答案
- 教科版四年级上学期期中考试科学试卷与答案(共四套)
- 完整版-通信线路(电缆-光缆)的维护
- 防止传销进校园主题班会省公开课一等奖全国示范课微课金奖课件
- MOOC 实验室安全学-武汉理工大学 中国大学慕课答案
- MOOC 模拟电子电路-杭州电子科技大学 中国大学慕课答案
评论
0/150
提交评论