信息资源组织方法论本体方法.ppt_第1页
信息资源组织方法论本体方法.ppt_第2页
信息资源组织方法论本体方法.ppt_第3页
信息资源组织方法论本体方法.ppt_第4页
信息资源组织方法论本体方法.ppt_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息资源组织方法论 本体方法,刘炜 ,目 录,什么是本体? 本体有什么作用? 本体如何发挥作用? 本体如何生成 本体应用举例,本体是“概念体系的规范A specification of a conceptualization (Gruber, 1993) “本体是对概念体系的明确的、形式化、可共享的规范说明”“An Ontology is a formal and explicit specification of a shared conceptualisation of a domain of interest” Studer 1998) 。 本体是对于存在的研究或科学 the science or study of being(见牛津英语辞典),什么是知识本体?,Ontology建模元素,类(classes)或概念(concepts) 对象的集合 关系(relations) 在领域中概念之间的交互作用,如子类关系 函数(functions) 特殊的关系,关系的前n1个元素可以唯一决定第n个元素。如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。 公理(axioms) 代表永真断言,如概念乙属于概念甲的范围。 实例(instances) 代表元素,就是对象。,本体的功能和作用,在人、机器(表现为软件代理)以及人与机器之间共享对于信息及结构的共同理解 实现一定程度的领域知识的重用 知识本体可以明确领域假设,使领域公理得到明确描述从而达成共知 对于领域知识进行分析、明确,并使其形式化,Why develop an ontology?,To share common understanding of the structure of information among people or software agents To enable reuse of domain knowledge To make domain assumptions explicit To separate domain knowledge from the operational knowledge To analyze domain knowledge,本体对于世界的假设,世界是由对象组成的There are objects in the world. 对象有属性特征可以被赋值Objects have properties or attributes that can take values. 对象之间有各种关系Objects can exist in various relations with each other. 属性与关系并不是一成不变的Properties and relations can change over time. 不同的时间会发生不同的事情There are events that occur at different time instants. 总是有一些事件发生一些过程有一些对象会参与There are processes in which objects participate and that occur over time. 世界以及其中的对象会有不同的状态The world and its objects can be in different states. 一个事件会引起另一些事件或状态Events can cause other events or states as effects. 对象会有许多部分组成Objects can have parts. Chandrasekaran, etc 1999,本体对于数字图书馆的作用,提供与描述型元数据有关语义描述的知识地图 提供资源库领域知识的规范描述 提供元数据映射方案,集成到数字图书馆体系中的元数据服务中,成为协议的一部分 提供智能代理与信息环境之间基于语义的理解机制 作为跨平台、跨系统之间的通信中介 分布环境下查询请求的语义理解 数字图书馆中的数据挖掘,本体方法弥补元数据方法的不足,元数据方案不具有普遍适用性。无法克服特殊性与一般性的矛盾,而形式化的知识本体可以提供一种在元数据方案之间自动映射的机制,通过语义Web服务的体系架构进行实现; 元数据应用难以实现元数据方案本身的进化,而知识本体可以提供信息系统的其它视图,只需要通过自动或半自动的手段应用新的元数据方案; 元数据方案自身难以对不同知识体系、不同“粒度”的资源进行描述,而知识本体正是起到这个作用,从而实现异构资源和系统之间的语义联系; 单纯的元数据方案对于数字资源的整个生命周期的描述非常困难,而采用以诸如FRBR模型为基础的知识本体,这个问题便迎刃而解,不同生命周期的知识产权属性也非常易于描述;,本体的功能实现,本体的特点,共享:Shared understanding within a community of people 描述:Declarative specification of entities and their relationships with each other 推理:Constraints and rules that permit reasoning within the ontology 服务:Behavior associated with stated or inferred facts,知识表达工具,本体的实现方法比较,本体方法的实现机制,本体开发工具 内容采集或创建系统 存储于检索系统 本体推理中介、软件、服务 应用集成,仅仅有形式化的本体是不够的,就像叙词 方法必须要有情报检索系统支持一样。本 体也需要实现机制和系统支持,包括:,本体描述举例,本体描述语言OWL,由DAML+OIL发展而来 基于RDF和RDFS 分3个版本Lite/DL/Full,知识本体的创建,本体需求分析,(1)所构建的知识本体覆盖的学科领域,该学科领域资源的基本状况。 (2)知识本体的建设目的、任务要求、实现的社会与经济效益。 (3)利用知识本体的基本用户与核心用户,用户需求的基本特点。 (4)较之其他资源系统,知识本体将提供什么样的服务。 (5)知识本体和其他资源系统的关系,包括资源的进一步映射和整合。 (6)知识本体在建设时间、进度上的要求。,本体规划,(1)明确计划中要达到的工作目标,论证工作的重要性和必要性。 (2)明确工作的具体任务和要求,每一时期的中心任务和工作重点;对任务进行层层分解,列出工作责任矩阵,确定完成工作的优先次序。 (3)明确计划中各项工作开始和完成的时间,在任务分解的基础上进行统筹规划,以便进行有效的控制和协调。 (4)说明完成计划的方式方法、具体措施,对资源进行合理分配和集中使用,并进行综合平衡。 (5)规定控制标准和工作指标,也就是说必须做到什么程度、达到什么标准才算完成了计划。,本体构建,复用 利用工具,确定本体概念间关系,(1)确定领域知识本体的核心概念集 (2)构建领域知识本体概念关系 (3)将本体概念及关系模型化,本体编码,本体的形式化编码阶段就是用选定的本体语言来描述知识本体 多种方法都可以描述本体,例如关系数据库、逻辑、OWL,主要要看如何实现,本体评价,(1)本体的完整性。即本体是否包括了该领域重要概念,概念及关系是否完整,概念的等级、层次是否多样化。 (2)本体的清晰性。即本体中的术语是否被清晰无歧义的定义。除了规范的主题、分类术语外,对本体进化产生的概念是否给出明确、严格的语义定义。 (3)本体的一致性。即本体中的概念间的关系在逻辑上是否严密、一致,能否支持本体在语义逻辑上的推理。 (4)本体的可扩展性。即本体可否顺利实施进化,本体能否在层次结构上可扩充,在语义上可丰富与完善,能否加入新的术语概念。 (5)本体的兼容性。即本体的开放性和互操作性,本体能否和其他领域本体及相关资源系统进行映射,包括系统层、逻辑层、语义层、表现层等的兼容和互操作。,本体工具,本体工具一般可以区分为:本体开发工具(Development tools)与本体映射工具(Mapping Tools) 前者包括:Protg-2000, OntoEdit,OilEd, WebODE, Ontolingua等 后者包括:PROMPT, ONION, OBSERVER,Chimaera, FCA-Merge, GLUE等。 我们因为不涉及具体的应用,所以不关注映射工具。但是本体领域一直极为关注不同本体的集成、映射等,所以映射工具也是十分重要的一块。,评价本体开发工具的指标,互操作性:包括把其他本体导入到此开发工具;把用此开发工具编辑出的本体导出为各种本体语言等 知识模型的表达能力(Expressiveness of the knowledge model) 灵活性、可变性 (Scalability) 可扩展性(Extensibility) 推理的支持程度Availability and capabilities of inference services 可用性(Usability of tools),本体工具比较的一个案例,这是一个全面的对本体工具的对比。共对比了52个本体工具 /2002/11/06/Ontology_Editor_Survey.html,此案例中对比的指标,共17个对比指标 Tool:名称 Version:最新版本 Release Date :最新版本的发布日期 Source :设计或者维护的机构 Modeling Features:本体的分类体系 Base Language :本体描述语言 Web Support & Use : Support for Web-compliant ontologies (e.g., URIs), and use of the software over the Web (e.g., browser client) Import/Export Formats:可以转入或者转出的其他语言 Graph View :是否支持图形界面 Consistency Checks:是否有一致性检测 Multi-user Support Features :是否支持并发用户,另外的对比指标,Merging Support: 是否可以从现有本体中对比、合并以产生新的本体 Lexical Support Capabilities: 对词汇的处理能力如何 Information Extraction Capabilities: 是否可以直接从文本中提取出术语 Comments Pertinent:是否有注解 More Information:本体工具网址 Contact:本体工具联系邮箱,本体工具介绍,Protege2000,问题讨论,知识本体重用时对知识本体的评价问题 知识本体的互操作问题 知识本体的使用问题,本体的种类,普通 (一般或常识) 本体 ( 高层本体或顶层本体) 领域本体 术语本体Terminology Ontologies 形式本体Formal Ontology 混合本体Mixed ontology 表现本体Representational ontologies 任务/方法本体Task and Method Ontologies 局部本体Regional ontology,通用本体Common Ontologies,关于世界的最一般的认知capture general knowledge about the world 设计最一般的标识和概念,如时间、空间、状态、时间等provide basic notations and concepts for things like time, space, state, event etc 因此对于许多领域都有用as a consequence, they are valid across several domains e.g ontology about mereology (part-of relations) (Upper Ontology or top-level ontology - general level descriptive terms),领域本体Domain Ontologies,关于领域知识的本体capture the knowledge related with a specific domain e.g. electronic, medical, mechanic, digital domain,术语本体Terminology Ontologies,An ontology whose categories need not be fully specified by axioms and definitions. 例如WordNet。An example of a terminological ontology is WordNet, whose categories are partially specified by relations such as subtype-supertype or part-whole, which determine the relative positions of the concepts with respect to one another but do not completely define them. Most fields of science, engineering, business, and law have evolved systems of terminology or nomenclature for naming, classifying, and standardizing their concepts. Axiomatizing all the concepts in any such field is a Herculean task, but subsets of the terminology can be used as starting points for formalization. Unfortunately, the axioms developed from different starting points are often incompatible with one another.,形式本体Formal ontology,A terminological ontology whose categories are distinguished by axioms and definitions stated in logic or in some computer-oriented language that could be automatically translated to logic. There is no restriction on the complexity of the logic that may be used to state the axioms and definitions. The distinction between terminological and formal ontologies is one of degree rather than kind. Formal ontologies tend to be smaller than terminological ontologies, but their axioms and definitions can support more complex inferences and computations. Examples of formal ontologies include theories in science and mathematics, the collections of rules and frames in an expert system, and specification of a database schema in SQL.,混合本体Mixed ontology,An ontology in which some subtypes are distinguished by axioms and definitions, but other subtypes are distinguished by prototypes. The top levels of a mixed ontology would normally be distinguished by formal definitions, but some of the lower branches might be distinguished by prototypes.,表现本体 Representational Ontologies,provide representational entities without stating what should be represented. A well-known representational ontology is the Frame Ontology, which defines concepts such as frames, slots and slot constraints allowing the expression in an object-oriented or frame-based way.,任务和方法本体 Task and Method Ontologies,provide a reasoning point of view on domain knowledge t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论