![【毕业学位论文】(Word原稿)基于本体的高校数字图书馆语义检索系统的研究与应用-软件工程_第1页](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf161.gif)
![【毕业学位论文】(Word原稿)基于本体的高校数字图书馆语义检索系统的研究与应用-软件工程_第2页](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf162.gif)
![【毕业学位论文】(Word原稿)基于本体的高校数字图书馆语义检索系统的研究与应用-软件工程_第3页](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf163.gif)
![【毕业学位论文】(Word原稿)基于本体的高校数字图书馆语义检索系统的研究与应用-软件工程_第4页](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf164.gif)
![【毕业学位论文】(Word原稿)基于本体的高校数字图书馆语义检索系统的研究与应用-软件工程_第5页](http://file.renrendoc.com/FileRoot1/2016-7/2/3c138de4-a0e3-4b12-aecb-6beb8dfaaf16/3c138de4-a0e3-4b12-aecb-6beb8dfaaf165.gif)
已阅读5页,还剩58页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中图分类号: 学校代码: 10055 密级: 公开 硕 士 专 业 学 位 论 文 基于本体的高校数字图书馆语义检索系统的研究与应用 要 I 摘 要 在知识大爆炸的信息化社会,高校数字图书馆成为重要的信息传承介质,目前其检索平台完全采用字符匹配的模式,缺乏表达检索需求的语义信息,致使 检索结果与检索需求出现偏差。 本论文深入研究了本体的概念、应用领域、描述语言以及本体的创建规则,提出了基于软件工程方式的本体创建流程,以计算机图书为例,详细论述了需求分析、设计、形式化编码以及本体评价的全过程。在分析传统模型的基础上,引入本体语义层,提出基于本体语义的检索模型,设计了用户交互层、数据管理层和本体语义层的应用功能,设计了检索系统的整体结构模型。研究了数字图书馆检索的扩展查询,提出了基于单关键词、多关键词的查询算法和处理流程,在研究目前推理机工作机制的基础上,提出并设计了基于本体概念与关系的语义 推理模型。 在检索模型设计的基础上,详细描述了检索系统的本体维护、语义推理等操作的具体实现过程。通过样例试验数据验证了本体检索系统在查准率和查全率两方面优于传统检索系统。论文实现的检索系统可在目前高校图书馆中推广应用,能够提高书目检索的查准率和查全率。 关键词 :本体 ,语义检索 ,语义推理 ,数字图书馆 I he an in on is of of so of of of on of in by an of On of of on of It of on of of of on of on of is to in be in it of 目录 录 第一章 绪论 . 1 第一节 研究的背景与意义 . 1 第二节 国内外研究现状分析 . 2 内研究现状 . 2 外研究现状 . 3 第三节 论文的主要内容 . 3 第四节 论文的组织与结构 . 4 第二章 相关理论与技术 . 6 第一节 数字图书馆 . 6 第二节 本体概 念 . 6 体概念 . 6 体的应用 . 7 体的构成 . 8 体的描述语言 . 9 体库建立 . 10 第三节 数字图书馆领域本体的形式化描述 . 11 第四节 本章小节 . 13 第三章 计算机图书本体库建设 . 14 第一节 计算机本体库的构建背景 . 14 第二节 本体库采用的语言和工具 . 14 第三节 计算机本体库的构建步骤 . 15 求分析阶段 . 16 计阶段 . 16 目录 形式化编码 . 19 体的评价 . 20 第四节 本章小节 . 21 第四章 数字图书馆本体语义检索模型设计 . 22 第一节 总体结构设计 . 22 统数字图书馆检索系统总体结构 . 22 于本体的数字图书馆检索系统总体结构 . 23 统总体流程结构 . 25 第二节 扩展查询设计 . 26 第三节 资源映射管理设计 . 29 第四节 语义推理设计 . 31 第五节 基于语义检索的关键技术 . 34 第六节 本章小节 . 36 第五章 数字图书馆本体语义检索系统的实现 . 37 第一节 系统开发环境 . 37 第二节 系统总体结构实现 . 37 统服务总体结构 . 37 统模块框架 . 38 第三节 本体库维护处理的实现 . 40 体库创建的实现 . 40 体文档管理器的操作实现 . 41 体操作的实现方法 . 41 第四节 语义推理的实现 . 42 理机的创建 . 42 义推 理的实现 . 43 第五节 实验分析 . 45 目录 V 第六节 本章小结 . 50 第六章 总结与展望 . 51 第一节 总结 . 51 第二节 展望 . 52 参考文献 . 53 致谢 . 56 个人简历 在学期间发表的学术论文与科研成果 . 57 第一章 绪论 1 第一章 绪论 第一节 研究的背景与意义 随着信息化和知识经济的不断发展,高校图书馆作为我国教育的重要知识载体越来越庞大,存书量越来越大,形成千万的图书。同时由于近些年计算机技术、网络技术和信息处理技术有很大的发展,促使了数字图书馆的产 生,对一所高校来说有两个方面的重要影响,通过信息化的存储对图书馆文献资料的保存、继承等方面起到重要的作用,同时通过计算机信息检索技术的运用,为高校师生图书检索提供高效、快捷的手段,能够让检索用户快速找到出所需要的图书文献。 目前,国内大部分高校已经完成了数字图书馆的基础建设,学校的图书文献索引、主题词、作者信息、文献题目等信息已经存档入库,已经建设了完善的基于关键字的图书检索方法,这种检索方法是完全基于字符之间的匹配,即通过用户输入的查找关键字与图书信息的关键字进行匹配,匹配成功后,找出找到相关图书数据,很 明显这种采用字符匹配的检索方法,没有准确地表达出关键词丰富的语义信息,造成系统给出的检索结果与用户原有的检索需求存在一定的偏差,使检索结果不能完全表达出作者所想要的图书信息,降低了检索的查全率和查准率。 基于上述背景,作者所在高校为提高本校的数字图书馆中信息检索的准确率和查全率,更好地让图书馆为全校师生服务,在原有数字图书馆传统的基于字符串匹配检索技术的基础上引入本体语义概念,研究了基于本体语义的数字图书馆检索技术,本体概念的引入,能够挖掘出概念之间复杂的语义关系,在检索系统中运用本体,可以由原来的字符串匹 配方式完全转为基于概念的匹配方式,实现能够反映用户检索意图的语义检索。该技术的运用使检索系统如同一个智能的领域专家,改变了传统数字图书馆检索系统的技术局限性,引入了语义,提高了检索的精度和覆盖率。 第一章 绪论 2 第二节 国内外研究现状分析 内研究现状 国内有关检索系统的研究大部分面向公众服务领域,如门户的 索系统,这种检索的特点是面向广泛的搜索领域。针对一些特定领域的需求,要求检索范围限定于特定的专业范围之内的检索成为近年来的搜索领域研究的热门课题。本体作为专业领域内的知识库的存储形式,这一概念的提出 给广大检索研究者,提供了信息的表示、存储方面的研究方向的同时,更为重要的是为信息检索、语义推理等方面提供研究方向。 目前国内有许多研究者将本体语义作为检索数据结构、存储、管理的载体,实现专业领域内语义检索,把用户模糊的需求转化为概念的标准词,提高了检索精度。在这些研究过程中,一般都建立了本专业领域内的本体库。如中国农业大学的李景 1在分析、归纳花卉学领域的基础上,建立了此领域的本体,并通过开发检索系统,研发了基于本体库的专业检索系统;赵庆龄 2在分析农业学科中的土壤专业、农业化学专业的基础上,建立了土壤 和农业化学领域的本体库,这一本体库在农业领域内得到了较为广泛的应用;另外以山西大学为代表的高校承担的“现代汉语框架语义系统研究” 3,项目组构建了汉语框架语义知识本体库,这些研究大部分集中在各个领域的本体库的建设与检索系统的开发上。 此外,国内许多学者对本体 检索 理论和方法进行了深入的研究,比如 中国科学院计算技术研究所 的 武成钢 4等人在本体理论的基础上研究了基于本体的与多智能主体的信息检索,设计了检索服务器,此项成果可用在按专业领域分类处理互联网上的数据,根据不同的关注度建立信息资源的索引,使用户的信息 检索模式得到了优化和规范,能够动态地把互联网上更新的数据分类索引,提高了检索的准确率。 通过查阅相关参考文献,近几年来国内学者在本体领域方面的研究一般集中在以下几个方面:( 1)具体专业本体库的建设,本体库是本体语义检索的基础,一些专业领域的专家根据多年来在本行业的知识积累,研究设计了基于本专业的本体库。( 2)本体库的应用方面的研究,一些学者根据已建本体库研究了具体应用,如本体库概念之间的关系研究、本体库概念的逻辑规则研究和本体库语义检索的研究等。 第一章 绪论 3 外研究现状 国外在本体检索方面的研究比较早,形 成了一些较为成熟的研究成果,通过查阅文献资料,国外的军事国防、大型研究所、商业公司都对有关本体检索进行了研究,把一些成果应用到具体的应用中。 美国国防部高级研究计划署(究了 实施的高性能知识库系统 (课题建立了一个基于智能学习的自适应知识库,这个知识库完全基于本体的组织形式的,在数据表示、存储、检索方面都基于本体库中的概念实现的。 美国斯坦福大 学下属的知识系统实验室的学者对本论的应用、建模工具、管理等一些基础层面的应用做了许多的研究成果,学者 在 1993 年提出了本体的定义,学者 计了本体的顶层结构。 项目是欧洲信息技术委员会实施的 信息社会技术 计划中的一个课题,课题的研究是在众多的分布式应用系统中引入本体库,实现各种分布式资源的描述信息管理,为资源信息管理建立了一个可视化的本体维护工具。 意大利的国家生物工程研究所与 司合作完成了一项课题研究,研发了基于本体驱动的网上在线产品目 录的检索系统 ,系统通过运用本体与专业数据库集成关联,通过本体提供的概念,实现概念上的内容匹配,为检索用户提供在选定专业领域内的任意词汇的组合的综合智能检索系统。 除此之外,国外许多科研学者,研发了许多面向 本体检索系统。如 通过运用分布式数据的概念的结构化技术,用户可以在此系统中检索 已经存在的共享本体,实现信息的检索。 通过查阅相关参考文献,近几年来国外在有关本体研究方面由本体库的建设研究逐渐转为本体的应用研究,国外的本体库建 设已经逐步完善,并且提供一些开放的接口供其他科研单位使用,提高了本体库的使用效率。随着近几年来互联网技术的发展,基于本体的检索系统不仅仅限于局部小范围的应用,逐步在互联网信息检索方面应用。 第三节 论文的主要内容 1)本论文深入研究了本体的概念、定义、应用领域、采用的建模语言、描述语言以及本体的创建规则。提出了基于软件工程方式的本体创建流程,以计第一章 绪论 4 算机图书为例,详细论述了需求分析、设计、形式化编码以及本体评价的全过程。 2)结合数字图书馆的数据库特征,设计了数字图书馆领域的本体形式化描述定义 ,并对本体的概念集 进行了规范的设计,提出了基于语义检索要求的数字图书馆本体概念及关系的集合定义。 3)论文在研究传统的数字图书馆检索模型的基础上,提出了基于本体语义检索功能的改进的数字图书馆检索系统框架,设计了用户交互层、数据管理层和本体语义层的不同功能应用,提出了检索系统的整体结构模型设计。 4)深入研究了数字图书馆检索的扩展查询,提出了基于单关键词、多关键词的查询算法和处理流程,在研究目前推理机工作机制的基础上,提出并设计了基于本体概念与关系的语义推理模型。 5)在检索模型设计的基础上,对检索系统的整体流程做了详细的实现 描述,详细描述了本体的维护、语义推理等技术实现。系统设计实现完成后,通过输入测试实验数据,对比分析本系统与传统检索系统,验证了本论文设计的检索模型在查准率和查全率两方面优于传统检索模型。 第四节 论文的组织与结构 本文具体结构如下: 第一章介绍论文的研究背景、国内外研究现状以及本文所做的工作。 第二章介绍了数字图书馆的概念,研究了本论的概念、定义、描述语言、构建步骤和采用的工具,在此基础上提出了数字图书馆领域本体的形式化描述。 第三章以计算机图书为例介绍本体库建设过程,提出了基于软件工程方式的本体的创建流 程,详细论述了计算机本体领域建设的需求分析、设计、形式化编码以及本体评价的全过程。 第四章在研究传统的数字图书馆检索模型的基础上,结合语义检索的需求,设计了基于本体语义检索功能的改进的数字图书馆检索系统框架,详细设计了用户交互层、数据管理层和本体语义层的不同应用功能。 第五章对检索系统的整体架构和功能进行实现的详细描述,描述了本体的维护、语义推理的技术实现。通过样例数据验证了基于本体语义的数字图书馆检索模型在查准率和查全率两方面优于传统检索模型。 第一章 绪论 5 第六章总结论文的主要内容,总结了检索模型的设计和实现,对此模 型的后期改进工作做了展望,提出了完善改进的方向。 第二章 相关理论与技术 6 第二章 相关理论与技术 第一节 数字图书馆 图书馆作为传播知识的载体,它一直是学者、研究人员、师生等查阅文献资料、获取知识的重要场所。随着信息化技术的发展和计算机应用普及 ,传统的图书馆的服务模式逐渐向智能化方向转变 ,尤其在检索方式上需要更能够达到检索者的需求,在新的需求下,通过计算机建模实现图书检索的智能化在此背景下产生 9。数字图书馆突出的特征是提供信息检索的工具,是图书文献数字化信息存储和检索的高层次的综合应用平台 10。 数字图书馆与传 统图书馆相比,其在信息采集、存储、检索等方面有较大提高,数字图书馆综合了图书订购入库、数据更新、信息检索与网上浏览等业务功能,使图书资源实时更新,使传统图书馆工作模式在信息存储、管理、检索等方面的效率得到较大的提高,最终为图书管理人员、检索者不受时间地点的限制实现信息的管理和检索。数字图书馆发展的方向就是使图书检索模型和算法更为智能,满足检索者的需求,为读者提供高质量的综合信息服务 11 第二节 本体概念 体概念 在计算机学科中,数据信息的存储与管理,是计算机研究的一个热门课题,随 着人工智能处理信息技术的出现,数据传输技术也有了突飞猛进的发展,海量数据的出现使许多海量数据处理技术应用产生,如何在海量数据中有效地对数据进行结构化管理,提供快捷的数据获取模式是信息处理领域的学者和科研人员研究的重点方向,本体( 概念的管理的这种模式能够满足学者们研究需求。 本体概念最初的提出是来哲学领域,自本体引入到计算机中,使之成为信息资源组织和语义表达的工具,更多地通过概念层次去表达客观世界。目前本体在信息检索、数据管理等科学工程领域得到了较为广泛的应用,其结构化数据描述和概念的关系 描述使其在有关数据处理领域中得到全面应用,如自然语言处理、情报检索、人工智能、语义表述与推理等 13。 第二章 相关理论与技术 7 本体的定义的提出是经学者们经过多年逐步完善的,起初学者 出本体是由相关领域内词汇术语组成,并且通过它定义其外延规则 14 ,随后从事知识智能研究的 本体的定义进行了改进, 提出本体是针对概念模型的规范化表示 15, 士在 1997 年在以上学者研究的基础上进一步完善其定义,从概念共享的角度定义本体 16,研究员 出了一个至今被广泛认可的定义,提出 本体 的定义为:“本体是共享概念模型的明确的形式化规范说明” 17 。 从本体的定义来分析,其包含四层含义,分别是概念模型、明确、形式化和共享。“概念模型”指通过计算机语言进行抽象化处理,建立与现实世界无关的模型,能够被计算机识别、存储和处理。“明确”指通过定义,概念比较确切,各类条件标准明确,不存在其他的语义。“形式化”指通过本体建立的概念及关系能够在计算机中识别、处理。“共享”指概念能够遵照公共标准体系,能够在其他研究领域中应用 18 19。 体的应用 1)本体的应用领域 本体的概念 一提出来,立即成为相关领域的概念、知识表示、管理的工具和平台,其计算机的层面的表示,为信息系统中概念处理的引用提供了方便的计算机处理模型,随着本体体系结构的不断发展,逐渐成为数字图书馆、教育、语义网格、互联网检索等领域的知识管理的工具 20 21。除了本体作为知识库管理的工具之外,越来越多的应用体现在信息集成,这是因为本体作为知识的表示,其存取遵循特定的标准,任何信息系统可根据此标准实现本体库的维护与存取,多个系统可对同一本体库进行操作,最终达到各个应用领域的数据和知识集成的目的 22 ,这种应用主 要体现在并发处理系统和一些商业系统的信息集成等方面。 根据本体的应用范围和应用层面,本体的应用功能可分为三种:信息共享、信息传输和信息集成。 信息共享:本体通过统一的描述语言,实现对知识领域的概念的定义,这种规范化的定义最终通过计算机语言来描述,使不同层面的研究人员通过这种无二义的描述完成知识概念的理解和交流,达到实现领域知识的信息共享的目的 23。 信息传输:本体的最终表示通过计算机描述语言来表示,本体库建立后,第二章 相关理论与技术 8 各使用者通过读取存储在计算机的本体库完成在各不同应用的信息传输,同时在权限允许的条件下,一些 应用者可以更新、完善本体库的概念结构和关系定义,这些方式的应用最终实现信息的传输。 信息集成:本体库的构建过程采用软件工程实施的方法和步骤,通过需求分析、设计、描述、实现、维护各个阶段建立本体库,这种方式有利于各个应用单位共同参与,实现信息的集成,同时建立的本体库在不同的领域应用系统中作为信息管理的基础平台,通过此平台可实现多应用系统中的信息集成 24 。 2)本体在信息检索中的应用 一般来说信息检索的应用要求两个方面:第一需要最终信息的存储表示,实现信息的存取和维护,另一方面需要信息组织方式的逻辑化,各 信息的存储表示能够为逻辑推理提供基础。本体是通过概念之间的语义关联实现推理的,此特征与检索系统的需求相符合 25 26。 通过本体工具,在查询系统中具体应用的步骤如下: ( 1) 构建本体库:选取查询的专业范围或者子领域,通过咨询本学科的专家或者由其直接参考,对领域内的主题概念进行分析、归并,运用本体描述语言建立本体库。 ( 2)本体的存储:目前信息检索的往往通过关系数据库来实现,本体库建立后,为提高信息检索的效率和本体库的管理,需要把本体库按照规范的标准格式进行存储。 ( 3)分析 用户查索需求:把用户提交 的查询请求,解析成语义推理接受的模式,转换成能够借助推理机完成推理的表示,最终在数据库中检索能够满足检索需求的信息。 ( 4)检索结果处理 :把检索的结果按照系统设定的规则进行排序,根据用户兴趣度或者设定的标准实现检索结果的输出。 体的构成 由本体的定义可知,本体包括两部分:本体的概念和概念之间的关系。从数学角度分析, 7等人认为本体由概念、关系、函数、公理以及实例构成,具体描述如下: 1)概念( 指描述客观世界中事物性质的特征集合,能够通过计第二章 相关理论与技术 9 算机实现其事件的推 理。 2)关系( 表示领域内概念之间存在的相互作用,用数学语言描述为: : . . . . . 3 )函数( , 表 示 关 系 的 一 种 特 例 , 其 定 义 为 F : . . . . . 4)公理 (表示其定义的规则是永远成立的,不需要证明的,常用来表示概念的属性和关系的一些约定规则。 5)实例 (用来表示概念的一些具体的对象。如 体的描述语言 1) 本体描述语言的特征 本体的最终服务对象是检索系统,从表示的结构分析,其结果能够被计算机接受和处理,为此本体描述语言必须具备以下特征: ( 1)具备规范、精确的语法定义规则( 2)具备规范、精确的语义定义( 3)能够支持逻辑推理( 4)具备强大的信息表达能力和处理规则 ( 5)表示形式易读,方便维护。 2) 本体描述语言的类别 从应用领域和范围来看,本体描述语言可分为基于 ( 1)基于 理应用,以标记语言作为基础,通过这种开放性的语言表示概念的存储和 处理,具有代表性的有以下几种: 8、 ) 29、0、 1。 ( 2)基于人工智能处理的本体语言:此种描述规则为自行定义,没有严格的统一标准,但定的规则能够被自行编写的程序识别和处理,如 233,这是一种本体的形式化定义, 4助一些逻辑谓词用以概念的表示,这些本体语言一般都是根据各自的专业项目研究的描述规则,不具有开放、共享性。 3) 采用的标准 在实际应用中,本体描述语言一般有两种:形式化和非形式化。非形式化方 式中可用自然语言描述本体,同时也可采用一些规范定义和标准来描述本体,第二章 相关理论与技术 10 如常见的语义网、资源框架等,比如与本体有关的语言标准有: 7语言标准包括了从网络数据的表示、显示处理、数据集成、数据传递的各个阶段的 的应用,不同的操作系统平台通过 现信息的交换和共享,具体标准包括基于 过结构化的标记语言,把数据结构和属性分开表示,语义的定义通过规则约束来实现的,一般通过 结构定义,实现其与本体的概念结构相关联,然后利用文档结构中数据内容的表示将 数据项与本体的概念相关联,最终实现对本体中的概念及其关系的描述,具体操作通过 现。 随着本体概念的不断完善, 能满足描述的要求,为此 出了一种采用元语方式实现描述本体的方法,即通过 述简单的本体, 一种基于三元组框架容器,它也是基于式实现数据的语义定义,数据采用 “ 资源 属性值 ”形式,此结构能够完全基于计 算处理的。 表示本体方面具有很大的不同,在 通过定义约束规则描述本体,而 通过标准化的元语或元语组合来实现的, 构的转换机制实现最终 档的生成,完成本体的描述。 虽然 本体描述方面功能有较大的提高,但随着各领域对本体的语义推理的要求的规范化,一些弊端显示出来,其表示不能准确地表示各概念之间的语义关系,为解决此弊端, 2001 年 计制定了 目前已成为行业标 准,通过 够明确的表示概念含义及其之间的关系,与其他的描述语言相比, 通过更多的技术机制来实现语义的表达。 体库建立 本体库的建立方法一直是众多学者研究的热点,由于本体面向特定的专业领域,需要一套规范的、可行的技术路线作为指导,依照此路线或标准建设本体库。 截止目前为止,国际上还未建立一套被普通认可的方法,但各个学者根据各自的项目、课题提出了一些原则、步骤和方法,一些学者提出了本体构建的第二章 相关理论与技术 11 规范,通过这些规范能够使建立的本体库在概念表示、语义处理方面更加规范,方便了应用系统的推理。虽然 目前尚未形成一套标准的本体构建方法,但 前较为广泛地应用于本体库的构建工作中,其五条规则包括:明确性和客观性、完整性、一致性、可扩充性、最少约束。 在众多的领域本体构建的方法中,斯坦福大学制定的七步法被广泛采用,构建步骤为: 1)分析本体所在的专业领域,划定知识结构范围; 2)考虑是否能够重用已经存在的本体库; 3)详细列举、描述出本体构建领域的重要专业术语; 4)选择本体描述语言和支撑环境; 5)定义本体中的概念的属性及其关系;6)定义概念的属性中存在的约 束条件; 7)构建概念的实例化。 第三节 数字图书馆领域本体的形式化描述 本体可通过形式化进行定义描述,通过描述可以表示概念、属性、关系,定义描述是本体存存和语义推理的基础。在本节中以计算机图书的一部分概念子集为例说明本体的形式化描述。 计算机图书馆领域本体的本体为 包括概念集、属性集、概念之间的关系、概念层次、推理规则。 假定本体定义 ,H,A,R,A, O n t o l o g y c其中, 计算机概念集合, 个概 念对应一个属性集, 于表示计算机概念之间的关系集合, 个关系对应一个集合, 于表示计算机图书概念的概念层次, 于表示推理规则或者公理。 下面通过选取计算机顶级的几个概念说明描述的方法: 1)概念集合 计算机基础理论与方法、基础知识概念、计算机硬件知识、计算机软件知识 2)概念的属性集 = 计算机 基础理论与方法 ), C 基础知识概念 ), C 计算机硬件知识 ), 计算机软件知识 ) 第二章 相关理论与技术 12 其中: 计算机基础理论与方法 ) = 计算机编译理论、离散数学、自动机理论、程序算法、系统结构 基础知识概念 ) = 设备安全、系统的软硬备份、数据库的安全操作、数据加密、计算机日常维护 计算机硬件知识 ) =处理器、存储设备、输入输出设备 计算机软件知识 ) =操作系统、应用系统、程序语言、算法设计 3)概念之间的关系 由于计算机概念比较多,为表示概念之间的关系,在计算机其他概念作为说明。 联网), 构化查询语言), 件开发, 需求分析 ), 网络,局域网), 4)关系的属 性 = = 同义领域 = 部分关系 5)概念层次结构 ( 6)推理规则或公理 推理规则是推理的基础,假如用 )表示概 念 ,其中的取值为 0 用 示概念 关系( 属性 如同义关系的相关度为 1,则表示 2, 1)。如 联网) =1。 第二章 相关理论与技术 13 第四节 本章小节 本章为相关知识和技术介绍部分,研究了本体的概念、定义、应用领域、采用 的建模语言、描述语言以及本体的创建规则,这些知识为后面的本体的建立和系统的设计提供基础。 第三章 计算机图书本体库建设 14 第三章 计算机图书本体库建设 第一节 计算机本体库的构建背景 本课题是研究基于本体语义的数字图书馆查询系统,本体库的建设是课题研究的重要内容,从前面的相关知识理论可以知道,本体库是以专业领域中的知识概念为基础实现语义上的知识库的组织,课题本体库是服务于数字图书馆数据检索的,很显然,目前数字图书馆数据库中存储的专业门类和领域复杂,知识分类比较庞杂,建设一个基于全部专业领域的本体库是一件不可能完成的, 因此在课题的研 究过程中,以选取一个专业、学科的某一分支的知识为例进行本体库的搭建是切实可行的。 基于论文的作者的专业知识,本论文以计算机类图书为例,结合相关参考文献,对现有的计算机类的主要概念进行提取、合并,构建语义上的关系来实现计算机图书本体库。论文中本体库的构建的数据来源于作者所在高校的图书馆数据库,在构建过程中,作者参考了中国文献编目规则 38和 计算机科学技术汉语叙词表 39,对计算机专业概念的术语、词汇进行规范化处理。 第二节 本体库采用的语言和工具 论文本体库构建时采用的描述语言为 计的规范的基于专业领域的语言标准, 它能够准确地表示出概念主题词的含义及其之间的关系,能够支持多种推理机,开发者可以通过其提供的程序二次开发编程接口实现对本体库的操作。在课题研究中,我们通过运用 计算机的专业词汇进行了准确的描述,并且设计了概念之间的关系。 本体库构建采用了斯坦福大学设计开发的 0,目前它已经被广泛使用,成为本体库开发者的普通选用的工具,它支持 言,给创建者提供了本体的概念类、属性、关系和实例的构建,其构建过程与具体的描述语言无关的。 第三章 计算机图书本体库建设 15 第三节 计 算机本体库的构建步骤 由第二章相关理论内容可以知道,本体库构建过程一般分为七步法来完成,每个过程清晰明确,但在课题项目的设计时,发现其过程不是建立在工程实践的基础上的,为达到构建本体库的创建过程的流程化,使本体的设计、创建、维护工作减少工作量,实现其标准化,为此我们在课题研究时提出了一种借鉴计算机学科中软件工程中的项目设计开发步骤来完成本体库构建的,这种方法是参考了传统的七步法和软件工程方法,具体步骤如图 示。 图 体库构建步骤 本体专业领域的确定 本体构建规划 本体信息的获取 需求分析阶段 列举本体中的重要术语 定义类及其继承关系 定义属性和关系 设计阶段 定义属性的限制 定义实例 形式化编码 本体的评价 第三章 计算机图书本体库建设 16 求分析阶段 1)本体专业领域的确定 近年来随着计算机应用的普及,计算机专业知识已经成为一个应用范围较广的知识体系。论文建设的计算机领域本体是其中一个子集,由于计算机专业门类较为庞大,信息量大,不可能把全部的计算机知识点都考虑进去,并且本体库需要更新维护的,需要一个更新维护、不断完善的过程。本论文的本体库构建好之后,将提供给语义检索的用户,通过本体对输入的关键词进行语义扩展,提高查全率。 2)本体构建规划 本体构建规划分为三个阶段: 第一阶段:确定本体领域,收集专业领域内的词汇表。 第二阶段 :对前一段收集的词汇进行整理取舍,以概念的形式表示,在本阶段详细设计和形式化编码,完成后需要进一步实施本体评价。 第三阶段:属于本体库完善的过程,由本体库维护人员根据学科的不断发展,吸取新出现的专业词汇,补充到本体概念中,并且删除一些过时的概念。 3)本体信息的获取 在本阶段,以作者所在高校的图书馆的数据库中计算机类图书中的主题词为基础进行分析、归类,结合计算机专业的汉语叙词表,把这些概念合同整理后,得到本体信息的基础数据。 计阶段 1)列举本体中重要的术语 由于计算机领域知识繁杂,分类较多, 本体的顶层结构的划分是个比较复杂的问题,作者根据计算机学科的框架结构,把计算机本体的顶层结构划分为四部分:计算机基础理论与方法、基础知识概念、计算机硬件知识以及计算机软件知识。其结构图 示。 计算机基础理论与方法是针对有关计算机理论方面的概念的集合,一般集中在计算理论、组合数学、算法等相关课程。 基础知识问题一般包括计算机方面的日常维护知识,具体包括计算机设计方面的工艺、日常维护和检修方面的知识。计算硬件知识主要针对计算机体系结构、计算机组成原理课程涉及的相关概念。具体性能计算、体系结构、硬件第三章 计算机图书本体库建设 17 结构等。 计算机软件知识主要从软件工程、操作系统、程序设计等课程组合的相关知识等。 图 算机本体库概念结构 以上分类是作者在自己的计算机知识结构的基础上,再通过征求老师意见形成的框架结构,基本涵盖了计算机领域的知识,以上框架的分类不是唯一的,在本课题研究中,采用了以上框架结构设计了计算机本体库。 ( 1)计算机理论与方法概念 本论文本体库划定的计算机理论与方法概念主要面向一些计算机学科的基础理论,包括计算机编译理论、离散数学、自动机理论、程序算法、系统结构等。 ( 2)基础知识概念 本论文本体库划定的基础知识 概念主要指一些有关计算机硬件工艺设计、制造、硬件检测和故障排查等方面的概念。具体包括计算机的设备安全、系统的软硬备份、数据库的安全操作、数据的加密和计算机日常维护等知识。 第三章 计算机图书本体库建设 18 ( 3)计算硬件知识概念 本论文本体库划定的计算硬件知识概念主要硬件数字电路、逻辑电路等方面的知识;具体包括计算机基础组成的处理器、存储设备、输入输出设备等方面的概念知识;还包括有关网络的硬件资源,如 域网、城域网、局域网络等方面的网络设备知识概念,如网卡、集线器、路由器等。 ( 4)计算软件知识概念 本论文本体库划定的计算 软件知识概念主要包括操作系统、应用系统、程序语言、算法设计等,另外还包括计算机网络的软件资源,如网络的操作系统、网络协议、网络算法等。 2)定义类及其继承关系 本体中的类的继承结构可采用自顶向下或自底向上的方法,从层次结构模式中可采用自顶向下的方法,先建立顶层开涮,然后逐步添加其下属子概念,最终完成所有子类的定义,例如“计算机软件知识”概念中的“程序设计”、“操作系统”、“应用软件”等这些概念形成了“ 系,可把其作为“计算机软件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年气体掺混设备项目合作计划书
- 2025年太阳能电池生产专用设备合作协议书
- 2025年CRO服务项目发展计划
- 2025年储冷、蓄热装置项目合作计划书
- 2025年奥硝唑药物项目发展计划
- 2025年转基因抗虫树木新品种合作协议书
- 智能交通系统建设运营合同
- 工程咨询与设计服务框架协议
- 私人教练健身计划执行风险豁免书
- 教育行业学生意外伤害免责协议书
- 2025年中国铜画市场调查研究报告
- 山西省太原市2024-2025学年九年级上学期期末历史试题(含答案)
- 2024年全国体育专业单独招生考试数学试卷试题真题(含答案)
- 2025届高三八省联考语文试卷分析 课件
- 2025年江苏连云港灌云县招聘“乡村振兴专干”16人高频重点提升(共500题)附带答案详解
- 教务主任在教务管理经验大会上发言稿
- 2025年度检修计划
- 2024-2025学年冀教版数学五年级上册期末测试卷(含答案)
- 商业综合体市场调研报告
- 自动体外除颤器
- 《脑出血护理》课件
评论
0/150
提交评论