[硕士论文精品]本体在航运电子商务领域中的应用研究_第1页
[硕士论文精品]本体在航运电子商务领域中的应用研究_第2页
[硕士论文精品]本体在航运电子商务领域中的应用研究_第3页
[硕士论文精品]本体在航运电子商务领域中的应用研究_第4页
[硕士论文精品]本体在航运电子商务领域中的应用研究_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要摘要本体作为共享概念模型的明确的形式化的规范说明,被广泛的引入到计算机领域,实现领域知识的共享和重用,它为领域内知识提供共享和一般化的理解,便于人机交互。当今国际互联网使整个国际航运市场联为一体,实现信息共享是航运企业实施信息工程的主要方向。航运电子商务领域与航运交易有着重要的联系,各类人员希望在网络化环境中查阅领域信息得到相关的资源信息。传统的基于关键词匹配的信息检索方法采用单一、表面化的模型,仅用单一的词或词的组合来对网络信息资源进行检索,缺乏知识的处理,因而返回的结果在查全率和查准率上都无法满足检索者的要求。本文提出将本体应用到航运电子商务领域的思想,通过分析航运电子商务领域中的主要概念,提出概念和属性层次模型,构建航运电子商务领域本体库,采用PROT696加以实现,并进行相关概念的语义描述。将语义网技术应用于航运电子商务领域,利用本体良好的概念层次结构以及对逻辑推理的支持、RDF查询语言、基于JENA的查询技术,实现语义扩展,突破传统的利用关键字进行查询的局限,实现航运电子商务领域的信息检索,为客户提供更能体现客户需要的服务信息。关键词领域本体;航运电子商务;信息检索;语义网英文摘要ABSTRACTONTOLOGYHASBEENWIDELYINTRODUCEDINTOTHECOMPUTERFIELDASALLEXPLICITANDFORMALSPECIFICATIONOFSHAREDCONCEPTUALMODEL,WHICHREALIZESTHESHARINGANDREUSEOFTHEDOMAINKNOWLEDGEITPROVIDESSHARINGANDGENERALUNDERSTANDINGFORTHEDOMAINKNOWLEDGETOFACILITATEHUMANANDCOMPUTERINTERACTIONNOWADAYS,WWWHASMADETHEINTERNATIONALSHIPPINGMARKETAWHOLEUNITTHEREALIZATIONOFINFORMATIONSHARINGISTHEMAINDIRECTIONOFIMPLEMENTINGINFORMATIONENGINEERINGTOTHESHIPPINGENTERPRISESTHEREAREIMPORTANTRELATIONSHIPSBETWEENTHEFIELDOFSHIPPINGECOMMERCEANDSHIPPINGTRANSACTIONSALLKINDSOFPEOPLEWANTTOGETRELEVANTINFORMATIONRESOURCESBYCONSULTINGDOMAININFORMATIONINTHENETWORKENVIRONMENTTHETRADITIONALINFORMATIONRETRIEVALMETHODSWHICHBASEDONKEYWORDSMATCHINGUSEDTHESINGLEANDEXTERNALMODEL,WHEREASITLACKSKNOWLEDGEPROCESSINGBYSINGLEWORDSORWORDCOMBINATIONS,SOTHATTHERESULTSRETURNEDAREUNABLETOMEETTHEDEMANDOFUSERINRECALLRATIOANDPRECISIONRATIOTHEPAPERPUTSFORWARDTHEIDEAOFAPPLYINGONTOLOGYINTOTHEFIELDOFSHIPPINGECOMMERCEANDATTRIBUTELEVELMODELBYANALYZINGTHEMAINCONCEPTSINTHEFIELDOFSHIPPINGECOMMERCE,CONSTRUCTTHEONTOLOGYANDREALIZEITBYUSINGTHETOOLOFPROTR96,THENDESCRIBESTHERELATEDCONCEPTSBYSEMANTICDESCRIPTIONTHEPAPERAPPLYSONTOLOGYINTOTHEFILEDOFSHIPPINGECOMMERCEANDREALIZESTHESEMANTICEXPANSIONBYUSINGTHEWELLCONCEPTUALLAYERSTRUCTUREANDTHESUPPORTOFLOGICALREASONINGOFONTOLOGY,RDFQUERYLANGUAGE,ANDTHEQUERYTECHNOLOGYWHICHBASEDONJENA,BREAKTHROUGHTHELIMITATIONOFQUERYBYUSINGTRADITIONALKEYWORDSTOREALIZETHEINFORMATIONRETRIEVALINTHEFIELDOFSHIPPINGECOMMERCE,TOPROVIDECUSTOMERSWITHBETTERSERVICEINFORMATIONKEYWORDSDOMAINONTOLOGY;SHIPPINGECOMMERCEINFORMATIONRETRIEVAL;SEMANTICWEB大连海事大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明本论文是在导师的指导下,独立进行研究工作所取得的成果,撰写成博硕士学位论文奎佳查航运壹王直釜筮垣虫的座用硒究。除论文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体己经公开发表或未公开发表的成果。本声明的法律责任由本人承担。学位论文作者签名埸劬学位论文版权使用授权书本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学位论文的规定,即大连海事大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。同意将本学位论文收录到中国优秀博硕士学位论文全文数据库中国学术期刊光盘版电子杂志社、中国学位论文全文数据库中国科学技术信息研究所等数据库中,并以电子出版物形式出版发行和提供信息服务。保密的论文在解密后遵守此规定。本学位论文属于保密口在年解密后适用本授权书。不保密函请在以上方框内打“论文作者签名昌钐军扣忍王月刁分L、OTF氰产签伊师导肌了本体在航运电子商务领域中的应用研究第1章绪论11研究背景及选题意义九十年代以来,信息技术及其相关产业的迅猛发展标志着知识经济时代的到来。作为具有悠久历史的航运企业面临着挑战与机遇,在竞争日益激烈的今天,尽快寻求一套完整的信息解决方案是中国航运企业保持持续发展的前提与保障【11。我国电子商务技术正在不断完善和发展,诸多现代电子商务网站的出现,对于航运企业来说具有得天独厚的条件,既具有挑战又具有机遇。航运企业利用现代电子商务平台,更有利于实现高效低成本的运作,并且会带来更多的商机,提高市场的竞争力。当今国际互联网使整个国际航运市场联为一体,航运企业发展电子商务是网络经济条件下的必然趋势【21。航运企业有其独特性,实现信息共享是航运企业实施信息工程的主要方向,如何向广大客户提供电子订舱和货物跟踪是提高改进运输信息服务质量的重要方面。因此,我国航运业信息今后必须走信息资源共享化、信息网络一体化的发展道路。港航企业的信息资源极为丰富,具有动态性、时效性、共享性特剧引,如果不能为客户提供实时、准确、有效的信息,将造成整个行业经济效益的下降。目前本体己被成功讨论和实践于多个领域,如知识管理【41、软件复用、数字图书馆【5L等,然而在我国航运界电子商务领域中的研究几乎为空白,在普通电子商务领域中的研究也仅仅局限在概念的界定和初步的理论研究层面上,对于本体的方法论、描述语言、构建工具、具体构建也缺乏实践。本文在讨论本体在航运电子商务领域中的具体作用的基础上,对本体的语言、方法论、构建工具进行介绍和分析,希望能够为航运电子商务领域中本体的构建和应用提供一个初步的理论和实践基础。利用语义网,借助网络的航运信息之间的交换,从而可以使机器精确的理解、采集和组合航运中的航运经济、物流工程、港航发展以及航运管理等信息,并进行各种类型的航运商务信息服务。将语义网技术应用于航运电子商务领域,建立起航运电子商务领域的本体,利用本体良好的概念层次结构以及对逻辑推理的支持,实现语义扩展,突破传统的利用关键字进行查询的局限,可以为客户提供更能体现客户需要的服务信息,促进航运业及其经济的发展。HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第1章绪论因此,通过本体理论与技术研究航运电子商务领域信息检索具有重要的理论价值和现实意义。12研究现状综述121航运电子商务现状所谓电子商务,就是在网上开展商务活动,当企业将它的业务通过国际互联网INTEMET、企业内部网络INTRANET以及外部网EXTRA_NET与企业的员工、客户、供销商以及合作伙伴直接相连时,其中发生的广告、交易、支付、服务等活动就是电子商务。全球信息基础设施委员会GIIC对电子商务的定义为电子商务是运用电子通讯作为手段的经济活动,通过这种方式人们可以对带有经济价值的产品和服务进行宣传、购买和结算【6J。电子商务的出现是网络日益普及的产物吲,商务信息的快速汇总和处理是电子商务的重要特征之一。“航运电子商务是关于航运业的电子商务。像其它商务一样,商业信息对航运商务具有重要意义。因此,从扩大信息量,协调整体利益和捕获商机而言,建立航运电子商务都是十分必要的。1电子商务在航运企业中的应用目前马士基海陆与其他四家欧洲船公司共组INTRA航运网站,美国总统轮船、加拿大太平洋航运、韩进海运、现代商船、川崎汽船、商船三井、胜利航运、阳明海运与以色列吉姆轮船等九家航商亦透过TRADIANT成立航运入13网站【剐。其功能均为提供客户线上订舱、货物追踪与运输动态信息服务,建立所谓的全球运输服务网,构成畅行无阻的多承运人入口网站。中远集团及其下属公司和中外运集团公司等国内大型航运企业也已建立了各自的网站,初步尝试开展电子商务。以海运为例,电子商务将成为海运的主宰191。中国存在巨大的海运市场,国际贸易公司是海运的主要需求方。海运服务的供方和需求方的信息都需要通过网络平台进行会聚。在此基础上,中国国际海运网、锦程物流网等应运而生,筑成海运的电子商务平台。2电子商务给航运业带来的效益HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应用研究电子商务在全球经济发展中起着越来越重要的作用,改变着世界贸易环境和企业的运作方式。电子商务的应用能够在现实经营活动中为航运业带来良好的效益和影响。我国航运企业从20世纪80年代初就开始了EDI方面的研究与应用【101,无论是运输服务企业还是客户,都能够及时了解到每一批交运物品的签收情况,并及早制定资金运作计划。运输仓储的信息化,可使运输企业选择合理的配送路线,减少零担比重,提高船载量,提高运力,节约运费。电子商务作为降低成本的直接途径,是航运企业参与市场竞争的必要技术方式【11】,电子商务改变航运企业与客户的关系,使之与上游企业或下游企业形成嘬实的战略联盟,使企业可以迅速了解到客户的需求并及时反馈到企业的决策活动中去,因此航运企业实施供应链管理需要以电子商务技术为基础,将商品需求、商品流通和商品生产有机地结合在一起,航运企业的信息化水平将直接影响到企业供应链的有效建立,进而影响企业的竞争力。122本体在电子商务中的应用近几年,本体论在电子商务解决方案形成过程中的有效性已被广泛接受,尤其是对于电子商务环境中产品或服务交易中的共享性概念构造【12】。随着网络的拓展以及商务的兴起,膨胀的信息使得搜索引擎成为电子商务中不可或缺的航海指南针。当前在互联网中信息搜寻者要获取有用的商务信息不容易,关键是目前网络信息的搜索只能做到精确匹配,返回的结果信息或者具有较大冗余或者是不含相关的信息。传统的检索都是面向大众的,因此如何从电子商务自身特点出发,把搜索引擎优化方法应用到电子商务网站的网络推广中是研究本体在电子商务中应用的目标。语义WEB技术的出现对电子商务有着深远的影响,它解决了电子商务中标准化问题,提供了智能的查询服务,提供了一站式服务以及实现有效的知识管理F131。通过语义WEB技术在电子商务中的应用,我们可以通过包含语义的数据来完成基于语义的查询、统计等工作F14J;同时我们还可以通过对词汇的语义定义,实现不HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第1章绪论同领域中概念相同词汇的意义互通,使得跨系统的操作得以实现。语义电子商务技术115L的首要基础内容是本体的建立,一个本体可被视为一个加强的标准域,它能被用来描述实体和为实体各方面建模。本体的重要应用领域是产品与服务描述,它们可以与商务公司建立的HTML网页平行发布,这样,商务公司可利用本体来描述他们提供的可被机器翻译的格式数据。语义引擎则可以通过描述逻辑中的一般或特定的规则,从这些信息网站中演绎出新的知识。将本体应用于电子商务领域,这无疑对商家、消费者和经济都带来了巨大的影响。它能帮助减少商家组织的复杂度,同时为新产品和商业模式创造了机会,对消费者来说可以通过语义电子商务服务获得最大的个性化服务和个人商务活动的有效性。123基于本体的信息检索WEB从1991年出现以来,目前已经发展成为一个巨大的全球化信息资源库。WEB上的信息量以几何级数的速度增长,使得用户发现其所需要的信息变得非常困难。在如此信息膨胀和信息源多样性的共同作用下,快速、有效地获取有用信息变得越来越困难,其原因在于信息源中数据在格式和存储结构上的异构性;人为原因造成的信息源中数据之间“同义异形”和“同形异义等的语义混乱。从而信息查询的结果往往很难满足用户需要,因此如何有效地检索WEB信息也就成为一项重要的研究课题。语义WEB的出发点是改变现有互联网依靠文字信息来共享资源的模式,通过本体来描述资源的语义信息,达到语义级的共享,从而提高网络服务的智能化、自动化116】。本体是共享概念模型的明确的形式化规范说明,其目标是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇术语,并从不同层次的形式化模式上给出这些词汇和词汇之间相互关系的明确定义。每个领域都有自己的领域术语或称之为概念词,根据电子商务领域的概念词建立起该领域的本体,并且用本体描述语言来描述电子商务信息本体;语义网技术在电子商务中有广阔的应用前剥171,将语义网技术应用于航运电子商务领域,建立起航运电子商务的本体,利用本体良好的概念层次结构以及对逻辑推理HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应用研究的支持,实现语义扩展,突破传统的利用关键字进行查询的局限,大大提高了航运电子商务的检索效率。作为一种能在语义和知识层面上描述领域概念模型的建模工具,本体具有良好的概念层次结构和对逻辑推理的支持。将语义网技术应用在航运电子商务领域,通过OWL描述语言实现语义扩展,使用RDF查询语言突破传统的利用关键字进行查询的局限,可以为客户提供更能体现客户需要的服务信息,促进航运业经济的发展。本体可以为信息查询提供较好的语义支持,从而能从根本上解决传统信息查询的语义缺乏问题,因此,研究语义WEB下的航运电子商务信息检索具有一定的实际意义。13本文工作本文通过分析航运电子商务领域的主要组成,提出该领域的概念和属性层次模型,充分考虑航运电子商务信息的特点,采用PROT696加以实现,构建航运电子商务领域本体库。通过对航运电子商务领域本体进行语义描述,最终实现基于本体的语义查询服务。本论文共分六章,各章的主要内容如下第一章为绪论,简要阐述论文的研究背景及选题意义,明确所做主要工作,安排论文章节。第二章是理论研究部分,主要对本体的研究概况、相关概念和技术方法等进行了分析。第三章在第二章相关理论技术研究的基础上,运用PROT696工具构建了航运电子商务领域本体模型,并对其进行形式化语言描述。第四章主要对本体查询语言进行了分析研究,通过比较几种查询语言,详细介绍了RDQL查询语言,为后面的工作打下基础。第五章是对本体技术的应用。主要通过对JENA技术的研究,利用JENA下的RDQL查询语言从而进一步实现语义查询。第六章是论文的结束部分。对本论文的研究工作进行了总结,并对今后在该领域里进一步的理论研究工作进行了展望。HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第1章绪论本文的研究路线为理论和实践相结合。具体路线如图11所示图11论文研究路线图FIG11RESEARCHROUTECHARTOFTHESIS6HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应用研究第2章本体理论与研究综述21本体理论概述211本体出现的背景本体ONTOLOGY,历史上起源于西方哲学研究领域,是形而上学哲学分支,主要研究客观世界的本质。ONTOLOGY是对世界上客观存在物的系统地描趔18】,是人类认识客观事物、形成共识的唯一标准。近十多年来,本体论的研究日益成熟,已经远远超过了哲学的范畴,逐渐运用于知识工程和信息科学等领域中。在当今这个以计算机、通信、网络、人工智能等为代表的信息处理等技术飞速发展的时代,人们运用ONTOLOGY来整理知识和信息资源,将ONTOLOGY引入计算机与人工智能研究,并运用于计算机检索领域中,使异构的数据在语义级上实现信息集成【19】。212本体的概念近十年来,本体的研究同趋成熟。由于研究、开发和应用本体的人员的背景和兴趣不同,因此本体的定义也多种多样。1991年NECHES将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”;斯坦福大学的GRUBER给出了ONTOLOGY的一个最为流行的定义,即“ONTOLOGY是概念模型的明确的规范说明”【刎。后来,BORST在此基础上,给出了本体的另外一种定义“本体是共享概念模型的形式化规范说明“【211。而STUDER等人对上述两个定义进行了深入的研究,认为“本体是共享概念模型的明确的形式化规范说明”【221。这一定义已被多数人所认同。这里包含4层含义“概念模型”CONCEPTUALIZATION指通过客观世界中一些现象的相关概念而得到的模型;“明确EXPLICIT指所使用的概念及使用这些概念的约束都有明确的定义;“形式化“FORMAL指ONTOLOGY是计算机可读的即能被计算机处理的;HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述“共享SHARE“指ONTOLOGY中体现的是共同认可的知识,反映的是相关领域中公认的概念集。尽管定义有很多不同的方式,但是从内涵上来看,不同研究者对于本体的认识是统一的,都把本体当作是领域内部不同主体之间进行交流的一种语义基础,即由本体提供一种明确定义的共识。通过对国内外学者对本体观点的归纳,可以将本体看作是一个关于某些主题的、层次清晰的规范说明。它是一个已经得到公认的形式化的知识表示体系,包含词表或名称表术语表,词表中的术语全是与某一专业领域相关的,词表中的逻辑声明全部是用来描述那些术语的含义和术语间关系的,即它们是怎样和其它术语相关联的。本体作为知识重组的重要手段应该具有以下要素1声明STATEMENT声明用来说明本体所表示的知识范围、主体以及它的主要用途和目的。2公理AXIOM公里通常都是一阶谓词逻辑的表达式。公理是那种无须再进行证明的逻辑永真式重言式。例如,三角形内角之和等于180度。3概念,又称为类CLASS类是相似术语所表达的概念的集合体。4属性PROPERTY,SLOT属性用来描述类中的概念,具有限制类中的概念和实例的功能。属性是区分类的标准,且具有继承性,一个属性必须具有相应的属性值。例如,“花卉”这一类,具有属性“花色“,属性取值类型是枚举型,范围是“红、橙、黄、绿、青、蓝”5函数FUNCTION。函数是关系RELATION的特定表达形式。函数中规定的映射关系,可以使得推理从一个概念指向另一个概念。例如,函数MOTHER的定义,是将某个人或生物与他它的母亲联系到一起。对于任何人或动物而言,MOTHER的值是唯一的。而MOTHER的逆反函数CHILDREN的值不一定是唯一的。6实例INSTANCE,也称个体。归根结底,类是实例的类,实例是类的实例。函数是实例的函数,实例是函数的实例。实例是本体中的最小对象,它具有原子性,即不可再分性。HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应崩研究一个本体实际上就是一套关于某一领域概念的规范而清晰的描述,它包含类,类是本体结构的核心,它代表了某一领域的概念集合。在习惯上将类名CLASSNAME的首字母以大写表示。例如,房屋BUILDING的下位类代表了所有的房屋。特定的房屋是这个类中的实例。一个类可以包含若干个下位类SUBCLASSES,这些下位类们各自所代表的概念集合其范围比它们的上位类SUPERCLASS更小。譬如,可以将所有的房屋种类划分为商品房、经济适用房、集资建房和拆迁房等下位类。同理,也可以将所有的生物划分为植物、动物和微生物。每一个概念的属性描述了有关概念的各种特征和属性,还有属性的限制条件RESTRICTIONS,即分面FACETS,有时也被称作ROLESRESTRICTIONS或CONSTRAINTS。属性描述了类和实例的属性,其首字母用小写字母表示。在“类”的层面上,CLASSBUILDING的实例应该有描述房屋类型、面积、地域以及地产商等特征的属性取值。一个完整的本体还要包含一系列与某个类相关的实例INSTANCES,这些实例组成了一个知识库KBKNOWLEDGEBASE。因此,可将本体定义为一个七元组DC,彳C,R,AR,H,X,其中C是概念的集合;AC是概念属性的集合;R是关系的集合;AR是关系属性的集合;H是表示层次的集合;,是实例的集合;X是公理的集合。213本体的分类根据本体不同方面的属性,可以对本体进行不同的分类。1根据本体的研究层次划分F23J顶层本体主要研究非常通用的概念,如空间、时间、事物、对象、事件、行为等,他们完全独立于特定的问题或领域,其他本体均为其特例。领域本体用于描述指定领域知识的一种专门本体,如医学、飞机制造等。它们提供了关于某个学科领域中概念的词表以及概念之间的关系,或者该学科领域的重要理论。任务本体描述特定任务或行为中的概念及概念之间的关系。它们都可以应用顶层本题中定义的词汇来描述自己的词汇。任务本体和领域本体处于同一个研究和开发层次。HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述应用本体描述特定的应用,它既可以引用涉及特定的领域本体中的概念又可以引用出现在任务本体中的概念。一个应用本体与用来描述专业领域的概念相关联,这些概念是解决问题的方法体系的组成部分。这种分类方法对应的本体具有一定的层次关系,有利于ONTOLOGY的创建、集成、共享和应用,如图21所示图21本体分类图FIG21THECLASSIFICATIONCHARTOFONTOLOGY2根据本体的形式化程度划分按照本体的形式化程度对现有的本体进行分类可分为以下几种。完全非形式化采用自然语言表示的本体。结构非形式化采用受限的或结构化的自然语言表示。半形式化用一种人工定义的形式化语言表示。形式化所有属于都具有形式化的语义,并能在某种程度上证明包括一致性和完整性等方面的属性。22本体研究概述221国内外主要研究现状ONTOLOGY自90年代初提出以来,在国外就引起了众多科研人员的关注,并在计算机及相关领域得到了广泛的应用。HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应用研究本体研究早期的工作是围绕词典、叙词表等资源开展的,面向的领域是机器翻译和初级的自然语言处理。当今的本体研究已经面向解决自然语言理解的难题,并解决多语种问题。目前,ONTOLOGY正在人工智能、计算语言学和数据库理论方面取得特殊的作用。尤其在知识工程【241、信息建模、信息集成以及检索和提取、知识管理和组织等不同研究领域中,ONTOLOGY的重要性正得到认识并已经成为许多应用系统的基础元素。本体的核心是实现知识的共享,如何表示概念的语义关系及如何实现共享重用是实现机器对WEB信息资源语义理解及智能化处理的关键。迄今为止,国外的本体理论研究日趋成熟,理论体系正在逐步完善,虽有为数不少的本体构建工具和方法体系,但没有一个是完全成熟的。与国外相比,国内对于本体的研究大约始于20世纪90年代初。国内最早进行本体研究的是浙江大学人工智能研究所的高济教授,他于1996年进行了基于本体的智能系统开发方法OSMI的研究【251。现在本体的研究已经广泛分布于各个方面,但是无论是在理论研究、实证研究,还是在技术手段的实现和应用方面都相对于落后,与国外高水平的研究相比存在很大差距,大量文章仍停留在翻译、综述国外研究的水平上,具有独立创新性的研究少之又少。综观国内外现状,本体研究目前仍然处于理论研究日趋成熟,应用研究相对滞后的阶段,依旧存在很多问题。1在该领域中,缺乏构建领域本体的成熟流程、方法和规范标准。2目前的大多基于本体的系统应用目的是针对等方向,针对自然科学的相对较少。3研究本体构建的技术体系与检索的技术之间存在脱节问题。4多语种问题仍然困扰着围绕本体系统所进行的各种开发、集成和复用。222本体研究领域ONTOLOGY的应用很广泛,如知识工程、信息系统、企业管理、电子工程、化学工程、远程教育、电子商务等。目前,ONTOLOGY正在人工智能、计算语言学和数据库理论方面取得特殊的作用。尤其是在像知识工程、知识表示、定性建模、HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述语言工程学、数据库设计、信息建模、信息集成、面向对象分析、信息检索和提取、知识管理和组织、基于代理的系统设计等不同研究领域,ONTOLOGY的重要性正得到认识。ONTOLOGY应用领域还涉及到企业集成、自然语言翻译【261、医药工程【271、机械工程、产品知识标准化、电子商务、地理信息系统、法律信息系统、生物信息系统等。23本体的技术方法231本体的构建方法本体作为“共享概念模型的明确的形式化的规范说明”,其构建需要在领域专家的帮助下捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的术语,并从不同层次的形式化模式上给出这些术语及其相互关系的明确定义【矧。本体的构建,一般不能简单地看成是项目开发,而应看成是工程开剔291。本体的构建多是面向特定领域的,是一个不断积累、更新领域知识的过程,如果没有好的方法路线知道,就难以在不同领域本体的构建中保持一致,也不利于本体的规模化和规范建设【301。因此关于本体构建方法的研究对于本体的应用有至关重要的作用。目前,研究人员已在实践中探索出了多种本体构建方法,大多方法都是针对具体的项目提出的,但这些方法都还没有成熟的理论作指导。国内外的一些研究小组提出了不少指导本体构建的方法。然而,由于本体工程学相对不成熟,每个研究小组都用自己的方法。这些方法包括骨架法、企业建模法、循环获取法、METHONTOLOGY、IDEF5、BEMERASETAL方法和基于领域知识重用的虚拟领域本体构造方洲311。以下将对其中一些方法作简单介绍。1骨架法SKELETALMETHODOLOGY在企业本体背景的基础上由MIKEUSHOLD和MICHEALGRUNINGER等人提出的骨架法是目前最为大众所接受的本体构建方法。该方法使用MIDDLEOUT开发方式提供本体开发的指导方针,还是与商业和企业有关的术语及其定义的集合。骨架法建设本体的步骤【32】如下HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应用研究确定本体应用的目的和范围根据研究的任务或者领域建立相应的领域本体。研究领域越大,所建立的本体也就越大,因此需要限制领域的范围。本体分析定义本体所有术语的意思及其之间的关系。本体表示一般用语义模型来表示本体。本体评估清晰性、一致性、完善性和可扩展性成为本体评估的标准。本体的建立以文档形式保存所建立的本体,这些文档应该包括本体中定义的主要概念、METAONTOLOGY等。确定本体库的应用目的和范围本体分析本体评价图22骨架法流程图FIG22THEFLOWCHARTOFSKELETALMETHODOLOGY2七步法斯坦福大学医学院开发的七步法,主要用于领域本体的构建。七个步骤分别是确定本体的专业领域和范畴确定领域本体范围的方法之一是列出基于本体的知识库能够回答的问题清单,因此先要明确几个基本问题A所构建的本体将覆盖哪个专业领域。B应用该本体的目的是为了更好地挖掘本领域的深层信息。C本体中的信息能回答那些类型的问题D该本体的用户与系统维护者是哪些人HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述这些问题的答案随着本体设计过程的深入可以随时调整,但是在任何特定的时间段里,它们对于限制模型的范畴都是有帮助的,所以需要相对稳定。考查复用现有本体的可能性复用现有的本体是行之有效的方法。在构建本体时,为了节省时间,避免从空白开始,在WEB上可以找到很多现成的本体文库。列出本体中的重要术语首先可以采用自中间展开的方法列出一份术语清单,即先确定最重要的概念,这些是需要解释给用户的。然后围绕着这些重要概念找出其相关概念,从而列出份领域范围内所有的概念清单,此时暂不考虑概念间会有属性及表达上的重复。定义类和类的等级体系A自顶向下法由某一领域中最大的概念开始,然后再将这些概念细化,即从“ISA”继承关系的顶端开始往下扩展。许多人工构造就是采用这种办法。B自底向上法概念和关系是在发现概念、关系时逐步加入的。由底层最小类的定义开始,然后将这些细化的类组织在更加综合的概念之下。C综合法综合上两种方法。首先定义大量重要的概念,然后分别将它们进行恰当地归纳和演绎,再将它们与一些中级概念关联起来。定义类的属性只有类的体系根本不足以提供系统能力问题所需的答案信息。一旦定义好了一些类,就必须开始描绘概念间的内在结构。定义属性的分面一个属性可能有多个“分面“组成。一个属性的“分面“就是属性取值的类型、容许的取值、取值的个数和有关属性取值的其他特征。创建实例定义某个类的下属实例需要确定一个类,创建该类的一个实例,以及添加这个类的属性值。3企业建模法企业建模法TOVE133L用于TOVE项目中,该项目是多伦多大学ELL实验室的一个项目,它的目标是建立一套为商业和公共企业建模的集成本体,并且已HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应用研究经建成了相关本体。作为该项目的一部分,他们设计了一套创建和评价本体的方法ENTERPRISEMODELLINGMETHODOLOGY。该方法主要分为以下步骤激发场景应用领域的某些场景可以激发本体的建设。非形式化的能力问题对新扩展的本体进行一定的非形式化的判断,决定是否需要扩展本体,或者现有本体是不是已经可以涵盖所提出的非形式化问题。术语的规范化从非形式化能力问题中提取非形式化的术语,通过ONTOLOGY形式化语言进行定义。形式化的能力问题把非形式化的能力问题用形式化的术语定义出来。形式化公理将公理用一阶谓词逻辑表示出来形成本体的规格说明。完备性定理当能力问题都被形式化的表述之后,必须定义在什么条件下这些问题的解决方案是完备的。综上所述,骨架法和企业建模法等都是贯穿了整个本体构建过程的方法,是比较通用的方法,有一定的参考价值。232本体的建模原语PEREZI矧等人用分类法组织了本体,归纳出5个基本的建模元语MODELINGPRIMITIVES35L1类CLASSES或概念CONCEPTS指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,类表示的是对象的集合,其定义一般采用框架FRAME结构,包括概念的名称,与其它概念之间的关系的集合,以及用自然语言对概念的描述。2关系RELATIONS关系形式上定义为N维笛卡儿积的子集RC1XCCN。在语义上关系对应于对象元组的集合。如子类关系SUBCLASSOF。3函数FUNCTIONS函数是一类特殊的关系。该关系的前N1个元素可以唯一决定第N个元素。形式化的定义为FCIXC2CN一1呻E。如MOTHEROF就是一个函数,MOTHEROFX,Y表示Y是X的母亲。HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述4公理AXIOMS公理代表永真断言,它是定义在类和属性上的限定和规则。如概念乙属于概念甲的范围。5实例INSTANCES实例代表元素,从语义上讲实例表示的就是对象【361,而类表示的是对象的集合,关系对应于对象元组的集合。从语义上讲,本体的基本关系共有4种,如表21所示表21本体基本关系TABLE21ONTOLOGYBASICRELATIONS关系名关系描述PARTOFKINDOFINSTANCEOFATTRIBUTEOF概念之间部分与整体的关系概念之间的继承关系概念的实例与概念之间的关系,类似于对象和类的关系表达某个概念是另一个概念的属性在实际的建模过程中,概念之间的关系不限于上面列出的4种基本关系,可以根据领域的具体情况定义相应的关系。233本体的描述语言本体描述语言是用来描述本体的,它让用户为领域模型编写清晰、形式化的概念描述。近年来,WEB技术为全球信息共享提供了便捷手段,以共享为特征的本体论与WEB技术结合是必然趋势。ONTOLOGY所包涵的概念以及概念之间的关系是一种知识模型,它必须与特定的领域和描述语言相关联才能发挥其效用。在此背景下,基于WEB标准的本体描述语言成为本体论研究和应用的热点,如SHOESIMPLEHTMLONTOLOGYEXTENSION,OMLONTOLOGYMARKUPLANGUAGE,XOLXMLBASEDONTOLOGYEXCHANGELANGUAGE等。在标准方面,W3C推荐的与本体语言相关的标准有三个XML、RDF瓜DFS、OWL。其中XML和RDF是规定HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应用研究了语义描述的语法和结构,主要用于对信息资源的标识和描述;RDFS和OWL规定了形式化ONTOLOGY所使用的关键词汇,主要用于对ONTOLOGY的定义和描述。实际上,语义WEB描述语言经历了一个逐渐演变的过程,如图23所示。OWLSDAMLSOWLDAMLRDAMLOIL图23语义WEB描述语言的演化FIG23THEEVOLUTIONOFSEMANTICWEBDISCRPTIONLANGUAGE由此可见,所有的描述语言都是以XML语言为基础,在其基础上在语义描述能力上的完善和扩充。下面对主要的几种语言进行简要介绍和说明。1RDFRDFS万维网上的信息虽是机器可读的,却不是机器可理解的。因此采用元数据来索引网上的信息,使用由W3C主持制定的RDF资源描述框架,RESOURCEDESCRIPTIONFRAMEWORK来描述元数据以及元数据之间的关系。HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述RDFI371是建立在XML语法上,以语义网为理论基础,对信息资源进行语义描述的语言规范。RDF规范用来生成网络资源的描述,但它所提供的建模原语非常基础,其数据模型只提供了一个抽象的概念框架来描述元数据,通过性质和值来描述资源以及资源之间的关系,因此RDF模型类似于一个实体关系图。RDF的数据模型包括如下要素资源RESOURCES所有通过RDF描述的对象OBJECT都看作是一个资源。资源可以是一个网页、一个网站或其他通过网络能够访问的对象,并且资源总是用URI加以标示。属性PROPERTIES描述资源的某个特定方面,如特征、属性或者关系。每个属性都有特定的含义,规定了取值范围,描述的资源的类型,以及与其它性质之间的关系。陈述STATEMENTSRDF语句由一个特定的资源加上一个指定的属性以及该属性的值VALUE就构成了一个STATEMENT。一个陈述有3个独立的组成部分主体SUBJECT、谓词PREDICATE和客体OBJECT。在对RDF模型进行研究的过程中,对其描述一般有三种方式图示法、模型和三元组。三元组RDF模型可以看作一个三元组的语法形式P,S,D】,其中P、S、O分别对应于RDF语句的谓词、主体和客体【3剐。如表22所示。表22RDF三元组TABLE22RDFTRIPLE主体SUBJECT谓词PREDICATE客体OBJECT资源RESOURCES属性PROPERTIES文本LITERAL例如,一个简单的句子“M网络实验室是资源HTTPMWLABEDUCIL的创建者。”其对应的RDF三元组为创建者,【HTTPMWLABEDUEND,“M网络实验室“HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航返电子商务领域中的应用研究其中符号【R】表示由URIR指定的资源,引号内代表一个文本。图示法可以将RDF语句看作一个有向标记图每个资源和陈述都是一个结点,一个三元组P,S,D】为一个从S指向O的标记为P的剪头。这个图可以看做O是S所具有的P的值或者S有一个性质P的值为O,亦或者简单地叙述为S的P是O。在图中,资源以椭圆形结点表示,文本以矩形结点表示,而指定的属性以箭头表示,并且箭头的方向一定是从句子的主体指向客体的。上例还可以表示为下图24所示。AB图24简单的语句图示法FIG24SIMPLESENTENCEGRAPHICMETHODRDFXML方式描述。按照RDFXML语法,依据一定的格式和编码规则对RDF模型进行描述记录,这种方式便于计算机的处理和计算机之间的交流。上述例子的代码解析如下所示声明版本与之间这部分内容是对RDF进行描述的HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述与之间是用RDFXML对RDF模型的声明进行描述M网络实验室资源描述框架RDF定义了一个简单的概念模型,旨在体现网络资源及其之间的概念结构和高阶结构,用来生成网络资源的描述。虽然RDF有许多优点,但RDF模型所提供的建模原语非常基础,本身并不提供专门的机制来描述资源和资源之间的性质,并不定义任何一个特定领域的语义,也不直接支持逻辑推理,因此需要对其作进一步扩展。RDFSCHEMA在RDF基础上增加了许多语义原语,是对RDF有关性质描述的补充和扩展,用来更进一步增加对资源语义上的描述能力,如类、属性、类和属性之间的隶属关系等,比如RDFSRESOURCE、RDFSCLASS、RDFSDOMAIN、RDFSSUBCLASSOF等等。RDFS提供了RDF模型中使用的一个基本类型系统,但是从RDFS的原语上,其表达能力以及对逻辑推理的支持还非常有限。2DAMLOILONTOLOGYINFERENCELAYERDAMLOIL来自于DAMLONT和OIL,于2000年12月由美国和欧洲两个组织成立联合委员会将其合并,并提交给W3C讨论,使其成为未来语义WEB标准描述语言的基础。DAMLONT和OIL在语义上都是基于描述逻辑的,语法上则以RDF和RDFS为基础,并且用丰富的建模语言对它们进行了扩展。DAMLOIL知识基础是RDF三元组的集合,它使用自己的词汇给RDF三元组以具体的意思表述。DAMLONT和OIL将整个世界划分为两个不相交的部分一一数据类型域和对象域。数据类型域由属于XMLSCHEMA数据类型的值所组成,而对象域则由对象所组成,这些对象被看做是DAMLOIL中所定义的类的成员1391O3OWL删WEBONTOLOGYLANGUAGEHTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城本体在航运电子商务领域中的应剧研究W3C总结了几种语言的开发经验,于2004年2月正式推出OWL,它成为语义网发展过程中的一个重要里程碑,已经过广泛讨论并得到比较一致的认可。OWL采用面向对象的方式来描述领域知识,在RDF和RDFS基础上通过增加更多建模原语来描述性质、类以及它们之间的关系,并提供更加丰富的类型定义和属性描述。它基于RDF,针对不同的应用范围做出了扩充和限制,提供三种表达能力依次增强的子语割41LOWLLITE、OWLDL和OWLFULL。OWLLITE限于支持对概念的层次分类和简单的约束等特性的描述,即它支持的用户是那些需要一个分类体系和简单约束功能的人。OWLDL支持的用户是想获得最大表达能力。它包括所有的语言结构,但只能在一定的约束条件下使用,例如一个类是多个类的子类,那么这个类就不能是另一类的实例。OWL厂FULL没有计算保证的限制,具有最大的表现能力和RDF语法自由。在OWLFULL中,一个类能同时作为个体的集合,它本身也可以作为一个个体。OWL本体包括了类、属性、个体的描述。一个OWL本体中的大部分元素是与类CLASS、属性PROPERTY、类的实例INSTANCE以及这些实例问的关系。OWL不使用唯一命名,即两个不同的名称可以对应到同一个个体。属性是个体之间的二元关系,将两个个体连接在一起。简单类CLASSCLASS用于一个简单类的定义,而SUBCLASSOF用于定义一个类的子类。一个领域中的最基本概念应分别对应于各个分类层次树的根。类可以通过继承关系组成层次结构,子类是父类中的特殊情况。OWL中的所有个体都是类OWLTHING的成员,因而所有类也就都是OWLTHING的子类。个体INDIVIDUAL个体是类的成员,要引入一个个体,只需要将它声明为某个类的成员即可。例如,21HTTP/WWW521TAOBAOCOM/LISTPHPCATID16淘宝网购物商城第2章本体理论与研究综述其中的RDFTYPE这个RDF定义将一个INDIVIDUAL和一个CLASS的成员绑定起来。基本属性PROPERTY可以被用来说明CLASS的共同特征以及某些INDIVIDUAL的专有特征。OWL中定义了两种PROPERTYA、DATATYPEPROPERTY表示CLASS个体和XM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论