实用分类系统与语义网:发展现状和研究课题_第1页
实用分类系统与语义网:发展现状和研究课题_第2页
实用分类系统与语义网:发展现状和研究课题_第3页
实用分类系统与语义网:发展现状和研究课题_第4页
实用分类系统与语义网:发展现状和研究课题_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语义网与适用分类系统

SemanticWebandOntologies

秦健美国雪城大学信息研讨学院jqin@提纲语义网的概念与语义网有关的规范和技术适用分类系统的定义和作用语义网开展的过程适用分类系统的探求性工程语义网与数字化图书馆语义网方面的研讨课题2ADL2004深圳早期的网络网址规范化+网络通讯规范+格式兼容终端机PCMACUNIX任务站serverFTPserverGopherserverNNTPserver3ADL2004深圳目前的网络资源经过极有限的语义相互链接〔如:具有表达意义的文件名〕一个资源所在系统无法自动断定其它系统中的资源含义〔如:图中资源D经过HREF与资源A和C的链接,但是无法知道A和C的含义〕CABD4ADL2004深圳语义网每个资源有明晰的定义,如软件,文件,人,地点概念之间的关系有明晰的定义,如软件产生文件,软件依赖于软件,文件的版本,文件具有主题,人所在地点来源:Berners-Lee,2002产生依赖于依赖于是…的版本主题作者地点在5ADL2004深圳什么是语义网?(1)语义网就是机器可了解的信息,是数据网或全球性的数据库原理:一切可以确定的内容〔人,时间,事件,物体,事物,等〕都在网中每个实体〔entity)都有一个一致资源标识〔URI)信息的不完全性〔Web是没有尽头的,语义网也是如此,任何找到的信息都只是部分信息〕网络是不断进化完善的最少设计把简单的东西简化,让复杂的东西变得能够开发简单的运用,着眼于未来的复杂性不要将不用要的东西规范化结果要大于部分相加的总和6ADL2004深圳什么是语义网?(2)语义网的作用是联接相关事件和实体用VoiceXML标示的一段语音网络效力〔WebService)描画部件目录定购情况制造过程化学公式蛋白质基因人个案历史日期日历事件地点天气风险保险财务税预算人力资源假期飞机航班餐饮饮食偏好个人数据计算设备部件目录……7ADL2004深圳与语义网有关的规范和技术可扩展置标言语名域国际码一致资源标识可扩展置标言语构造资源描画框架资源描画框架构造适用分类系统词表逻辑验证诚信数字化签名能自描画的文献数据数据规那么8ADL2004深圳Ontology:适用分类系统适用分类系统的主要成分是一整套对某一领域里的知识进展表述的词和术语,编制者根据该知识领域的构造将这些词和术语组成等级类目,同时规定类目的特性及其之间的关系。为什么需求适用分类系统?提供机器可以了解的信息构造使领域知识可以被再利用9ADL2004深圳课目内容的概念在传统叙词表中的表述课目内容CoursecontentBT课目组织CourseorganizationNT内容分析ContentAnalysis争议问题〔课目内容〕ControversialIssues(CourseContent)课目简介CourseDescriptions课目目的CourseObjectives课程Curriculum课程开发CurriculumDevelopment课程指南CurriculumGuides选修课ElectiveCourses学位科目内容ProgramContent学位科目的有效性ProgramValidation教科书内容TextbookContent验证有效的学位科目ValidatedPrograms〔来源:TheERICThesaurus)10ADL2004深圳课目内容的概念在传统叙词表中的表述课目内容CoursecontentBT课目组织CourseorganizationNT内容分析ContentAnalysis争议问题〔课目内容〕ControversialIssues(CourseContent)课目简介CourseDescriptions课目目的CourseObjectives课程Curriculum课程开发CurriculumDevelopment课程指南CurriculumGuides选修课ElectiveCourses学位科目内容ProgramContent学位科目的有效性ProgramValidation教科书内容TextbookContent验证有效的学位科目ValidatedPrograms〔来源:TheERICThesaurus)叙词表中的同位词之间并不能显示叙词在概念上的联络注:同一颜色的词有概念上的联络11ADL2004深圳课程内容的概念在适用分类系统中的表述课程Curriculum课目Course课目目的Courseobjective课目简介Coursedescription课目类型Coursetype课程指南Curriculumguide学位科目Program〔必修,必选,选修〕有课程开发Curriculumdevelopment学科Discipline学位科目内容Programcontent有有目的才干实际实践环境类目Class特性property类目Class下位类Subclass目的类型有有有特性类型Propertytype12ADL2004深圳适用分类系统的例子类目等级构造类名类目定义特性名特性类型限制赋值13ADL2004深圳适用分类系统的组成部分类目(Class,Concept)类名classname定义definition,documentation类目类型classtype特性(Property,Slot,Role)特性名Name特性类型Type特性限制Constraint,Cardinality赋值范围Domain/facets14ADL2004深圳例子:人及其特性PersonManagerTechnicianSubclass:Class:a-kind-ofNameIDRoleAddressIDPhonenumberhas-property-ofName:PeterCreticosID:123456789Role:DirectorAddressID:Address101Phonenumber:217-234-5678:peter@Instance:Property:is-ais-ais-ais-aName:JoeNeedlemanID:22345678Role:TechnicianAddressID:Address101Phonenumber:217-234-5677:joe@hashas15ADL2004深圳叙词表与适用分类系统的比较比较方面叙词表实用分类系统目的用于主题标引某一知识或应用领域的概念模型概念定义类目:定义:关系:等级结构注释参见、互见等级结构注释特性及其类型数据模型数据结构:数据类型:无无关系型,Object-Oriented与数据库结构提问语言相容,也包括非数据库结构提问语言不相容的类型表述语言定义语言:标记语言:数学语言:自然语言无无自然语言或规范语言RDF(S),DAML+OIL第一逻辑16ADL2004深圳适用分类系统的运用医学电子商务房地产金融财务制造业、工商业的供应链〔Supplychain)电子教学〔e-learning)图书馆目录。。。。。。构造知识模型确定概念及其相关关系用XML/RDF表述知识模型以知识模型为根底设计系统实施系统设计适用分类系统的设计、开发、实施过程17ADL2004深圳语义网第一开展阶段制定有关规范,为语义网的开展提供根底资源描画框架/可扩展置标言语阐明书〔RDF/XMLSyntaxSpecification(Revised)〕资源描画框架词汇描画言语1.0:资源描画框架构造〔RDFVocabularyDescriptionLanguage1.0:RDFSchema〕资源描画框架概要〔RDFPrimer〕资源描画框架:概念与定义方式〔ResourceDescriptionFramework(RDF):ConceptsandAbstractSyntax〕资源描画框架语义〔RDFSemantics〕资源描画框架检验个案〔RDFTestCases〕网络适用分类系统言语运用个案与要求〔WebOntologyLanguage(OWL)UseCasesandRequirements〕网络适用分类系统言语参照〔OWLWebOntologyLanguageReference〕网络适用分类系统言语语义及定义方式〔OWLWebOntologyLanguageSemanticsandAbstractSyntax〕网络适用分类系统言语综述〔OWLWebOntologyLanguageOverview〕网络适用分类系统言语检验个案〔OWLWebOntologyLanguageTestCases〕网络适用分类系统言语指南〔OWLWebOntologyLanguageGuide〕以上规范均在今年2月10日经过成为W3C的引荐级规范18ADL2004深圳语义网第一开展阶段制定的规范可扩展置标言语名域国际码一致资源标识可扩展置标言语构造资源描画框架资源描画框架构造适用分类系统词表逻辑验证诚信数字化签名能自描画的文献数据数据规那么19ADL2004深圳语义网第二开展阶段与第一阶段非常不同在第一阶段的根底上进一步开展百家争鸣,比第一阶段的限制少一些许多建立在RDF之上的新工具和言语许多新的运用RDF和OWL将这些言语和运用联络在一同对新言语进展扩展20ADL2004深圳软件工具的开发〔1〕Protégé-2000/美国斯坦福大学医学院开发运用Java和OpenSource作为操作平台可用于编制适用分类系统和知识库〔KnowledgeBase〕,有可自行设置的数据输入格式,可以输入数据,也可插入插件来扩展一些特殊的功能如提问、XML转换等。输出格式有文本、HTML、JDBC、RDFSchema、及XMLSchema。21ADL2004深圳软件工具的开发〔2〕OntoEditontoprise.de/德国的Ontoprise公司开发提供适用分类系统工程环境,支持构造概念、关系、定理,不依赖于某一表述言语利用模块和插件构造,灵敏性强,并可以方便地引进专门功能和词库。支持RDF和DAML〔DARPAAgentMarkupLanguage,国防高级研讨工程部智能代理置标言语〕,并能输入和输出数据库构造与数据〔如Oracle,MSSQL,DB2〕。22ADL2004深圳语义网根本组成URI作为全球标识,如:exmaple/foo.rdf#bar利用标识在网上进展查找大量的词表—适用分类系统—在领域边缘相互衔接真正的系统普通只在语义网的一小部分范围内任务23ADL2004深圳搜集和编制适用分类系统利用有构造的来源:数据库构造、某些叙词表、术语分类表利用半构造的来源:网页〔特别是XML标志的网页〕、词汇、字典利用无构造的来源:任何其它的文件集合24ADL2004深圳探求性的实验工程利用已有的叙词表或分类表来改呵斥适用分类系统将<艺术和建筑叙词表>中的西方家具部分改呵斥适用分类系统〔Wielinga等,2001〕英国曼彻斯特大学的OpenGalen工程〔Rectoretal2001〕利用现有文献和领域专家从头做起美国加州大学圣巴巴拉分校的地文科学数字化图书馆工程〔Smith&Zeng,2003〕25ADL2004深圳OpenGalen适用分类系统的概念表述实例手术:Insertionofpinsinneckoffemur语句表述:Fixationoffemurbyinsertionofpinsinneckoffemur中介表述:

MAINfixationACTS-ONfemurBY-MEANS-OFinsertionINTOneckACTS-ONpinsINTOneckIS-PART-OFFEMURGRAIL/GALEN实用分类系统PerformancewhichisOf(‘SurgicalFixation’which<actsOnFemurhasSubprocedure(PerformancewhichisOF‘SurgicalInsertion’which<actsOnPinshasLocation(AnatomjicalNeckwhichisLinearDivisionOfFemur)>)>)自动生成的自然语言表述:Fixationoffemurbymeansofinsertionofpinsinneckoffemur”26ADL2004深圳语义网与数字化图书馆〔1〕〔来源:Kashyap,2002)27ADL2004深圳语义网与数字化图书馆〔2〕数字化的信息资源建立了超出传统图书馆效力的物质根底信息查找面的扩展:从文献到现实的查询从文献到现实到知道现实的人〔专家〕对编目索引数据〔元数据〕要求更细:人、事件、地点、事物等之间的关系提供与信息资源相关的详细情况(context)和过程(process)的信息语义网给数字化图书馆提供了超出传统图书馆效力的实际和技术28ADL2004深圳语义网在科研中的运用为科研任务中产生的大量数据提供编制元数据、检索、存档的效力,如:空间卫星扫描地面积累的数据临床药物实验的数据地质勘探数据环境污染监测数据科研数据的元数据、存档、检索有赖于语义网的原理和技术建立学科领域的适用分类系统来制定元数据构造和检索系统利用适用分类系统来促进交叉学科领域的数据分享和再利用29ADL2004深圳例子:利用元数据管理数据发掘的结果〔来源:Springmeyeretal1996〕30ADL2004深圳语义网的运用前景31ADL2004深圳图书馆面临的挑战未来图书馆员需求了解:语义网的实际、规范、技术适用分类系统的设计、编制、实施如何与领域专家、系统设计人员协作开发研制为科研、教育效力的语义网运用工程如何利用语义网的技术为图书馆的现有资源和效力添加价值32ADL2004深圳应付挑战的战略数字化信息资源和效力是趋势,传统图书馆文献处置和效力不能充分利用数字化技术的优势,也无法满足用户的需求应付挑战的战略:着眼于完全数字化的资源:将新文献新数据的产生构造化,为自动生成元数据、有构造的数据打根底着眼于完全数字化的效力:文献、现实、数据等的查找和传送直接在用户的办公桌上完成这两大方面的战略包含一系列利用语义网和适用分类系统地工具和方法33ADL2004深圳语义网研讨开发课题〔1〕按照当前的适用分类系统与有关技术的规范建立中文的适用分类系统:建系统的过程可以先选择几个重要而又常用的运用领域〔如数字化图书馆元数据自动抽取、电子培训、灾难应急系统等〕作为实验,积累一套方法、程序和工具,再推行到其它领域对已建成的外文适用分类系统进展翻译和语义匹配,作为可互操作性的前提34ADL2004深圳语义网研讨开发课题〔2〕对运用领域〔domain〕的构造、词和术语、用户的习惯进展调研,为编制领域适用分类系统(domainontologies)提供可靠的一手资料:利用图书馆已有的知识组织工具〔叙词表和分类法〕和技术〔叙词表和分类法的编制〕,同时结适宜用分类系统、数据库、方法论方面的研讨,结合情报检索技术和方法,以及语义网效力涉及方法与信息模型构造方面的研讨建立语义网的根底,包括适用分类系统的内容〔即专业领域,如医学、财政、制造业等〕35ADL2004深圳参考文献Bernard-Lee,T.(2000).SemanticWeb-XML2000.Available:/2000/Talks/1206-xml2k-tbl/Overview.htmlBernard-Lee,T.(2002).TheSemanticWeb-LCSseminar./2002/Talks/09-lcs-sweb-tbl/Rector,A.L.,C.Wroe,J.Rogers,&A.Roberts,(200

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论