学科信息门户中网络信息导航系统的规范建设_第1页
学科信息门户中网络信息导航系统的规范建设_第2页
学科信息门户中网络信息导航系统的规范建设_第3页
学科信息门户中网络信息导航系统的规范建设_第4页
学科信息门户中网络信息导航系统的规范建设_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学科信息门户中网络信息导航系统的规范建设         标准。 它帮助工作人员明确理解对资源范围和质量的要求,帮助用户理解和信任它的质量控制标准并在此基础上帮助用户判断通过它所获得的信息的质量,促进分布运营机制下资源选择的一致性,帮助训练新的资源选择人员。资源选择评价标准应尽可能地可操作,其中某些可量化。资源选择标准涉及资源范围标准、资源质量标准和资源评价标准。其中:资源范围标准,规定什么资源可被收集组织到学科信息门户,主要涉及:a.信息内容,例如主题范围和可接受的资源类型、资源来源、内容深度、内容权威性、内容新

2、颖性、商业化程度等;b.接入条件,例如可接受的付费条件、技术条件、注册要求、残障人利用条件等;c.细粒度要求,指资源对象应该达到的信息内容详细程度;d.元数据要求,指资源的地理与语言范围等。资源质量标准,规定被选择资源需达到的基本质量,主要包括:a.内容标准,包括有效性、权威性、实质性、准确性、全面性、唯一性、资源结构组织、及时性以及资源维护程度;b.形式标准,包括浏览方便性、用户支持、标准化程度、美观程度;c.处理标准,涉及信息完整性、站点完整性、系统完整性等。资源评价标准,用于规范化地描述选择人员对资源的评价意见,资源评价应按照前述选择标准从多层面描述评价结果,应能确定评价人及其评价资格,

3、应使用标准语言进行描述,还可使用特定标记方式(例如星级标记)来简要表示评价结果,并作为元数据的一部分被存储和支持检索,评价信息可被写入资源描述摘要中。(2)资源选择流程规范。 一个具有一定规模的学科信息导航系统往往有多个专家参与资源的选择评鉴,需要有严格的规范来保证选择过程的一致性。资源选择流程规范规定由什么人、按照什么标准和什么步骤、对什么方面的资源进行选择评价,以及如何处理选择评价结果。具体地,这个规范包括资源选择标准、资源选择流程步骤、选择人员标准、选择人员描述格式(以便选择过程中的推荐、指向和咨询)、选择人员分工组织规定、选择结果描述方式、选择信息交换格式(支持协作选择描述),还可规定

4、是否接受用户推荐资源、接收程序以及对推荐资源的审查和回复程序等。(3)资源搜寻控制。 学科信息导航系统需要严谨的资源搜寻控制机制和相应的搜寻规范来界定搜寻范围、过滤搜寻资源、协调搜寻操作过程,保障在有限的分布的人力下对高质量信息资源进行完整、及时、持续的搜寻,保证搜寻的有效性、一致性和连续性。资源搜寻过程需要规定搜寻途径和方式(即通过哪些途径和方式来搜寻和跟踪哪些资源)、建立和维护搜寻对象目录、分配搜寻责任、确定搜寻时序、确定资源智能过滤规则、确定资源搜寻中元数据挖掘与转换机制、确定推荐资源审查规则、确定与其他学科信息导航系统的合作搜寻机制等。所谓合作搜寻机制,指覆盖领域相互交叉的学科信息导航

5、系统间合作搜寻和共享元数据的方法,例如:a.不同导航系统分工负责交叉领域里不同主题范围的资源组织,在各自知识组织体系中都包含这些主题范围,通过直接链接对方资源元数据来相互利用各自的资源内容。b.不同导航系统分工负责不同主题范围的资源组织,相互交换和复用交叉主题范围的资源元数据,所交换的元数据往往由接收方导航系统进行再标引再组织,从而共同(往往各有侧重地)提供交叉领域的资源检索。无论什么情况,都需要商定分工搜寻范围、数据格式,并遵守共同的质量控制和着录原则。5资源元数据描述学科信息导航系统涉及的描述信息包括资源对象、知识组织体系、使用管理机制、检索与浏览机制等层次,通过开放语言和规范方式对这些层

6、次进行描述都构成元数据17,成为导航系统元数据体系的一部分。高质量的元数据描述是学科信息导航系统知识性可靠性的又一关键保障,也需要一系列的描述规范和过程规范来定义和控制。本节主要讨论对资源对象进行描述的元数据,包括以下内容:(1)元数据规范。元数据规范对元数据元素、 子元素及可能的限制属性进行规定。资源元数据涉及内容和管理两方面。内容元数据对资源本身进行描述,建议采用通用的或标准的元数据格式,采用规范扩展方式复用其他标准元数据格式的相关元素来描述复杂资源对象,并通过XML Namespace方式建立与元数据格式定义文件的链接。 例如对一个课件资源,可采用Dublin Core18描述基本属性,

7、复用IEEE LOM 19相关元素来描述与教学有关的属性。管理元数据用于描述资源着录过程及其控制,一般不显示给用户,可被智能代理用于自动控制某些操作。可能的管理元数据元素包括维护者、上次搜寻日期、上次元数据更新日期、上次资源变动日期、预计资源重新审定日期、资源失效日期(例如会议信息)、元数据着录者等。管理元数据可以与内容元数据捆绑在一起,但也可单独通过一定唯一标识符与内容元数据链接,可支持内容元数据的复用。管理元数据也应采用标准格式和标准扩展方式。(2)元数据着录规范及其他控制规范2022。由于资源元数据可能来自多个途径(例如资源系统本身、用户、资源选择人员、资源着录人员、其他学科信息门户、自

8、动挖掘等),它们对元数据内容的描述方式可能有很大差异,需要通过着录规范来具体规定如何进行元数据描述。规定内容包括:a.元数据内容编码规范,例如关于日期、语言、各种名称代码、主题词来源、分类表来源、评价等级等的标准表达方式或最佳实践(Best Practices)。有关标准可用计算机可识别方式组织,以利着录过程中进行查询和自动检验。b.元数据元素、子元素或限定属性的选择方式。c.主题词、分类号选择标引原则和方式,这时将利用分类标引规范。d.文字描述内容(尤其是摘要、评价意见等)的撰写规范,例如摘要来源、摘要长度、客观性、语言风格、署名等要求。这些着录规范被称为Application Profil

9、es。除了着录规范外,元数据检验规范可规定如何检验元数据的正确性,元数据转换规范支持对资源内含元数据或其他学科信息门户交换元数据进行转换的方法,元数据挖掘规范支持根据资源内容自动析取元数据元素内容。元数据描述过程规范将规定元数据描述的任务、程序、相应规范、有关审核控制机制(形成可靠的工作流),并可用开放语言进行描述而生成工作流元数据,成为元数据描述的工作流管理的基础。(3)主题与分类描述规范。 对资源内容按照标准词表进行标引和分类,是学科导航系统知识性的重要体现,也是导航浏览和检索质量的重要保障。因此,CSDL要求学科信息门户选择本学科的权威、通用、与本学科主要检索工具一致的主题词表和分类法来

10、对导航系统资源进行主题标引和分类,并根据网络资源特点、参照流行网络资源目录和国际上主要学科信息门户来适当扩展与资源类型有关的主题词和分类类目。所选择的词表必须在相应元数据元素的编码规范属性中予以明确,所扩展的词汇或类目必须以定义文件形式进行描述并在编码规范属性中描述和链接,标引分类过程(包括标引分类深度)作为元数据着录规范的一部分予以规定(可参照或直接引用现有的权威标引分类规范)。6知识组织体系描述所谓知识组织体系,是对内容概念及其相互关系进行描述和组织的机制,支持对信息对象按照知识内容和知识结构进行描述、链接和组织。目前阶段,CSDL学科信息导航系统涉及的知识组织体系主要包括主题词表和分类表

11、,今后嵌入语义门户(Semantic Web)和智能检索功能时,还将涉及语义网络(Semantic Networks)和概念集(Ontologies)。对于学科信息导航系统而言,知识组织体系可用            于:资源标引分类,资源主题检索,资源分类浏览,与其他资源系统的检索或浏览互操作。知识组织体系本身也是一种数据,利用开放语言和规范方式对它们进行描述也产生元数据,形成关于知识组织体系的显性知识。可通过对这些元数据的发现、交换和解析来识别、转换、甚至重组知识组织体系,从而支持

12、分布的学科信息导航系统间基于知识的集成以及整合检索和整合浏览23。知识组织体系描述可分为几个层次:(1)说明性描述, 即在各层元数据中对所采用的知识组织体系进行说明,并通过标准URI链接相应的知识组织体系定义文件, 以便用户或用户系统了解学科信息导航系统的知识组织体系。例如,在资源元数据的主题元素中通过编码规范属性定义所采用的词表并链接定义文件,或在学科信息门户信息架构描述文件中描述导航浏览所采用的分类体系并链接定义文件。(2)定义性描述,即直接对知识组织体系结构、构成元素、 元素间关系、构造规则进行定义和描述,所形成的描述文件作为定义文件被链接到有关说明性描述中,以便利用知识组织体系进行扩展

13、检索。例如,NKOS联盟提出VocML24采用标准XML DTD方式来定义和描述叙词表和分类表及词表映射表,支持对词表的开放描述、解析、显示、交换和映射。(3)主题图描述,即利用一定的知识组织体系, 对导航系统资源集合的主题内容结构、主题词汇、主题间相互关系以及主题与具体资源的链接进行描述,形成资源集合的主题图,可直接用于导航系统的知识化浏览,可建立资源集合的主题索引或交叉参照,还可链接复杂主题范围的分布式资源来建立虚拟知识体系,可通过主题概念与资源的不同链接在同一资源体系上建立面向不同主题体系或不同用户的资源界面。例如,XTM25利用XML语言标记主题图,从而用计算机可识别的开放方式标记资源

14、集合的主题结构和链接,支持主题浏览和基于词表的智能检索。(4)概念集描述,即建立符合学科领域要求、 用开放语言描述的概念集体系(Ontology Systems),利用概念集体系对信息资源内容进行语义标注或语义挖掘,形成基于语义的资源元数据。在此基础上,利用概念集中语义定义、语义关系定义和推理规则,实现基于语义的智能检索和浏览26。实施递进建设的CSDL学科信息门户,将首先严格按照元数据规范对知识组织体系进行说明性描述,然后支持以XTM 方式逐步深入地描述分类浏览结构,逐步研究和嵌入词表定义描述,并逐步研究和嵌入基于概念集的语义门户功能。CSDL将通过标准和公开的应用规范对知识组织体系描述方式

15、进行规定,并逐步建立相应的词表、主题图和概念集描述文件。7管理机制描述学科信息门户及其导航系统的可靠运行和可持续发展取决于它在建设和运行中的有效管理以及相应管理机制的规范设计。在CSDL学科信息门户中,与学科信息导航系统密切相关的管理机制包括资源组织机制、资源管理机制、元数据规范管理机制、用户使用控制机制等,其中资源组织机制已在前面的资源选择搜寻控制和资源元数据描述中予以讨论。(1)资源管理机制, 通过一系列规范对学科信息导航库中资源内容的管理方式和程序进行规定,包括资源链接检验规范、资源更新规范、元数据记录维护规范、资源管理流程规范等。其中,资源链接检验规范根据不同资源的变化规律规定对这些资

16、源的可链接性进行检验的时间间隔、检验方式和报告形式,资源更新规范规定对资源内容进行重新审查及其修改描述、修改标引与分类、修改评价信息、删除等处理的标准、责任分配、方式和有关技术要求,资源元数据记录维护规范检验元数据记录的唯一性、一致性、完整性和所链接的其他信息的有效性,资源管理流程规范则建立资源管理工作流程序和控制机制。(2)元数据规范管理机制, 主要指对学科信息导航系统各种元数据规范和管理规范(包括本节涉及的管理机制规范)本身的管理规定,具体说明各种元数据规范和管理规范的描述格式和描述语言、内容描述或编码规则、公共存放位置(以支持开放搜寻)、公共登记要求(以支持元数据规范登记系统功能)、与相

17、关资源内容的链接要求、与相关定义或标准文件的链接要求、范例记录编制及其存放与指向要求、版本管理制度、定期审查要求、审查责任人员、管理流程规定等,从而保证元数据规范或管理规范的有序、可靠和可持续管理。(3)用户使用管理机制,指对信息资源使用的控制机制, 包括合法使用范围规范、用户身份认证方式、使用授权方式、使用审计程序、隐私保护政策等。需要区别狭义和广义的资源使用控制。针对学科信息导航系统,狭义控制指对导航系统内学科信息资源的使用控制,广义控制可能包括对导航系统中的扩展信息、词表数据、规范数据等的使用控制。无论是否限制用户范围,都应确定使用控制规范(因为不限制用户只是使用控制的一种特例),界定什

18、么使用主体(Subject )在满足什么条件(Conditions)下可对什么使用对象(Object)行使什么使用行为(Actions)。这里,使用主体可能是用户或用户组、 用户代理或另一系统,使用对象可以是具体资源、资源范围或数据对象,使用行为包括读、写、改、转换、析取等,而条件可能是使用登记、身份认证、阅读版权申明、填写保证条款、支付费用等。其中某些条件的验证与实现可通过链接第三方程序来具体实施,例如身份认证、支付费用等。CSDL学科信息导航系统将提供学科信息资源的公共浏览检索,但为统计使用情况、了解用户特点,需要进行(往往是隐蔽的)使用统计;对与学科导航信息相链接的用户讨论区、用户发表区

19、等扩展信息和个性化定制等扩展功能,将限制用户范围、要求身份认证;支持各种规范数据的公共查询和阅读,但严格控制对它们的删改;另外,可能只允许其他CSDL学科信息门户和授权用户批量搜寻和下载导航资源来支持分布式导航信息组织和集成定制。8学科信息导航系统的开放描述所谓开放描述,指信息系统通过开放语言和规范方式来描述自己系统的数据对象、规则、管理控制机制和操作过程,支持系统间互操作和基于智能代理的运行操作与管理。通过开放描述,将形成关于本系统不同描述对象的描述文件,这些文件置于本系统公知位置或递交公共登记系统,第三方系统可以对这些描述文件进行搜寻,按照开放语言规则进行解析,从而使第三方系统(或智能代理

20、)能自动地识别、理解本系统的格式和规则,并在此基础上实现系统间的互操作。开放描述并不要求采用统一的具体描述格式,而是规定描述时应遵循的基本原则、底层语义和语法表示方法、标准扩展方式、标准转换机制等,因此不同系统可采用符合自己需要的不同具体方法或格式来描述实际内容,从而在保障各个系统的特殊需要和本地控制的同时,支持描述信息的开放搜寻、识别和系统互操作。对于CSDL学科信息门户及其学科信息导航系统而言,开放描述可分为描述方式和描述信息公布方式两方面的要求,目前阶段公布方式可采用在学科信息门户Web服务器公知目录下以公开文件名存放描述文件,支持第三方系统开放搜寻;当CSDL元数据规范登记系统建立后,

21、将描述文件提交登记系统进行公共查询。对描述方式,可有以下建议:(1)资源元数据格式描述,采用Dublin Core作为元数据核心元素集,采用扩展元素或扩展属性从其他标准元数据集中复用相关元素来描述资源的其他特征,采用Namespace方式命名所复用的元素或属性, 采用XML DTD或RDF方式定义整个元数据集,采用XML 标记和封装输出的资源元数据。(2)知识组织体系描述,采用DC Subject的En            coding Scheme属性描述资源元数据中标引分类词表,

22、通过URL 链接相应的定义文件或介绍文件;采用XTM描述导航分类体系, 其描述文件在一定的使用控制下也置于公知位置机制,供授权的第三方系统(例如其他CSDL学科信息门户)进行查询和调用,支持资源元数据搜寻和整合;逐步支持用VocML 描述的主题词表,相应词表描述文件可能作为第三方定义文件在说明性描述中予以链接,支持嵌入的智能检索功能。(3)管理机制的描述, 涉及面向内部的管理规范和面向第三方的管理规范,前者包括资源组织、资源管理、元数据维护等,后者主要是用户使用控制。面向内部的管理规范可以是文本文件或HTMLXML 文件,应存放在系统公知位置,供公共查询;但也可以用XML DTD 方式定义这些规范,一方面可支持这些规范的交换和复用,另一方面可支持对规范的自动解析和处理(当然需要尽量与国内外现有的开放描述格式接轨)。面向第三方的管理规范应尽量采用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论