元数据与科学数据信息的组织和管理_第1页
元数据与科学数据信息的组织和管理_第2页
元数据与科学数据信息的组织和管理_第3页
元数据与科学数据信息的组织和管理_第4页
元数据与科学数据信息的组织和管理_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、元数据与科学数据信息的元数据与科学数据信息的 组织和管理组织和管理秦健美国雪城大学信息研究学院/jqin/ 2004年数字图书馆前沿问题高级研讨班2021-10-281提要科学数据信息资源的范围美国政府和民间利用元数据管理利用科学数据信息的做法科学数据信息元数据的标准下一步的计划2021-10-282背景 (1)伴随计算技术的发展产生了大量的科学观察和模拟数据专门学科领域的数据量以tens of terabytes 计, 许多学科正在计划建造更大的数据库用于组织这些数据的概念及相关关系复杂性增加从这些数据库中抽取知识无异于一个巨大的挑战,必须动用最强的系统来应

2、付这样的挑战2021-10-283背景(2)数字化图书馆、数据网格(data grids), 及永久性档案一体化的发展 国会图书馆国家数字化信息基础和保护计划(Library of Congress National Digital Information Infrastructure and Preservation Program) 国家档案纪录管理局以数据格为基础的永久性档案样品 利用数据网格建立国家科学基金会科学数字化图书馆 知识之间相互关系的产生、管理、及检索是信息技术面临的主要挑战Next2021-10-284The BIRN data gridBack2021-10-285科学数

3、据信息资源的范围观察模拟数据 Observation and simulation data分类术语表 Taxonomies数学表达式 Mathematical expressions分子、化学、基因表达式 Molecular, chemical, and genomic expressions结构、物理、计算模型 Structural, physical and computational models表格、图形、图表、地图、图片 Tables, graphs, charts, maps and images实地与试验笔记 Field and laboratory notebooks图书及其

4、它学术文献 Monographs and other scholarly documents述评 Critical reviews and discourse实用分类系统 Ontologies学术文献参考目录 Bibliographic references to scholarly literature2021-10-286美国政府和民间利用元数据管理利用科学数据信息的做法 (1)酝酿 ( 1992-1994): 政府机构牵头制定标准开发(1995-1998): 研究实施对策 将标准草案推出,发动公众对标准草案提修改意见 标准定稿,编制标准使用指南整合服务(1999-现在) 通过建立元数据通

5、道,整合分散的科学数据信息 利用新的信息技术研究深层次组织科学数据信息提供服务的方法2021-10-287美国政府和民间利用元数据管理利用科学数据信息的做法 (2)2021-10-288美联邦科学联盟成员农业部商业部国防部教育部能源部公共卫生部内务部环境保护局国家航空航天部国家科学基金会 由CENDI支持协调2021-10-289目标为从事科学工作的公民,包括专业科学人员、学生、教师、工商业人士、及任何对科学有兴趣的公众,提供跨部门的检索通道来查找和使用经过选取的权威性的美国政府有关科学技术的信息资源。2021-10-2810美联邦科学联盟元数据通道(1)该元数据整合中心集结了各个学科领域的数

6、据库,用户发一个检索指令,可以同时检索分布于全美国的科学数据信息2021-10-2811美联邦科学联盟元数据通道(2)检索过程的界面:2021-10-2812美联邦科学联盟的信息资源最主要的特点是信息的来源和权威性 所收集的信息是有各部门的信息管理人员或图书馆员选取,而不是像商业网站的自动收集 信息内容都产生于政府资助的研究开发项目或类似的有美国政府投入的活动 各部门负责对联邦科学联盟中属于本部门的信息内容进行更新2021-10-2813科学数据信息元数据的标准 (1)2021-10-2814科学数据信息元数据的标准 (2)Biological Data Profile 所有元素分成七大类:标

7、识 (Identification)数据质量 (Data quality)空间数据组织 (Spatial data organization)空间参照 (Spatial reference)实体和特性信息 (Entity and attribute information)发行 (Distribution)元数据参考信息(Metadata reference)2021-10-2815科学数据信息元数据的标准 (3)1.1引用文献信息1.2描述(文摘、目的、补充信息)1.3内容所涉及的时间1.4状态(进展、维护及更新1.5空间地理数据1.6关键词(主题、地点、层次、时间)1.7检索限制1.8使用

8、限制1.9联系信息1.10 图片浏览1.11 数据集制作单位或人员1.12 安全信息1.13 原始数据集环境1.14 交叉参照1.15 分析工具(分析工具描述、工具检索信息、工具联系信息、工具有关文献)标识 (Identification)类下的主要子类:2021-10-2816科学数据信息元数据的标准 (4)关键词是标识类的一个子类,共分主题、地点、层次、时间四大块。主题时间层次地点2021-10-2817科学数据信息元数据的标准 (5)2.1特性准确性(特性准确性报告、计量特性准确性评估)2.2逻辑一致性报告2.3完整性报告2.4位置精确性(横向位置精确性报告、纵向位置精确性报告)2.5数

9、据获取方法及有关文献(方法、来源、过程步骤)数据质量信息(Data quality)2021-10-2818科学数据信息元数据的标准 (6)5.1详细描述(特性名称、定义、定义来源,特性允许值范围、特性允许值的起始日期和终止日期、特性值的精确性信息)5.2综述性的描述(实体和特性综述、实体和特性细节的相关文献)实体和特性信息 (Entity and attribute information)2021-10-2819科学数据信息元数据的标准 (7)6.1发行者6.2资源描述6.3发行责任6.4标准订购过程(电子传送信息、电子传送方法、收费、定购须知、所需时间)6.5特别订购过程6.6技术要求6

10、.7可订购时间信息发行信息(Distribution information)2021-10-2820科学数据信息元数据的标准 (8)7.1元数据日期7.2元数据复核日期7.3元数据未来复核日期7.4元数据联系信息7.5元数据标准名7.6元数据标准版本7.7元数据时间转换7.8元数据检索限制7.9元数据使用限制7.10 元数据安全信息7.11 元数据扩展元数据参照信息(Metadata Reference Information)2021-10-2821部分Biological Data Profile元素2021-10-2822科学数据信息元数据的标准 (8)小结: 元数据标准的庞大和复杂性

11、:对具体系统实施是一个巨大的挑战对元数据制作人员有较高的技能要求需要进行大量的培训工作 检索:联邦科学联盟网站提供按学科的跨数据库检索,分散的站点提供精细专业浏览和检索2021-10-2823科学联盟的下一步发展计划继续加入内容完善规范内容选择和编目指南审查评估目前的分类表开展与政府其它门户网站的连接接纳新的联盟成员开发支持性和能持久的资源2021-10-2824经验与教训建立科学数据信息的元数据标准是一个复杂的过程,需要有一个核心工作委员会来主持、协调,制定政策、设计、及实施计划元数据标准的模式:线性元素结构不适合规模发展 缺乏灵活性、可扩展性 需要大量培训工作人员 需要开发专用软件和程序来实施元数据规范词表的开发得到重视,并在元数据的可互操作性方面发挥作用(跨数据库检索)强调资源的有选择性权威性而忽略了跟踪新技术并利用新技术来解决现有标准和系统的问题2021-10-2825趋势:语义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论