版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
科学数据库标准规范建设中国科学院计算机网络信息中心黎建辉提纲为什么需要进行标准规范建设标准规范建设的主要任务数据库分析设计流程与文档规范化元数据建设基本设想科学数据库资源状况数据资源的学科分布地球科学空间数据、自然资源、地球环境、地质生命科学生物多样性、生态环境、基因、病毒化学结构、谱图、反应、化工产品、化合物、化学过程、化学品安全材料科学高分子材料、光学材料、材料腐蚀、纳米材料天文学天文星表、天文观测大气科学大气科学与环境、算法与模式海洋、能源及少量跨学科领域科学数据库资源状况(cont.)数据资源的基本来源实验观测实地考察调查文献资料整理统计分析科学计算镜像科学数据库资源状况(cont.)科学数据库数据的基本类型数值事实文献图像遥感影像地图Video/Audio科学数据库资源状况(cont.)科学数据库数据的组织管理方式结构化(Structured)RelationalDatabase半结构化的(Semi-Structured)Web非结构化的(Unstructured)FileSystem(FlatFile),如实验报告、图形、图像等数据库建设过程中完全的自治性科学数据库建设过程中完全的自治性(autonomous)数据选择数据表示和数据模型数据项的命名对数据所表示的概念和语义的解释系统的功能设计系统与其他系统之间关联和共享数据库的实现自治性带来的异构性自治性带来的异构性硬件平台异构性操作系统异构性数据库系统的异构性数据库管理系统的异构性语义异构性(主要来自于对数据所表示的概念和语义的解释的自治性)各自独立的数据服务DB1DB2DBNSearchingInterface1SearchingInterface2SearchingInterfaceNUserDB1DB2DBNSearchingInterfaceADB1DB2DBNSearchingInterfaceBSDBPortalUserGroupAGroupB数据共享的需求实施数据共享面临的主要问题建库过程中完全的自治性带来的各个层面的异构性系统异构性、语法异构性、语义的异构性等建库过程中缺乏必要的建库文档所带来的数据库的不透明性和不可控制性缺乏对数据质量的评估,不能保证数据的精确性和完整性部分建库单位不能提供长期稳定的数据服务对数据共享认识上的差异知识产权方面的顾虑与担心提纲为什么需要进行标准规范建设标准规范建设的主要任务数据库分析设计流程与文档规范化元数据建设基本设想主要任务元数据标准体系的研究和制订数据集的元数据标准各学科领域典型的元数据标准数据标准体系研究数据质量评估标准管理规范体系研究数据共享的政策与规范科学数据库运行服务体系提纲为什么需要进行标准规范建设标准规范建设的主要任务数据库分析设计流程与文档规范化元数据建设基本设想数据库建库分析与文档建设数据资源分析元数据分析数据库设计应用开发更新维护数据说明元数据需求规格书数据库设计说明书应用开发文档更新维护文档数据库建设文档数据库建库分析与文档建设科学数据库文档模板草案数据库设计说明书数据分析说明元数据分析说明数据库外部设计说明结构设计说明运用设计说明数据库应用需求说明书数据更新维护说明书2002年8.20-9.20向各建库单位征求意见,2002年10月经专家委员会认可后发布执行提纲为什么需要进行标准规范建设标准规范建设的主要任务数据库分析设计流程与文档规范化元数据建设基本设想科学数据库元数据的定义科学数据库中元数据的基本定义元数据是对科学数据库系统中的数据和数据集的内容、质量、状态、使用等相关特性的结构化的描述,其目的是使用户能快速、便捷地发现和访问数据,正确地理解数据、评价数据和使用数据;使管理者能有效地管理数据并对数据访问进行控制。关于数据的元数据数据关于数据的解释和说明元数据数据内容数据质量数据对象/信息对象数据状态数据使用关于数据的元数据关于数据的元数据主要功能与作用说明数据的内涵和意义描述数据产生环境、条件及数据质量等相关信息保证数据的精确性和完整性关于数据的元数据建设情况以结构化的数据库组织管理的数据以非结构化的形式组织管理的数据关于数据集的元数据数据元数据数据元数据数据元数据数据集数据类型相同元数据结构和描述方法相同数据集元数据关于数据集内容、质量、结构等相关属性的描述关于数据集的元数据数据集层面的元数据主要功能与作用标识数据集描述数据集的上下文信息数据集的管理帮助用户发现、定位、使用数据集及数据集中的数据科学数据库元数据标准/格式形成数据集或某类数据资源的元数据的所有规则集合。不同类型的资源可能有不同的元数据标准/格式。完整的元数据标准/格式应该包括元数据项的结构和语义元数据著录规则(控制词汇表)元数据编码规则(语法)同类资源的元数据遵循同样的元数据标准/格式可以实现元数据共享与互操作,同时也容易实现资源的共享元数据标准的作用标准化可以实现数据的交换和共享通过元数据格式(MetadataFormat)的标准化,实现数据模型的规范化和标准化(CommonDataModel) ,一定程度上消除数据库语义上的异构性通用的数据模型可以作为新建数据库内容分析的参考,保证数据库内容的精确性和完整性建立起不同的元数据格式之间互通的桥梁,从而通过元数据实现数据的共享和互操作标准化可以实现经验和技术的共享共享学科领域通用的工具(如数据分析工具、数据可视化显示工具等)元数据标准的作用DBADBBSchemaASchemaBDATAData+MetadataData+Metadata元数据标准的作用DBADBBSchemaASchemaBDATAData+MetadataData+MetadataCommonSchema科学数据库元数据标准框架三层基本架构科学数据库数据集元数据标准(Collections)科学数据库学科领域数据元数据标准(Items)元数据交换标准(interoperability)科学数据库元数据标准框架(2)科学数据库完整的数据集元数据包括数据集描述信息(描述型元数据)标识信息编目信息(cataloging)查找辅助信息(FindingAids)关联信息(Relationships)数据集管理信息(管理型元数据)知识产权信息访问控制信息数据质量信息科学数据库元数据标准框架(3)科学数据库完整的数据集元数据包括数据集结构信息本地数据模型(LocalSchema/LocalDataModel)共享数据模型(DisciplineCommonSchema/CommonDataModel)数据集技术信息(Technical)数据集存储软硬件环境信息数据集加密与认证信息数据集使用信息其它参考信息科学数据库元数据标准框架(4)科学数据库数据集元数据标准实施基本原则模块化科学数据库核心元数据+学科领域必须元数据+可选元数据著录规则:分析建设科学数据库数据集分类与主题词汇表(ControlVocabulary)语法规则:XMLSchema+RDFSchema科学数据库元数据标准框架(5)科学数据库学科元数据标准(CDM)依学科或资源类型分类和分析作为某一学科内通用的共享数据模型(CDM)著录规则:依各学科分析和建立必要的著录控制词汇表(ControlVocabulary)语法规则:XMLSchema科学数据库元数据标准框架(6)交换元数据标准有关联的学科元数据标准进行抽象与聚合,形成领域核心元数据(CommonCore)不同学科元数据标准进行一对一映射,建立映射表(Mapping/Crosswalk)科学数据库数据共享本体(Ontology)数据集元数据标准数据集元数据标准分析原则自顶向下进行分析,本着与国际通用的元数据标准接轨,简单、实用的原则进行分析以DC、FGDC/ISO19115为基本的参考标准,结合科学数据实际分析出科学数据库数据集核心元数据在核心元数据的基础上,分几个大的学科领域分析其学科领域必须的元数据,形成数据集元数据标准中一定条件下可选的元数据项最后根据科学数据库未来发展的方向以及数据网格等先进应用系统的需要发展可选的元数据项数据集元数据标准的实施2003年年中推出数据集元数据标准第一版,在得到专家委员会和建库单位的认可后,开始推广实施。数据中心将开发出元数据著录和管理工具,供建库单位使用数据中心将在各数据库数据集元数据建设的基础上,开发科学数据库综合目录(元目录)服务系统(catalog/clearinghouse)数据集元数据标准(Cont.)数据集元数据标准分析流程需求分析需求分析报告标准评估标准评估报告标准设计元数据标准草案著录检验和调整检验报告数据集元数据标准(Cont.)数据集元数据标准分析流程应用分析需求规格书建立实验系统系统说明书和使用说明书联机试验著录联机实验报告系统评估系统评估报告元数据标准推荐报告关于数据的元数据标准实施原则自底向上,以数据资源特定的内涵为基础,保持与国际通用标准兼容在实例分析的基础上归纳、提炼出各学科共享元数据标准各学科内共享元数据标准以XML的格式编码,即可以作为数据交换和共享的标准,又可以作为(元)数据库建设的参考模型。基于内涵的实例分析首先支援计划建立元数据库的单位,资源的类型包括实验报告、数据文件、图形、图像等。
关于数据的元数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年江铃汽车集团财务有限公司招聘笔试参考题库含答案解析
- 2024年农网配电营业工(中级工)技能等级认证备考试题库-下(判断题)
- 四川省泸州市泸县第五中学2025届高三上学期第一次诊断性考试(一模)政治试题 含解析
- 清远2025年广东清远市公安局第一次警务辅助人员招聘5人笔试历年参考题库附带答案详解
- 深圳2025年上半年广东深圳法院劳动合同制审判辅助人员招录109人笔试历年参考题库附带答案详解
- 教育科技引领的家庭教育变革与挑战
- 二零二五年度宠物猫进出口贸易合同范本4篇
- 汕头2025年广东汕头市龙湖区司法局招聘司法协理员专项临聘人员笔试历年参考题库附带答案详解
- 杭州浙江杭州桐庐县机关事务服务中心招聘编外工作人员笔试历年参考题库附带答案详解
- 2025年华师大新版九年级历史下册阶段测试试卷含答案
- 开展课外读物负面清单管理的具体实施举措方案
- 2025年云南中烟工业限责任公司招聘420人高频重点提升(共500题)附带答案详解
- 2025-2030年中国洗衣液市场未来发展趋势及前景调研分析报告
- 2024解析:第三章物态变化-基础练(解析版)
- 北京市房屋租赁合同自行成交版北京市房屋租赁合同自行成交版
- 《AM聚丙烯酰胺》课件
- 系统动力学课件与案例分析
- 《智能网联汽车智能传感器测试与装调》电子教案
- 客户分级管理(标准版)课件
- GB/T 32399-2024信息技术云计算参考架构
- 固定资产盘点报告医院版
评论
0/150
提交评论