




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
科学数据分类与编码标准讲课人:何建邦,曹彦荣时间:2006年5月24日1科学数据分类与编码标准讲课人:何建邦,曹彦荣1主要内容编制背景标准总体结构标准内容要点解析标准使用2主要内容编制背景2简介3简介3科学数据分类与编码方案1范围2规范性引用文件3术语和定义4分类原则5分类方法6编码规则7分类与编码的使用8分类代码表4科学数据分类与编码方案1范围4分类类目释义6大门类、31亚门类、234大类和1008中类,共1279条类目的释义
5分类类目释义6大门类、31亚门类、234大类和1008中类,电子词典主要功能分类类目的管理分类类目的查询数据集标引分类映射……6电子词典主要功能6转换实例——mapping机制分别对每个试点的分类作相应的Crosswalk,实现标准之间的映射;试点已有的标引结果可以通过软件直接映射。7转换实例——mapping机制分别对每个试点的分类作相应的C一、编制背景8一、编制背景8背景海量科学数据的共享需求海量科学数据需要有序组织、管理科学数据共享工程门户网站需要按照分类来组织数据目录数据用户需要从分类编码中查询数据9背景海量科学数据的共享需求9解决的问题多学科、跨行业部门科学数据的分类分类编码如何应用如何支持网络信息化的数据集分类和共享与已有科学数据共享工程中诸多试点的分类标准之间如何交互10解决的问题多学科、跨行业部门科学数据的分类10二、标准总体结构11二、标准总体结构11标准目次1范围2规范性引用文件3术语和定义4分类原则5分类方法6编码规则7分类编码的使用8分类代码表附录A资料性附录科学数据共享工程分类编码标准的使用实例附录B资料性附录本标准与科学数据共享工程中试点单位的分类标准之间的映射附录C资料性附录科学数据共享工程数据分类编码标准XML文件12标准目次1范围附录A资料性附录科学数据共享工程分类编门类门类代码基础科学F资源环境科学R农业科学A工程技术科学T医药卫生科学H区域与综合领域C13门类门类代码基础科学F资源环境科学R农业科学A工程技术科学T亚门类(资源环境科学为例)资源环境亚门类代码气象气候W水文水资源H海洋S地矿与土地资源科学L…………14亚门类(资源环境科学为例)资源环境亚门类代码气象气候W水文水大类门类亚门类大类代码资源环境科学海洋科学海洋资源11海洋经济12海洋环境13海洋生态14海洋灾害15…………15大类门类亚门类大类代码海洋资源11海洋经济12海洋环境13海中类门类亚门类大类中类代码总代码资源环境科学海洋科学海洋资源海洋自然资源11RS1111海洋生物资源12RS1112大洋矿产资源13RS1113海水化学资源14RS1114………………16中类门类亚门类大类中类代码总代码海洋自然资源11RS1111编码规则门类、亚门类各为1位英文字母码,大类、中类各2位数字码。采用线分类按门类、亚门类、大类、中类的从属关系顺序编码。第1位第2位第3位第4位第5位第6位门类亚门类大类中类字母码字母码数字码数字码17编码规则门类、亚门类各为1位英文字母码,大类、中类各2位数字三、标准内容要点解析18三、标准内容要点解析18分类依据(1)遵循“数据分类与编码基本原则与方法”标准
数据分类的基本单元(或者说分类的对象)是数据集保证高层数据分类统一,低层数据分类由各单位自行研制以数据中心有效管理、组织数据,最终用户快捷地查找数据为目的
19分类依据(1)遵循“数据分类与编码基本原则与方法”标准19分类依据(2)以科学数据共享工程的规划为依托
充分考虑各个数据共享中心的分类编码结合学科分类标准、行业分类标准20分类依据(2)以科学数据共享工程的规划为依托20分类编码标准的应用该标准只适用于数据集的分类,并将分类结果组织形成数据目录。该标准不适用于数据库的改造,数据项的改造,数据项内容的代码填写等。
21分类编码标准的应用该标准只适用于数据集的分类,并将分类结果组分类编码标准的维护随着科学数据共享工程的不断推进,该分类编码标准必定会不断扩展和修订。这种扩展必须是在遵从“数据分类与编码基本原则与方法”的基础上的扩充。22分类编码标准的维护随着科学数据共享工程的不断推进,该分类编码数据集的分类标引分类标引的对象是数据集
分类标引是在数据集外部进行的
分类标引的最终结果是标引结果集(数据库)
23数据集的分类标引分类标引的对象是数据集23标引过程中组配方法的应用在分类标引时,针对数据集的内容,从类目中找出与数据集内容相对应的各个类目,用它们的编码组配表达所标引的数据集内容。
24标引过程中组配方法的应用在分类标引时,针对数据集的内容,从类标准的映射及标引结果集的转换把各个数据中心采用的分类编码标准中的类目和科学数据分类编码标准中的类目对应起来。
把用数据中心分类编码标准标引的结果集,直接导入到以科学数据分类编码标准为依据的标引结果集中。
25标准的映射及标引结果集的转换把各个数据中心采用的分类编码标准四、标准的使用26四、标准的使用26示例一:林业科学数据中心的“森林资源概况表”数据集通过分析该数据集的内容,应该属于“农业科学—林业科学—森林资源数据”,在“森林资源数据”这个大类下,有“全国森林资源数据”、“省级森林资源数据”等小类,可以根据查阅数据集的具体内容,得出应该属于哪个小类。如,这个数据集是全国范围内的森林资源概况,则最后的类就是“农业科学—林业科学—森林资源数据—全国森林资源数据”,具体编码为:AF1112。27示例一:林业科学数据中心的“森林资源概况表”数据集通过分析该示例二:农业科学数据中心的“主要农作物种质资源评价数据库”通过分析该数据集的内容,应该属于“农业科学—农业科学数据—作物科学-主要农作物种质资源评价数据”,则具体编码为:AS1211。28示例二:农业科学数据中心的“主要农作物种质资源评价数据库”通示例三:农业科学数据中心的“中国湖泊数据库”通过分析该数据集的内容,发现其既可以属于“农业科学—农业科学数据—水产科学”(编码为:AS2113),又可以属于“资源环境科学—水文水资源科学—水资源—水资源调查”(编码为:RH1211)。因此,可以采用组配的方式,将这两个类目的代码,全部标注在这个数据集上。29示例三:农业科学数据中心的“中国湖泊数据库”通过分析该数据集示例四:医药卫生科学数据集使用范例30示例四:医药卫生科学数据集使用范例30科学数据分类编码工具软件31科学数据分类编码工具软件31电子词典软件框架32电子词典软件框架32电子词典功能标准的管理和维护查询以类名查询,以代码查询,以释义查询;精确查询,模糊查询。标引映射33电子词典功能标准的管理和维护33标引——保证标准和数据之间的关系SDCC数据集A标引数据库用户1用户2检索1检索2得到数据集A标引系统轮排从外部进行标引,数据集本身无需任何变动34标引——保证标准和数据之间的关系SDCC数标引数据库用户1用关键技术(1)高效的信息管理和查询灵活地管理机制,可实现多层次的分类树的高效存储;实现了类目和代码的双向查询采用了高效的算法,可以支持10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全生产管理制度总则
- 畜牧业的生态农业与生态环境考核试卷
- 灯具销售中的客户关系深化策略考核试卷
- 橡胶制品的发展趋势与未来展望考核试卷
- 玉米种植农业转基因技术安全性评价考核试卷
- 玻璃纤维在室内装饰材料中的应用考核试卷
- 拖拉机田间作业性能考核试卷
- 2025年华为认证HCIA Storage H13-611存储考试题库(含答案)
- 第3章 新媒体营销时代的用户分析
- 超市食品安全知识培训内容
- 甲状腺危象危重症护理常规
- 《炎症性肠病课件》课件
- (2025)专业技术人员继续教育公需课题库(附含答案)
- 小学一年级班主任工作实习计划(16篇)
- 肿瘤科护理沟通技巧
- 生物识别技术保障个人隐私
- 第四单元 民族团结与祖国统一 -【背诵清单】2022-2023学年八年级历史下册期末复习必背核心知识梳理(部编版)
- 2025年高考政治一轮复习知识清单选择性必修三 《逻辑与思维》知识点复习
- 基于物联网的农产品质量安全监测平台建设方案
- 临床肠气囊肿病影像诊断与鉴别
- DB11T 382-2017 建设工程监理规程
评论
0/150
提交评论