元数据与科学数据信息的组织和管理_第1页
元数据与科学数据信息的组织和管理_第2页
元数据与科学数据信息的组织和管理_第3页
元数据与科学数据信息的组织和管理_第4页
元数据与科学数据信息的组织和管理_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

元数据与科学数据信息的组织和管理秦健美国雪城大学信息研讨学院/~jqin/2004年数字图书馆前沿问题高级研讨班提要科学数据信息资源的范围美国政府和民间利用元数据管理利用科学数据信息的做法科学数据信息元数据的规范下一步的方案2024/1/262ADL2004深圳背景〔1〕伴随计算技术的开展产生了大量的科学察看和模拟数据专门学科领域的数据量以tensofterabytes计,许多学科正在方案建造更大的数据库用于组织这些数据的概念及相关关系复杂性添加从这些数据库中抽取知识无异于一个宏大的挑战,必需动用最强的系统来应付这样的挑战2024/1/263ADL2004深圳背景〔2〕数字化图书馆、数据网格〔datagrids〕,及永久性档案一体化的开展国会图书馆国家数字化信息根底和维护方案〔LibraryofCongressNationalDigitalInformationInfrastructureandPreservationProgram〕国家档案纪录管理局以数据格为根底的永久性档案样品利用数据网格建立国家科学基金会科学数字化图书馆知识之间相互关系的产生、管理、及检索是信息技术面临的主要挑战Next2024/1/264ADL2004深圳TheBIRNdatagridBack2024/1/265ADL2004深圳科学数据信息资源的范围察看模拟数据Observationandsimulationdata分类术语表Taxonomies数学表达式Mathematicalexpressions分子、化学、基因表达式Molecular,chemical,andgenomicexpressions构造、物理、计算模型Structural,physicalandcomputationalmodels表格、图形、图表、地图、图片Tables,graphs,charts,mapsandimages实地与实验笔记Fieldandlaboratorynotebooks图书及其它学术文献Monographsandotherscholarlydocuments述评Criticalreviewsanddiscourse适用分类系统Ontologies学术文献参考目录Bibliographicreferencestoscholarlyliterature2024/1/266ADL2004深圳美国政府和民间利用元数据

管理利用科学数据信息的做法〔1〕酝酿(1992-1994):政府机构牵头制定规范开发〔1995-1998〕:研讨实施对策将规范草案推出,发动公众对规范草案提修正意见规范定稿,编制规范运用指南整合效力〔1999-如今〕经过建立元数据通道,整合分散的科学数据信息利用新的信息技术研讨深层次组织科学数据信息提供效力的方法2024/1/267ADL2004深圳美国政府和民间利用元数据

管理利用科学数据信息的做法〔2〕整合效力〔续〕详细过程:建立跨政府部门的结合委员会(CENDI)委员会下设两个关键的研讨组:中心政策组与技术设计组在目的、政策、和设计方面获得一致意见为阅读建立分类类目选取、编目、索引政府各部门的资源结合委员会与政府有关的工程〔如)挂钩2002年春天试运转2002年12月正式运转:2024/1/268ADL2004深圳美联邦科学联盟成员农业部商业部国防部教育部能源部公共卫生部内务部环境维护局国家航空航天部国家科学基金会由CENDI支持协调2024/1/269ADL2004深圳目的为从事科学任务的公民,包括专业科学人员、学生、教师、工商业人士、及任何对科学有兴趣的公众,提供跨部门的检索通道来查找和运用经过选取的权威性的美国政府有关科学技术的信息资源。2024/1/2610ADL2004深圳美联邦科学联盟元数据通道〔1〕该元数据整合中心集结了各个学科领域的数据库,用户发一个检索指令,可以同时检索分布于全美国的科学数据信息2024/1/2611ADL2004深圳美联邦科学联盟元数据通道〔2〕检索过程的界面:2024/1/2612ADL2004深圳美联邦科学联盟的信息资源最主要的特点是信息的来源和权威性所搜集的信息是有各部门的信息管理人员或图书馆员选取,而不是像商业网站的自动搜集信息内容都产生于政府资助的研讨开发工程或类似的有美国政府投入的活动各部门担任对联邦科学联盟中属于本部门的信息内容进展更新2024/1/2613ADL2004深圳科学数据信息元数据的规范〔1〕BiologicalDataProfileEcologicalMetadataLanguage(EML)ContentStandardforDigitalGeospatialMetadata(CSDGM):Governmentstandardforgeospatialmetadata/metadata/contstan.htmlGeographyMarkupLanguage,v2.0/gml/01-029/GML2.htmlNeesML(NetworkforEarthquakeEngineeringSimulationMetadataLanguage)/repository/index.html2024/1/2614ADL2004深圳科学数据信息元数据的规范〔2〕BiologicalDataProfile一切元素分成七大类:标识〔Identification)数据质量(Dataquality)空间数据组织(Spatialdataorganization)空间参照(Spatialreference)实体和特性信息(Entityandattributeinformation)发行(Distribution)元数据参考信息(Metadatareference)2024/1/2615ADL2004深圳科学数据信息元数据的规范〔3〕1.1 援用文献信息1.2 描画〔文摘、目的、补充信息〕1.3 内容所涉及的时间1.4 形状〔进展、维护及更新1.5 空间地理数据1.6 关键词〔主题、地点、层次、时间〕1.7 检索限制1.8 运用限制1.9 联络信息1.10 图片阅读1.11 数据集制造单位或人员1.12 平安信息1.13 原始数据集环境1.14 交叉参照1.15 分析工具〔分析工具描画、工具检索信息、工具联络信息、工具有关文献〕标识(Identification)类下的主要子类:2024/1/2616ADL2004深圳科学数据信息元数据的规范〔4〕关键词是标识类的一个子类,共分主题、地点、层次、时间四大块。主题时间层次地点2024/1/2617ADL2004深圳科学数据信息元数据的规范〔5〕2.1 特性准确性(特性准确性报告、计量特性准确性评价〕2.2 逻辑一致性报告2.3 完好性报告2.4 位置准确性〔横向位置准确性报告、纵向位置准确性报告〕2.5 数据获取方法及有关文献〔方法、来源、过程步骤〕数据质量信息〔Dataquality)2024/1/2618ADL2004深圳科学数据信息元数据的规范〔6〕5.1 详细描画〔特性称号、定义、定义来源,特性允许值范围、特性允许值的起始日期和终止日期、特性值的准确性信息〕

5.2 综述性的描画〔实体和特性综述、实体和特性细节的相关文献〕实体和特性信息(Entityandattributeinformation)2024/1/2619ADL2004深圳科学数据信息元数据的规范〔7〕6.1 发行者6.2 资源描画6.3 发行责任6.4 规范订购过程〔电子传送信息、电子传送方法、收费、定购须知、所需时间〕6.5 特别订购过程6.6 技术要求6.7 可订购时间信息发行信息〔Distributioninformation)2024/1/2620ADL2004深圳科学数据信息元数据的规范〔8〕7.1 元数据日期7.2 元数据复核日期7.3 元数据未来复核日期7.4 元数据联络信息7.5 元数据规范名7.6 元数据规范版本7.7 元数据时间转换7.8 元数据检索限制7.9 元数据运用限制7.10 元数据平安信息7.11 元数据扩展元数据参照信息〔MetadataReferenceInformation)2024/1/2621ADL2004深圳部分BiologicalDataProfile元素<!ELEMENTmetadata(idinfo,dataqual?,spdoinfo?,spref?,eainfo?,distinfo*,metainfo)><!ELEMENTidinfo(citation,descript,timeperd,status,spdom?,keywords,taxonomy?,accconst,useconst,ptcontac?,browse*,datacred?,secinfo?,native?,crossref*,tool*)><!ELEMENTcitation(citeinfo)><!ELEMENTdescript(abstract,purpose,supplinf?)><!ELEMENTtimeperd(timeinfo,current)><!ELEMENTstatus(progress,update)><!ELEMENTspdom(descgeog,bounding,dsgpoly*)><!ELEMENTbounding(westbc,eastbc,northbc,southbc,boundalt?)><!ELEMENTdsgpoly(dsgpolyo,dsgpolyx*)><!ELEMENTdsgpolyo((grngpoin,grngpoin,grngpoin,grngpoin+)|gring)><!ELEMENTdsgpolyx((grngpoin,grngpoin,grngpoin,grngpoin+)|gring)><!ELEMENTgrngpoin(gringlat,gringlon)>2024/1/2622ADL2004深圳科学数据信息元数据的规范〔8〕小结:元数据规范的庞大和复杂性:对详细系统实施是一个宏大的挑战对元数据制造人员有较高的技艺要求需求进展大量的培训任务检索:联邦科学联盟网站提供按学科的跨数据库检索,分散的站点提供精细专业阅读和检索2024/1/2623ADL2004深圳科学联盟的下一步开展方案继续参与内容完善规范内容选择和编目指南审查评价目前的分类表开展与政府其它门户网站的衔接接纳新的联盟成员开发支持性和能耐久的资源2024/1/2624ADL2004深圳阅历与教训建立科学数据信息的元数据规范是一个复杂的过程,需求有一个中心任务委员会来主持、协调,制定政策、设计、及实施方案元数据规范的方式:线性元素构造不适宜规模开展缺乏灵敏性、可扩展性需求大量培训任务人员需求开发公用软件和程序来实施元数据规范词表的开发得到注重,并在元数据的可互操作性方面发扬作用〔跨数据库检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论