![大学图书馆开展数据管理服务的实践和成效评析_第1页](http://file4.renrendoc.com/view/0565292803e3985a7cd5a03165eb8ba6/0565292803e3985a7cd5a03165eb8ba61.gif)
![大学图书馆开展数据管理服务的实践和成效评析_第2页](http://file4.renrendoc.com/view/0565292803e3985a7cd5a03165eb8ba6/0565292803e3985a7cd5a03165eb8ba62.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、PAGE 20 -大学图书馆开展数据管理服务的实践和成效评析1 引言面对数字化科研蓬勃发展带来的机遇和挑战,图书馆不应延续只提供文献资料和学习场所的发展路径,更应当提供创新性的科学数据管理服务,帮助科研人员解决数据管理难题,满足科研资助机构的政策要求。进入21世纪以来,许多世界一流大学图书馆顺势而为,积极转变图书馆业务定位,提供系列科学数据管理服务,建立了有效的服务模式。它们发挥自身优势,加强与校内其他相关机构的协同,建设和管理数据资源集成和服务接入平台,以科学数据管理生命周期为依据,以科研资助机构政策要求为导向,采取在线服务、人工咨询、培训研讨等方式,提供数据管理计划编制、数据存储、数据分享
2、系列化服务,取得了显著成效。不仅为科研人员解决了数据管理难题,提高了科研效率和效益,保证了数据安全和有效分享,满足了科研资助机构的政策要求,也加强了图书馆与校园内其他相关机构的合作,提升了图书馆的地位,使图书馆员成为科研伙伴和科技创新的参与者。目前,我国出台了国家层面的科学数据管理政策制度,建立了国家科学数据管理的总体框架。但是与发达国家的科学数据管理相比还有非常大的差距,主要表现在4个方面:一是我国开展科学数据管理服务的大学图书馆还很少,而发达国家的一流大学图书馆已经基本开展了科学数据管理服务,我国图书馆界需要加倍努力,迎头赶上;二是我国大学图书馆提供的科学数据管理服务还很不完善,远远达不到
3、全生命周期科学数据管理的要求;三是我国符合国际标准的科学数据库数量很少,不能适应创新发展的要求;四是我国亟待加强科学数据管理的国际合作,成为科学数据管理国际协作网络的重要参与者。为了贯彻落实国家加强科学数据管理的决策,缩小与发达国家的差距,我国大学图书馆需要认真研究借鉴国外一流大学图书馆开展数据管理服务的实践经验,总结提炼图书馆开展科学数据管理服务的关键要素和成功模式,找到提升我国科学数据管理水平的科学方法和路径。2 加强科学数据管理工作的必要性科学数据是指作为研究对象的数据,以及用于证明科学发现的数据1。从数据来源上看,它包括来自实验、观察、探测、仿真、调查等活动的一手数据,还包括来自公共部
4、门或其他研究者的二手数据。从数据内容上看,它包括数据文件、说明文档、用来处理数据的软件等2-3。随着数字化技术的深入发展,数字化数据已经成为科学数据的主体。数字化数据是指所有以数字格式生产的科学数据、已经数字化了的模拟数据、用于描述科学数据的数字化元数据4。自从2022年以来,数字化数据占全部新增数据的90%以上,其总量大大超过了纸质信息量4,世界科研范式发生深刻变革,进入了数字化科研时代5。2.1 科学数据量加速增长需要第三方提供数据管理服务数据量大、处理成本高是数字化科研的重要特点。从世界科学史的角度来看,世界科研产出量呈加速增长的趋势。从17世纪中期到18世纪中期,世界科研产出量每年增加
5、不到1%;18世纪中期到二战前,每年增加约2%3%;二战后至2022年,每年增加约8%9%,大概每9年就会翻一番6。近年来在数字化技术的推动下,科学数据量翻番速度显著提高。以天文观测、实验物理、基因测序为代表的数据密集学科,其科学数据量大约每年翻一番7。2022年欧洲核子研究组织的大型粒子对撞机所产生的数据量甚至比2022年翻了5倍8。科研人员撞到了强大的数据墙,数据处理和分析占据了科研人员很大精力,一般占到实验成本的1/4到1/2对于数据密集学科来说,科研人员在获得原始数据之后,往往需要成千上万人编写几百万行代码,用于处理数据,耗费了大量人力物力1。因此迫切需要第三方机构特别是图书馆提供科学
6、数据管理服务,以便降低数据处理成本,提高科研活动效率和效益。2.2 数字化科研要求实现基于数据的成果复制和共享可复制性是现代科研的重要要求,研究成果不能复制、主要实验不能重复的科研活动,不但不被科学界认可,还会严重损害科研人员的科学信誉。而掌握高质量的科学数据是实现科学成果可复制的关键,因为科学数据是开展科研活动的重要条件,没有科学数据的有效支撑,科研活动寸步难行,更谈不上科研结果的有效复制。在数字化科研方式下,研究人员可以借助科学数据管理系统,实现全生命周期科学数据管理,提高数据处理的效率,做好数据计划、数据收集、数据存储、数据分析、数据发送等工作,保证数据安全和质量,支持可重复的科研工作。
7、已完成的科研成果还要以科学数据为主要形式开放共享,用以支持将来的研究,帮助获得新的发现,推动研究不断深入,提高科研成果的社会价值。2.3 国家科研资助机构要求加强科学数据管理为适应数字化科研的新要求,近年来许多国家的科研资助机构都制定了科学数据管理政策,把提交数据管理计划和开展数据共享作为申请科研资助的必要条件和硬性要求。我国出台科学数据管理办法,要求适应大数据发展形势,加强和规范科学数据管理,积极推进科学数据资源开发利用和开放共享。科学数据管理办法明确了我国科学数据管理的责任机构、管理流程、共享方式和安全保密要求,建立了国家总的科学数据管理框架9。美国国家科学基金、国家医学基金、国家人文科学
8、基金三大基金都对数据管理提出了明确政策要求。美国国家科学基金会(National Science Foundation,简称NSF)规定,基金申请人必须提供数据管理计划,说明如何保存和管理科学数据,必须遵守相关数据分享政策。美国国家医学科学院(National Institute of Health,简称NIH)规定,申请50万美元以上的研究项目要提供数据分享计划,产生大量数据的基因研究项目无论资助额大小都要向后续项目开放分享数据。美国国家人文科学基金会(National Endowment for the Humanities,简称NEH)要求立项申请书中必须包括数据管理计划,获奖申请书中也
9、必须包括数据管理计划10。英国研究理事会(Research Councils UK,简称RCUK)和英国威康信托基金会(Wellcome Trust)已经出台了多项数据管理政策,鼓励研究人员尽可能快地以尽可能小的限制公开他们的科学数据。英国研究理事会下面的工程和物理科学研究理事会(The Engineering and Physical Sciences Research Council,简称EPSRC)还着重对研究机构提出了应承担的数据分享责任,要求它们在全部数据生命周期上至少提供十年的数据管理服务11。加拿大也针对联邦资助的科研项目制定了数据管理政策。2022年,加拿大卫生研究院(Cana
10、dian Institutes of Health Research,简称CIHR)、加拿大自然科学和工程研究理事会(Natural Sciences and Engineering Research Council of Canada,简称NSERC)、加拿大社会人文科学研究理事会(Social Sciences and Humanities Research Council of Canada,简称SSHRC)三大国家科研资助机构,出台了关于数据管理原则的草案。该草案明确了研究者、研究机构、资助者的相关责任,支持最大限度地开放政府资助项目数据,要求制定数据管理计划,实现数据公开分享12。2
11、.4 科技期刊要求提供充足的科学数据除了科研资助机构对数据管理的要求之外,科技期刊也对论文提出了数据管理要求,要求提供充足数据,促进科学数据共享,保证科研成果的可复制性。著名科技期刊自然(Nature)要求向读者及时提供与论文相关的素材、数据、代码等1。美国政治科学杂志(American Journal of Political Science)要求使用脚注等方式为读者提供数据,并且提供数据分析文档以实现科研成果可复制。美国政治科学评论杂志(American Political Science Review)要求提供数据文档,充分详细地描述研究分析流程,便于读者了解评价科研成果的来龙去脉。英国
12、伦敦动物学会出版的期刊动物保护(Animal Conservation)规定,在该刊发布的DNA数据必须存储到EMBL、GenBank、DDBJ三大核苷酸数据库之一,必须在论文中公布基因序列号,允许公开查询13。3 图书馆科学数据管理服务的基础设施和服务内容为了帮助科研人员管理好科学数据,支持科技创新,许多世界一流大学的图书馆较早开展了科学数据管理服务,已经建立了比较完善的信息基础设施,形成了自己的服务方式,能够提供比较规范和丰富的服务内容。其实践经验主要包括如下3个方面:一是建立了数据管理服务综合平台,发挥资源集成和服务用户的作用,提供数据管理系列服务,成为数据管理资源的富集地、数据服务和技
13、术支持的联系点、数据管理培训和指导服务的提供者;二是通过协同方式来管理平台和提供服务,充分发挥图书馆联系用户和服务用户的优势、信息技术部门的技术优势、科研管理部门的管理优势、研究机构和教学系部的科研优势及教学优势,以在线方式为主场、人工方式为辅助、现场培训为纵深提供服务;三是从数据管理生命周期的视角、以数据管理政策为导向,抓住数据管理服务的着力点,重点提供数据管理计划编制、数据存储、数据分享等系列服务以及专家咨询服务、教育培训服务等延伸服务。3.1 一流大学图书馆开展数据管理服务的基础设施为了获得有价值的信息,笔者甄别选取了国外5所较早开展科学数据管理服务的大学图书馆作为研究对象。这些图书馆经
14、过多年的实践,已经形成了比较成熟的数据管理服务方式,并取得了明显成效。同时选取北京大学图书馆作为研究对象,因为北京大学图书馆是国内目前唯一开展科学数据管理服务的大学图书馆,其实践经验也具有较大的参考价值。通过对国内外6所一流大学图书馆的深入研究,发现它们开展数据管理服务的基础设施主要包括服务平台、支持系统、数据标准等(见表1)。服务平台是图书馆用于提供数据管理服务的专业化网站,数据资源库是科学数据管理的支持系统,数据标准是科学数据管理的流程和规范。在服务平台方面,6所大学的图书馆都开办了专门的数据管理服务网站。在支持系统方面,国外5所大学图书馆都开发了自己的科学数据管理系统,其中麻省理工大学和
15、哈佛大学的图书馆联合开发了科学数据管理系统,北京大学引进了这一系统。在数据管理标准方面,美国的几所大学图书馆和北京大学图书馆都依据DDI(Data Documentation Initiative)科学数据管理标准开展工作。DDI标准是由美国校际政治及社会研究联盟发起研制的。而英国的两所大学则依据DCC(Digital Curation Centre)科学数据管理标准开展工作,这个标准是由英国数据管理中心研制的,目的是为英国高校的科学数据管理提供规范。3.2 一流大学图书馆开展数据管理服务的基本内容通过对比分析几所世界一流大学图书馆的数据管理工作实践,发现他们都按照国家科研资助机构的政策要求提
16、供服务,依据科学数据管理生命周期标准所规定的流程和规范开展工作。从科学数据管理生命周期来看,科学数据管理包括编制数据管理计划、数据处理、数据存储、数据共享、数据分析、数据创新利用等环节。但是图书馆不可能包揽所有的工作,而是发挥自身联系用户和服务用户的优势,重点在编制数据管理计划、数据存储、数据共享等方面提供服务,并面向用户提供与科学数据管理相关的专家咨询服务、教育培训服务。3.2.1 提供数据管理计划服务提供数据管理计划相关服务是图书馆的第一个着力点。数据管理计划是一份正式文档,用以说明研究者在项目研究过程中和项目完成之后如何处理科学数据。它为科学数据管理工作提供了蓝图,明确了数据管理流程和要
17、点,改变了数据管理的无计划状态,可以有效避免数据丢失、混乱等问题,实现数据管理的规范化、流程化,保证数据质量和可复用性。同时数据管理计划还是一份动态文件。因为科研是一种创造性活动,有时需要改变路径、调整进度,数据管理计划也应当随着科研节奏和方向的调整而调整,只有这样才能保证数据管理计划的科学性和实用性,真正发挥它的作用。根据一些国家的实践,图书馆可以在3个方面为用户提供数据管理计划服务:(1)在线提供本国政策指导。不同国家的科研资助机构都有自己的数据管理计划编制要求,美国、澳大利亚、英国等国家的诸多学术图书馆都在线列举和详细说明了本国国家科研基金和相关科研协作机构的数据管理计划政策,供本单位研
18、究人员了解遵循。(2)在线提供外部参考资源。主要是收集整理国外的科研资助机构、大学和研究机构的资料,提供国外的数据管理计划要求和数据管理计划制作资料,供本单位的研究者参考。(3)提供在线编制工具。制作导引式数据管理计划编制工具,提供外部机构的数据管理计划编制工具,收集整理各类各级公共科研基金、各类学会、其他研究机构的数据管理计划模版,提供给本单位的研究者作为范本。3.2.2 提供数据存储服务数据存储是图书馆开展数据管理服务的第二个着力点。这项工作由图书馆与高校的科研管理部门、信息技术中心等协作开发和运作。数据存储服务主要包括保存、备份、长期保存3项重要内容,还提供相应的数据文档制作、数据库使用
19、的指导和培训:(1)保存数据。这项功能既能实现数据存储,也能做到数据备份,还可以开展数据共享。(2)备份数据。主要防止因电脑损坏、重装系统等原因导致数据丢失,保证数据安全,但是不能共享数据。(3)长久安全保存数据。这项服务为研究人员提供永久账号,做到人走号不销,能够实现不同时期数据版本的永久保存和安全备份,克服短期保存和备份的缺陷。所有这些数据存储服务都要依赖数据存储系统来提供,一般有以下4种存储系统:(1)高校和研究机构自主运行的系统。一些高校或研究机构自主开发数据管理系统来提供长久保存服务,服务范围往往限于单位内部。例如斯坦福大学图书馆开发的数据资源库系统(SDR),不会因为员工离职等原因
20、而注销账号,可以永久访问账号的研究数据,能够实现数据的长久保存、共享和分析。(2)高校或研究机构统一购买存储服务,免费提供给二级部门、员工和学生使用。(3)高校师生或研究机构的员工自费购买商业存储服务。(4)资助机构和期刊社等规定存储的数据库,如有的机构规定DNA数据必须存储到EMBL、GenBank、DDBJ三大核苷酸数据库之一。3.2.3 提供数据分享服务数据分享是图书馆开展数据管理服务的第三个着力点。科研成果数据是研究者对社会的独特贡献,只有通过一定方式与他人分享才能发挥作用并得到社会的认可。数据分享有助于推动将来的科学研究和获得新的科学发现。在数据分享方面图书馆可以为研究者提供4方面的
21、服务:(1)图书馆作为数据管理服务的综合联系点,为用户提供各类数据资源库的入口,搭建数据生产者和消费者之间的桥梁,实现数据资源传送和再利用。(2)在线提供数据分享政策。国家科研资助机构对所支持项目的科研成果有分享政策,要求项目成果出版物和电子化数据必须在国内分享,以促进本国企业和实体提高创新能力和竞争力,推动国家经济发展。图书馆可以比较全面地收集整理国家科研资助机构对数据分享的政策要求,在线提供给研究者遵循,有利于提高科研项目的社会效益。(3)帮助用户理清数据访问限制。图书馆还可以在线提供国家关于知识产权保护、隐私保护、科研伦理等方面的法规和政策,了解用户的知识产权和隐私保护要求,帮助用户对敏
22、感数据实行限制存取控制,从而保护科学数据安全和个人隐私。(4)在线提供元数据工具。元数据是用以揭示科学数据属性的描述性信息,有利于数据生产者和使用者对科学数据达成一致性认知,是实现科学数据准确检索和有效利用的重要基础。图书馆的工作重点是收集提供各种元数据工具,帮助研究者选择控制词用于生成各种结构化的元数据,以揭示内容数据的属性。3.2.4 提供教育培训服务提供教育培训服务是图书馆开展数据管理服务的第四个着力点。教育培训服务的主要形式包括数据素养课程、针对某项数据管理技能的短训班、针对特定群体或科研项目的研讨班、在线自学教程等。其主要内容有两个方面,首先是培养研究人员的数据管理意识。通过教学培训
23、课程,让研究人员充分认识到良好的数据管理在现代科学和履行合规义务方面的重要性,掌握国家、国际机构、研究人员所在机构的数据管理政策和要求,遵循数据所有权、隐私权保护法规,提升研究人员和机构的信誉。教育培训服务的另一个重要方面是开设数据管理实践教程,提高数据管理操作技能。图书馆员与研究人员成立开放式的研习会,共同针对相关主题的数据管理计划进行沟通研讨,就数据管理计划提供针对性的培训指导;提供比较集中的培训和研习,帮助用户掌握数据分享政策、数据保护要求以及数据发现方法等知识和技能;传授创建描述性元数据的知识和方法,培养研究人员进行数据标引和数据检索的能力,提高数据存取效率;评估比对各类科学数据资源库
24、,包括综合性数据资源库和特定学科数据资源库的体系特点和使用方法,促进科研人员正确选择和使用数据资源库;面向正在或将要负责本机构数据管理的人员,开展数据管理内训师项目,培训培训者,传授所需专业知识和技能。3.2.5 提供专家咨询服务提供专家咨询服务是图书馆开展数据管理服务的第五个着力点。专家咨询服务是针对研究过程中研究人员遇到的特定数据管理问题而提供的人工中介服务。首先,它不同于教育服务的通用知识和技能教育,而是组织安排数据馆员、信息技术专家和其他技术支持人员,凭借他们的专业知识来满足个性化的数据管理服务需求。其次,专业知识服务倾向于与研究过程本身并行运行,它们被研究周期不同阶段的研究人员消费,
25、而教育服务可以独立于任何特定的研究过程而消费。专家服务针对研究人员特定的科学数据管理问题提供决策支持和定制解决方案。研究人员可以通过“帮助热线”就数据管理相关问题向专家询教;也可以直接到图书馆向数据馆员或联络馆员咨询协商;还可以根据自己需要,寻求定制的数据管理支持服务,学习了解数据管理计划、元数据创建、数据准备、第三方存储服务、数据访问等方面的专门知识和技能。4 图书馆提供数据管理服务的成效评析提供科学数据管理服务是大学图书馆为适应数字化科研潮流而采取的主动行动。它为科研人员解决了数据管理难题,提高了科研效率和效益,也加强了图书馆与校园内其他相关机构的合作,提升了图书馆的地位,图书馆员的角色也
26、发生了深刻变化。这一部分的评价数据主要来源于各大学的网站、DataCite组织。各相关大学的网站有平台介绍、浏览人数、案例分析、评价文章等多种丰富资料,可以引导用户正确使用和看待大学的数据管理服务,并作为其成效评价的重要依据。DataCite组织是由加州大学数字图书馆、英国国家图书馆等多个国家的科学数据管理机构共同建立的组织14。其目标是帮助科学界以可信方式来识别、检索和引用科学数据。其所收录的数据管理服务系统经过了严格的可信性检验,可以作为评价大学图书馆数据管理服务系统的重要依据。4.1 满足了科研资助机构的政策要求数据管理平台以多种方式开展数据管理政策的咨询服务,全面汇集各类科研资助机构的
27、政策要求、大学的政策要求、期刊的数据开放要求,以在线展示、人工咨询、专题培训的方式开展服务。通过各种咨询和培训,提高了科研人员的数据开放意识、编制数据管理计划的意识,具备了按照数据管理计划开展数据管理的技能,自觉在科研活动的全过程实施规范的数据管理,从而满足科研资助机构的政策要求。4.2 实现了科学数据的安全备份和长久保存数据管理服务改变了本地分散存储的状态,提供多种集中化异地存储方式,为科研人员解决了数据安全备份和长久保存两个难题,克服了本地存储数据易丢失、查询不方便、存储量小等问题。大学的科研人员在数据管理系统中拥有永久账号,即使退休或离职其账号和数据资源也会永久保存。有的大学提供多达三个
28、地址的异地存储和同步式镜像存储,达到很高的安全级别和操作便宜性。4.3 促进了科学数据开放和保护在开放获取理念的指引下,数据管理服务实现了较大程度的资源共享,达到了数据开放与知识产权保护、隐私保护的平衡。数据管理服务系统为数据生产者提供灵活的数据开放选择,并提供知识产权和隐私保护法规和政策指导。生产者可以确定数据分享的范围和内容,选择项目内部开放、同行开放、校园内部开放、国内开放、国际开放等开放级别,屏蔽涉及知识产权、个人隐私的数据内容。4.4 提高了数据存取效率数据存取效率显著提高。以PC机、硬盘、优盘等为代表的本地存储呈现分散化的状态,存储介质之间转换效率低,存储内容不成系统,难以快速检索
29、数据对象,难以精准检索特定的数据文档版本。而集中化专业化的异地存储赋予每个数据集永久性数字对象标识(DOI),利用元数据描述数据内容,进行数据内容封装,实现了数据的有序存储和精准检索,大大提升了数据存取效率。同时,在数据引用的规范性和方便性上也大为改善。通过一定的标识技术和机制,标出数据来源、生产者、日期等要素,读者可以很方便地查询到相应的数据集,并促进了数据的知识产权保护,也便于进行数据引用情况的统计和分析15。4.5 保持了可承受的数据存储价格集中的异地存储是有成本的,但是能够控制在用户可承担的范围之内。大部分大学实行分层次的成本控制,自有的系统针对本校职工提供完全免费的服务,购买的云存储云计算服务收取一定费用。有的大学对于职工常规存储不收取费用,而对于大规模数据存储则要收取费用。4.6 提升了大学图书馆的地位世界一流大学图书馆站在时代前列,顺应数字化科研发展潮流,积极开展数据管理服务,使图书馆的地位和作用发生了深刻变化16。一是大学图书馆拓展了服务,成功提供了数据业务;二是以新业务为平台,增强了与大学各部门的联系;三是提升了图书馆员的能力,创建了全新的数据馆员岗位。5 启示和思考科学数据管理为大学图书馆开辟了一个富于挑战的新境界。根据国外发达国家的经验,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能化学校餐饮设施与配套空间设计
- 二零二五年度简易解聘品牌授权合同
- 二零二五年度绿色建筑技术合作合同保密协议
- 2025年度雕塑艺术品运输与保险合同
- 二零二五年度专业销售人员劳动合同范本
- 2025年度财务人员金融产品销售免责及合规管理合同
- 科技教育新动力学校创新活动策划的挑战与机遇
- 2025年度特色小吃店租赁合同范本
- 网络素养教育的实践案例分享与启示
- 环保型实验材料的选择与推广
- 福建省泉州市晋江市2024-2025学年七年级上学期期末生物学试题(含答案)
- 2025年春新人教版物理八年级下册课件 第十章 浮力 第4节 跨学科实践:制作微型密度计
- 财务BP经营分析报告
- 三年级上册体育课教案
- 2024年全国统一高考英语试卷(新课标Ⅰ卷)含答案
- 前置审方合理用药系统建设方案
- 国寿增员长廊讲解学习及演练课件
- 新疆维吾尔自治区乌鲁木齐市初中语文九年级期末模考试题详细答案和解析
- 同等学力申硕英语考试高频词汇速记汇总
- 四年级上册数学课件-一般应用题 全国通用(共26张PPT)
- 肝脏炎性假瘤的影像学表现培训课件
评论
0/150
提交评论