




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、聚集学术机构知识的中心:机构库(Institutional Repository)探析1引言早在1988年,PeterDruker就在?即将到来的新组织?一书中预言,“对一个组织来说,最重要的是该组织所拥有的知识资源,对其加以有效管理是组织成功的最关键因素。1学术机构是人才和知识的集中地,搜集、管理、利用其成员在学术科研等多方面的高质量数字信息资源,对增强机构实力、赢取竞争优势等都具有重要意义。时至今日,各学术机构成员可在互联网上以各种方式发表、传播和交流学术信息,这给组织、管理这局部信息带来了相当大的困难的同时,传统出版形式的局限性也日趋明显,不利于学术交流的开展。有鉴于此,2001年,俄亥
2、俄州立大学的高级行政官员和该馆馆长布兰宁(JsephJ.Branin)在讨论开开发远程教育体系时,提出并着手建立俄亥俄州立大学知识库(hiStateUniversityKnledgeBank),以保存该校师生员工的数字知识资源,这也成为机构库InstitutinalRepsitry,以下简称IR最初的雏形。2002年,麻省理工大学(assahusettsInstitutefTehnlgy,IT)和惠普公司(Helett-Pakardrpratin)合作推出DSpae,宣告IR的正式诞生。同年,在“第六届欧洲数字图书馆先进技术研讨会上,aKenzieSith做了?DSpae:来自IT图书馆和惠普
3、实验室的机构库?的学术报告,详细介绍了DSpae的构建原理、运行情况及在开放学术交流和数字资源长期保存中的重要作用2,这一报告引起了各国学者的关注,也促成了世界范围内关于IR的大规模理论与理论研究。2机构库的定义关于IR,目前尚无统一的定义,比拟有代表性的两种观点是:(1)美国网络信息联盟(alitinfrNetrkedInfratin)的常务董事liffrdLynh认为,IR是指大学为方便其共同体组织、整理、存储和利用师生员工相关的数字知识资源而提供的一系列效劳3。此定义强调IR的目的是为用户提供一系列效劳,但效劳对象局限于IR所属的机构成员,效劳的目的是协助大学共同体组织、利用其师生员工的
4、数字知识资源。(2)加拿大研究图书馆协会(anadianAssiatinfResearhLibraries,ARL)那么提出,所谓IR就是指搜集、存储学术机构成员的知识资源,并提供检索的数字知识库,同时认为IR可以作为一个全球知识库的子库,为世界范围内的网络用户效劳4。此定义认为IR是一个聚集数字信息资源的知识库,其资源对任何国家的所有网络用户开放,但该定义遗漏了一个重要的内容,即IR中的绝大局部资源可免费获龋据此,笔者认为:所谓IR,就是以搜集、组织、存储学术机构大学、大学共同体等相关数字知识资源为主要任务,并将其中绝大局部资源对任何网络用户免费开放的知识库。3机构库产生的原因及其主要特点2
5、.1机构库产生的原因IR之所以在人类刚跨进21世纪的时候兴起,原因是多方面的,但最为根本的原因在于:(1)网络给信息组织带来的困难。网络环境下,学术机构成员可以通过各种方式如个人网站、blg等在互联网上发表、传递各种学术信息资源,据IT的统计数据表示,43%的学者会把预印本(preprint)上载到个人网站上,60%的人那么通过e-ail传递预印本文献5。发表、传递方式的多样性虽然在一定程度上促进了学术交流,但由于这些方式的随意性太强,使得搜集、组织、存储、利用某一学术机构的知识资源就相当困难,给相关机构造成难以估量的损失。这也是建立IR最根本的原因。(2)传统的出版形式带来了学术交流障碍。近
6、年来,随着出版机构的兼并和商业化,价格大幅度攀升,大大超过了图书馆经费所能承受的范围。美国研究图书馆协会(AssiatinfResearhLibraries,ARL)的统计说明,在1986-2000年之间,科学、技术和医学方面的学术价格增长了226%,同期商品零售价格指数增长幅度为57%,在此期间,图书馆购置的经费增长了192%,但购置的品种却下降了7%6。虽然图书馆也尝试通过馆际互借、加大数据库的购置力度、远程文献传递等措施来缓解经费短缺的压力,但效果并不理想,也没有从根本上解决学术交流的问题,从而促使人们考虑传统的出版形式之缺乏,并讨论新的方式以促进学术交流。(3)网格技术和开放源代码的推
7、动。网格计算源于元计算(etaputing),其初衷是将分布的多台超级计算机连接成为一个可远程控制和访问的元计算系统,网格体系根据高速和共享两大特征,正在不断向基于更大的网、共享更多的资源、构建更大的计算才能的目的迈进。网格技术将有助于解决大并发量访问、海量信息检索以及资源共享等方面的技术问题。而开放源代码的意义那么在于将人类大量珍贵的创造力从“重复创造中解放出来。近年来,开放源代码在数字图书馆领域的应用已经相当普遍。美国的L,英国的UKLN,以及新西兰的DL工程都是图情领域推动开放源代码应用的代表7。网格技术和开放源代码为IR的建立奠定了关键的技术根底,使IR思想的实现和快速开展成为可能。3
8、.2机构库的特点(1)综合性。IR不仅包括常见的研究性学术资源,如论文、电子预印文本、技术报告、会议论文、学位论文、数据库及数字图书馆资源,还包括局部学术数据库所不收录但又具有较高价值的资源,如工作文件、图像、音频和视频文件、学习资料等8。这样IR即可全面系统地反映所属学术机构的教学和科研成果,不仅有利于分析自身教学、科研的优势与缺乏,衡量现有的研究程度和明确今后的开展方向,还可作为对外展示其综合实力的窗口,以进步该学术机构的知名度和影响力。(2)开放性。进入新世纪以后,实现学术资源、科研成果的开放共享已经成为国际潮流。IR以其开放性的特点成为开放共享运动中的弄潮儿,IR对世界范围内的所有用户
9、不抱任何偏见,任何用户随时都可以通过互联网不受限制地合理利用其中的知识资源,这既利于本领域学者之间的学术交流,也利于其他学科研究者跨学科获取知识与信息,更重要的是它打破了国家界限,特别是有助于开展中国家的科学研究者追踪世界著名学府研究的最新开展,从一定程度上缩小开展中国家与兴旺国家之间的知识鸿沟。(3)动态性。一般来说,信息一旦输入数据库就不再发生变化,IR那么不同,为了使最新研究成果能在最短的时间内发布,提交者可根据自己的最新研究随时修改、更新之前提交给IR的信息,使IR表达出明显的动态性特点。这一特点虽然可以加快学术交流的速度,但也有可能使IR中的内容更迭过于频繁,对其稳定性产生负面影响。
10、4国内外相关工程简介近两年来,随着各学术机构对IR的日益重视,IR的建立也获得了初步成效,现选取其中具有代表性的3个工程介绍如下:4.1DSpae2000年3月,惠普公司出资1800万美元,与IT图书馆合作开发DSpae,2002年11月,DSpae正式面世并迅速成为一个由剑桥大学、哥伦比亚大学等七家著名学府直接参与的结合机构库。DSpae是目前全球最有影响力的机构库,其收录的信息资源主要包括研究报告、数据库、音频和视频文件以及其他格式的IT认为确实重要的文件,但不收录IT学生的研究资料、机构记录以及非IT老师的研究成果等。DSpae提供一系列遵循开放档案信息系统参考形式(Referenede
11、lfranpenArhivalInfratinSyste)的上载、管理、传播数字信息的工具,并使用D、penURL与AI-PH等一系列开放标准,因此成为其他机构开发IR的首选软件,据统计,在成立后不到一年就已经有3500家来自全球的机构下载了DSpae的开放源代码9。因此可以说DSpae是一个搜集、管理、标引、传播数字信息的系统、工具和平台。DSpae的垂直体系构造包括三级层次:存储层、事务逻辑层和应用层,每一层都内嵌API(AppliatinPrgraingInterfae),方便系统的晋级,同时也使其他大学在开发IR时能根据实际情况调整相关局部,进步DSpae的灵敏性。存储层的主要功能是存
12、储数字化信息,事务逻辑层是整个系统的核心局部,主要包括工作流管理模块、内容管理模块、检索和阅读模块,这些子模块也都相应地嵌有API;应用层那么主要作为用户检索信息的界面10-11。4.2ARL机构库导航工程ARL机构库导航工程(TheARLInstitutinalRepsitriesPiltPrjet)由加拿大12所大学于2002年发起建立,目前主要由西蒙弗雷泽大学、多伦多大学等5所大学图书馆负责操作管理,导航工程旨在通过结合加拿群众多学术机构的知识库,进步加拿大学术机构及研究人员的曝光度和影响力,同时,通过理论操作为加拿大其他机构开发IR提供经历。2022年,西蒙弗雷泽大学推知名为“ARL收
13、割机(TheARLHarvester)的搜索引擎,作为导航工程检索效劳的操作界面,通过此界面任何国家的用户都可以免费检索其中的资源。目前该搜索引擎已经收录了来自马尼托巴大学等9个IR的4493条记录并保持每日更新,提供简单检索、高级检索和分类阅读等3项检索功能,用户可按任意词、作者、题名、摘要、索引号、日期、语种等多种途径查找所需信息12-13)。4.3学术信息库为推进香港中文大学(ThehineseUniversityfHngKng,UHK)印刷文献的数字化进程,加强图书馆的电子导航功能,UHK图书馆于2022年夏天开场建立学术信息库(ShlarlyInfratinRepsitry,SIR)
14、,SIR以尽可能多地收录UHK共同体成员出版物信息为目的,收录的文献种类包括学校出版物、各院系及老师出版物、老师工作文档、论文、报纸、书籍、书籍篇章、学位论文、会议论文、技术报告以及专利信息,除提供引文和简单著录信息之外,还尽可能地提供全文的链接。提交者通过SIR系统中的“引文输入系统输入出版物的详细信息,这局部信息在传递给SIR系统的同时,还会传送给研究与科技管理局中的在线出版输入系统,SIR的检索界面那么允许用户阅读和检索所需信息,并在结果中提供图书馆所购置的电子资源、互联网上免费和有偿电子资源的链接14。转贴于论文联盟.ll.5现阶段存在的主要问题5.1知识产权的保护IR中包含多种类型的
15、信息资源,因此相应的知识产权问题也比拟复杂,目前争论的焦点主要集中在学术论文发表于传统之后版权归谁所有的问题上。在传统的出版形式下,当作者愿意将其研究成果发表在某一份学术上时,就已经将版权交给出版社或者说同意出版社拥有“排他性答应(exlusiveliene)出版的权利。这样一来,IR收录这些已经发表的学术论文就会构成侵权。但大局部作者并不认同此类规定,据RE(Rightsetadatafrpenarhiving)的调查显示,61%的作者认为机构应该保存论文的版权,90%的人也确实将版权交给所属的机构15。随着作者和学术机构对拥有版权的呼声日益强烈,这一问题正在向有利于IR的方向开展,如在20
16、22年,?Nature?出版集团允许作者“可以重新利用他们发表在纸制上的论文,可以将论文的电子版上载到其个人网站非商业目的,可以重新利用论文中的数据和表格等,但同时也明确规定,作者不能将论文提交给开放性档案网站(penarhivalebsite)。最近?Nature?出台新的规定,允许作者在论文刊出6个月后将电子版提交给IR,条件是在记录中提供杂志社网站的链接16。对于IR来说,关键的是应该在向公众开放信息的同时尽可能地保护知识产权所有者的利益,至少须确保IR不是有意进犯版权或其他知识产权。因此,许多IR都要求作者提交资源时能保证其为版权所有者,且不会涉及到除作者和IR以外的第三方,或者要求作
17、者在提交资源时将局部知识产权转交给IR,如DSpaee就在其软件包中包括“非排他性分发答应(Nn-ExlusiveDistributinLiene)协议,要求提交者允许IR在不改变论文内容的情况下以各种格式在多种媒体上将其复制、翻译和传播。SIR那么认为版权归学校及其作者所有,学校和作者都希望能扩大研究成果的传播范围,因此SIR尽量满足用户出于研究目的的全文检索需求。不过Lynh认为不管IR以何种方式来躲避进犯知识产权,大学或大学共同体以IR的形式来拥有或控制知识资源这一行为本身的合法性就值得商榷17;类似于?Nature?的出版商也只是少数一局部,RE的统计说明这类出版商只占4%,而90%的
18、出版商要求作者在时将版权移交给出版商。因此,令出版商、IR、作者等多方实体均能承受的知识产权保护方法尚待讨论。5.2经费的预算与管理IR的开发、运行经费受诸多因素的影响,首先就是员工薪水问题,构造库不仅需要技术人员开发、调试、维护系统,还需要大量的非技术人员保证IR的正常运转;其次是设备问题,主要包括系统开发和晋级等所需软、硬件的选择,如网络效劳器和数据库的选用等;此外,运行经费还受到用户培训、所属学术机构的管理策略、专业设置、机构变动如机构合并等外部因素的影响。这些都会给经费带来不确定的因素,从而影响经费预算和管理的准确性。学术机构逐渐认识到IR经费预算与管理的重要性,并在理论中采取一定的措
19、施对经费加以控制,如DSpae邀请图书馆馆员参与IR的建立,依靠他们已有的相关专业根底进展用户培训、资源建立等工作,以降低本钱;罗彻斯特大学那么要求图书馆馆员抽出1/3的工作时间来为IR效劳。但效果并不能令人非常满意,IR的开发、运行经费仍然高昂,如IT每年在IR上花费28.5万美元,皇后大学每年仅支付员工薪水就需要10万加元18。这种状况可能导致决策者对IR信任值和支持度的降低、局部工作无法按方案进展等问题,给IR的平稳开展及在世界各国尤其是开展中国家的普及带来负面影响。因此,有必要对如何建立一个科学、合理的经费预算与管理体系加以研究探究。5.3质量的控制与评价质量是IR的生命线,假如IR中
20、充满的都是价值不高甚至垃圾信息,不仅会造成人力、物力等资源的浪费,还会损害学术机构的声誉。因此,如何保证IR中信息资源的质量是IR必须面对的一大挑战。传统学术在长期的开展过程中形成了一整套的质量控制与评价机制,如专家评审或同行评议制度。这些机制对IR中信息质量的控制与评价有一定的参考价值,但IR不仅包括已在传统学术上发表的学术性论文,还包括大量未发表的preprint、学习资料、工作文件等,不同类型的资源有不同的质量评定方法。故完全借鉴传统学术的做法是行不通的,必须针对不同类型的资源拟定与之相适应的质量控制和评价体制。但由于IR的理论与理论研究尚处于初级阶段,研究重点主要集中在系统构建和资源建
21、立等方面,对IR中信息资源的质量控制关注不多,也没有建立全面、系统的质量控制评价体系,目前局部工程仅通过一些简单的方法对质量加以初步控制,如对提交者、提交的文件类型和格式进展限定等,DSpae就不收录学生的研究成果、机构记录、非IT老师的研究成果等。但这样并不可以确保IR的质量,同时,一局部有价值的信息会被排除在外,不利于真实反映一个学术机构的整体实力。5.4其他问题除上述三个主要问题之外,IR还面临稳定性、元数据等方面的问题,其中,稳定性主要受两个因素的影响,一是所属机构是否在战略上和经济上给予支持,Lynh认为学术机构经常会发生变化,如开设新的学院或研究中心、关闭局部夕阳专业、与其他机构合
22、并等,这些都有可能使其对IR的战略支持或经济支持发生变化,因此,IR的建立有必要争取机构高层指导的支持,并且需制定长期的开展方案,以减少上述变化带来的负面影响19。其次就是IR中的知识资源能否长期保存,资源的长期保存是长期开放的根底,目前IR中包含大量不同格式的资源,给其长期保存增虽不稳定性因素,Jaes就认为IR应该适时预见多格式知识资源给长期保存带来的风险20。此外,IR动态性的特点、组织者的管理策略、元数据等都会对知识资源的长期保存产生影响。元数据方面的问题主要是不同资源的元数据之间存在矛盾,在IR中,不同的资源可能采用不同的D元素;信息提交者在自我存档(self-arhiving)时也
23、有可能使用不标准的D元数据;基于不同软件开发而成的IR所确定的元数据也有可能存在差异,不利于结合多个IR如ARL机构库导航工程提供集成效劳。目前,有关机构对此已采取了相应措施,如DSpae使用标准D元数据来描绘信息,在提交资源时只有题名、语种、提交日期等三项信息必须提供,其余如文摘、关键词等均为选择性提供。ARL也正在讨沦起草“国家机构库元数据文件(NatinaletadataPrfilefrinstitutinalrepsitries)21,力求标准IR中的元数据,进一步推进资源共享。6图书馆应如何面对机构库带来的机遇与挑战在学术出版市场日益商业化的今天,图书馆经费捉襟见肘,而IR的开展,那
24、么给图书馆带来了难得的时机,它冲击着传统的出版形式,有利于减少图书馆经费短缺的压力,扩大了图书馆的开展空间;但是,我们也应该看到,IR充分利用一切可运用的技术手段,搜集多种类型的知识资源,并将其中的绝大局部免费向所有网络用户开放,给图书馆在信息效劳、学术交流中的中心地位带来了强有力的冲击。图书馆要确保现有地位并有所开展,就必须发挥自身优势,积极面对来自IR的机遇与挑战:(1)整合资源,义不容辞,图书馆拥有的丰富信息资源无疑是网络中的珍贵资源,但无序的信息只会让用户吞没在信息的海洋中而无法找到所需信息,IR的出现让图书馆认识到整合信息资源,尤其是知识资源如学术机构、实验室形成的知识资源的重要意义
25、,同时,IR还能减轻图书馆经费短缺的压力,使得图书馆有更多的人力、物力、财力进展资源的整合,因此图书馆应抓住机遇,大力推进信息资源的有效整合,为图书馆进步信息效劳程度奠定根底;(2)积极参与,互助双赢,当前,图书馆在数字图书馆的研究与理论中,有很多思路与IR不谋而合。比方,IR的目的之一就是实现资源的高度开放与共享,促进学术交流,而图书馆界一直在提倡和理论信息资源的共建共享。因此,图书馆应积极参与IR的建立,利用其在信息组织、信息标引等方面的专业优势以及数字图书馆建立中的经历与教训,为IR的顺利建立保驾护航,而图书馆通过参与IR的建立,有时机亲身理解、学习最新的信息技术、全新的信息效劳形式,从
26、而有利于促进图书馆的创新、改革和整体程度的进步。【参考文献】1Druker,Peter.TheingftheNerganizatin.HarvardBusinessRevienKnledgeanageent.HarvardBusinessShlPress,abridge,A,19882aKenzieSith.DSpae:AninstitutinalrepsitryfrtheITLibrariesandHelettPakardLabratries2022-04-06,nstl.gv.n/nstl/user/xxnyl,jsp3Annyus.DEFININGANINSTITUTINALREPSIT
27、RYnfereneartile.LibraryTehnlgyReprts.hiag:2022,140(4):6-104ARL.InstitutinalRepsitries:InnvatininShlarlyPublishing2022-04-06.arl-abr.a/prjets/ir/abut-e.ht5Annyuts.BENEFITSFANINSTTTUTINALREPSITRYnfereneartile.LibraryTehnlgyReprts.hiag:2022,40(4):11-166David.Prsser.TheNextInfratinRevlutin-anInstitutina
28、lRepsitriesandSelf-arhivingTransfrShlarlyuniatins?2022-04-06.iatul.rg/nferene/preedings/vl13/papers/PRSSER-fulltext,pdf7吴建中.图书馆VS机构库图书馆战略开展的再考虑.中国图书馆学报,2022(5):5-88eller,aryase.BAKGRUNDANDDEFINITINSFRISUITNSHLARLYUNIATIN2022-04-06./grups/Iebers/arhive/duents/bakgrundfrsuit,pdf9TStrey.UniversityRepsitries:AnExtensinftheLibraryperativeLNesletter.2022(7):7-1110aKenzieSith,et.DSpae:AnpenSureDynaiDigitalRepsitry2022-04-06.dlib.rg/dlib/january03/sith/01sith,htl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车使用与维护 课件 项目一 制动系统的使用与维护1-4 盘式制动器的检查与维护
- 2025年电壁车项目可行性研究报告
- 2025年电动精小型单座套筒调节阀项目可行性研究报告
- 2025年甲基异丙基酮项目可行性研究报告
- 2025年瓶装液体灌装机项目可行性研究报告
- 2025年特种钢铸件项目可行性研究报告
- 中北大学《英语叙事文写作》2023-2024学年第一学期期末试卷
- 皖西卫生职业学院《工程材料与机械制造基础A》2023-2024学年第二学期期末试卷
- 湖南省衡阳二十六中2025年下学期高三生物第二次阶段检测试题考试试卷含解析
- 浙江省嘉兴市秀洲区2025届数学三下期末达标检测试题含解析
- 大小便观察与护理
- 2025年-重庆市安全员-A证考试题库附答案
- 多式联运模式在跨境电商中的应用-全面剖析
- 湖北省孝感市高新区2023-2024学年七年级下学期数学期中考试试卷(含答案)
- 8.2 诚信经营 依法纳税课件-高中政治统编版选择性必修二法律与生活
- 领导带班及24小时值班制度
- 具身智能机器人扩散策略Diffusion Policy环境安装与运行
- 2024年湖北省中考满分作文《满树繁花》
- 肿瘤患者的血栓预防及护理
- 作风建设方面个人简短总结
- 职业病危害告知书
评论
0/150
提交评论