基本原则与关键问题——学术型图书馆馆员如何启动数字人文项目_第1页
基本原则与关键问题——学术型图书馆馆员如何启动数字人文项目_第2页
基本原则与关键问题——学术型图书馆馆员如何启动数字人文项目_第3页
基本原则与关键问题——学术型图书馆馆员如何启动数字人文项目_第4页
基本原则与关键问题——学术型图书馆馆员如何启动数字人文项目_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基本原则与关键问题学术型图书馆馆员如何启动数字人文项目1 学术型图书馆的数字人文研究:理想与现实1.1 数字人文的复兴;时至今日,数字人文已算不上崭新的议题,但由于智能计算;大数据;数据科学;等充满数字时代迷思(Myth)的口号盛行,它重新获得了高度关注。从技术角度看,数字人文研究采用的技术体系并不深刻,多数时候与大数据;人工智能;等时髦概念没有交接,很多研究停留在技术应用层次,一些论文、项目甚至与当代数字人文的核心理念(如数据开放)背道而驰。回顾数字人文的发展历程,上海市图书馆学会主办的2014图书馆前沿技术论坛:数字人文与语义技术;【1】是我国大陆图书馆领域数字人文研究的重要起点,但该会议

2、强调的一些关键理念目前尚未深入人心,相关研究也未突破该会议的整体水平。不管如何,从那时开始,图书馆学、情报学与档案学领域的数字人文研究渐渐抬头,并在2016年迎来高潮。中国图书馆学会图书馆史专业委员会在2016年中国图书馆年会上主办数字人文分会场,倡导图书馆数字人文研究,具有重要意义:从这个学科群长期隐而待发的人文视角对这一趋势做出回应,将数字人文议题上升到图书馆行业组织使命的层面。接下来需要考虑两个问题:如何开展从理论到实践的路径规划?图书馆应该如何启动数字人文?本研究主要从学术型图书馆的视角来探讨这些问题。一般而言,非学术型图书馆将数字人文纳入业务链条有一定的困难;但国家图书馆、高校图书馆

3、和大型公共图书馆具有学术职责与导向,难以回避数字人文趋势。1.2 学术型图书馆视角下的数字人文项目:传统的回归当论及图书馆数字人文研究时,Stephen Ramsay有一段话经常被引用,这段话巧妙地将学术型图书馆的历史传统与数字人文趋势联系了起来:在所有的学术探索中,数字人文研究重拾了古代图书馆的精髓,它追求的是形式多样的(信息)呈现、知识的组织、技术的交流与传播,并致力于创造学术研究的可用工具。同样,(以前)也是(类似的)追求让亚历山大图书馆、帕加马图书馆、孟菲斯图书馆、中世纪的修道院图书馆,乃至于德国启蒙运动时期的第一批研究型图书馆焕发生机。除此之外,数字人文本身就是一项(有创造性的)学术

4、活动它不仅仅展现知识、发现知识,同时也关心创造知识。;【2】这段话描绘了图书馆员对数字人文的美好愿景。然而,真实的图像;或许正如Miriam Posner所言,学术图书馆开展数字人文研究存在诸多挑战,比如:馆员缺少训练机会,不符合馆员的职业要求,缺乏启动项目的支持,有太多的工作任务、太少的时间,没有整合资源的权利,没有深入研究的动机,与教研团队合作比较复杂,过分谨慎,缺少机构承诺与长期投入【3】。这些困境折射出部分馆员对数字人文研究的浓厚兴趣与机构持有的保守态度之间的冲突即便在起步较早的欧美学术型图书馆,数字人文很大程度上仍依靠部分馆员的个人意愿和研究兴趣来推动。尽管未来可能越来越好;,但在当

5、前,机构(图书馆)和个人(馆员)某种程度上是两个相对割裂的行动主体,这是探讨图书馆启动数字人文项目时需要考虑的语境。在这一语境下,机构与个人之间的冲突体现在:启动数字人文项目时,两者关注的核心问题全然不同馆员更关注学术兴趣的实现和论文的发表,图书馆未必愿意看到馆员从事与当前具体岗位脱节的研究;而且,单打独斗;的馆员与图书馆可以调动的资源存在差异,启动项目的规模和性质也有所不同。Miriam Posner总结的抱怨;细化了本研究的问题意识,既然暂时不能指望制度性保障,那么馆员(或独立研究者)在从事数字人文项目过程中需要坚持哪些基本原则?在单打独斗的情况下如何启动数字人文研究?如何逐步推动机构参与

6、到数字人文浪潮之中?2 概念界定、分析思路与研究材料本研究涉及三个基本概念:(1)启动,即馆员如何接触数字人文研究,如何完成第一个独立的数字人文项目。(2)基本原则,是馆员开展项目前应当明确的一系列行动目的、行动规范,本质上是实践数字人文的世界观。(3)关键问题,是从具体项目流程视角总结一个成功的数字人文项目需要关注哪些要点。通过三个基本概念,本研究将第一部分中提出的问题整合为:在学术型图书馆语境下,馆员启动数字人文项目应该遵循什么基本原则?需要注意哪些关键问题?在基本原则;研究上,本研究主要通过访谈法和调查法,收集图书馆管理者对馆员开展数字人文研究的态度和意见,探讨馆员怎样做才能将研究成效最

7、大化,并在某种程度上符合机构的长远利益。在关键问题;研究上,调研、分析成功的数字人文项目,采访一批数字人文研究者,梳理出不同流程中的关键经验,供馆员参考。本研究所用资料包括四方面:(1)采用文献调查法和内容分析法,收集分析数字人文相关文献与实践成果,尤其关注访谈类文本(如在洛杉矶书评上,Melissa Dinsman展开的一系列访谈),据此分析研究者对研究过程和经验的描述。(2)汇集国内外数字人文的项目成果和数据库,梳理数字人文工具并进行工具列表分析,其中包括笔者启动数据人文项目的经验反思。(3)采用实验法,选取中山大学资讯管理学院的志愿者进行数字人文实践演练,主要目的是关注并分析他们的学术协

8、作与信息共享行为,但对本文某些结论的形成有一定影响。(4)针对馆员和研究人员的采访材料,在研究人员方面,访谈了五个不同学科(历史学、图书情报学、新闻传播学、计算机科学、文学)背景的12名研究者。在对这些材料的研究过程中,结合类元分析(Meta-analysis-like)与扎根理论,将三个来源(不包括第二个来源)的文字材料拆分并编码,随后汇入基本原则;和关键问题;两大议题,再以此为基础进行分析和概念提炼,最终形成本研究的结论。3 基本原则3.1 学术兴趣与服务职责的平衡Trevor Munoz等曾质疑图书馆中的数字人文并非一个服务项目;【4】。目前只有两类图书馆的馆员有机会将数字人文作为常规工

9、作:一是那些成立了数字人文部门的学术型图书馆;二是开展专门数据服务的图书馆(如哈佛大学图书馆地图部)。对多数普通馆员而言,实际开展数字人文研究时,往往需要在机构雇员;与研究者;的身份之间徘徊。为此,讨论他们在这一语境下的基本工作原则和行为规范十分必要。从机构长远发展角度看,学术型图书馆应该为馆员提供研究环境;但对馆员而言,履行岗位职责依然排在第一位。一方面,从学术型图书馆发展路径看,过去30年间的图书馆史可谓是图书馆向数据库厂商、数据商不断让渡技术能力与数据资源的历程,尽管一直号称是信息管理机构,但图书馆正在逐步丧失有价值的信息资源管理的主动权【5】。特藏资源可谓图书馆仍保有主动权的最后阵地,

10、大量特藏尚未开发或深度开发,它们是数字人文研究的关键切入点。因此,鼓励馆员对这批资源进行开发性研究,很可能是图书馆重新夺回资源整理和利用主动权的关键性契机。另一方面,馆员应将履行图书馆基本服务职责摆在首位,但那些先于领导层意识到数字人文重要性的馆员应争取将数字人文研究与自身工作相结合,形成具有说服性价值;的系统性思维和初步成果。这不仅仅是对特藏或古籍部门的馆员而言数字人文范围之广超过很多人的想象。比如,对编目馆员来说,具有扩展性和本地可用性的资源描述框架是值得探讨的议题;对学科馆员来说,可以关注来自不同学科接入统一的数字人文框架的可能,以及从数字人文视角响应不同学科的问题意识,争取图书馆与院系

11、之间的合作。3.2 强调过程性:熟悉基本流程、提升技术;理解在平衡学术兴趣与服务职责之外,馆员启动数字人文项目需要关注的另一个关键原则是注重过程性,而非强调成果和项目输出。研究团队有一个面向图书馆管理层的提问:如果您有一个宣布要研究数字人文的属下,你最期待看到他有什么方面的贡献或成长?;最后的统计结果显示,对大部分非信息技术出身的图书馆管理者而言,他们期待馆员能够说清楚如何具体开展数字人文研究,向其汇报数字人文的价值和实施方式,阐述相应的流程;技术出身或技术部门的图书馆管理者则希望馆员能在这一过程中提升对技术;的理解。3.2.1 熟悉数字人文研究的全生命周期馆员作为独立研究者,并不需要像机构那

12、样构建体系完善的人文数据库,或把眼睛盯在宏大的项目上。独自走通一个数字人文项目的完整生命周期,对馆员而言是最基础也是最为必要的。问题的选择、数据采集、选择工具展开分析、形成可视化结果、进行项目评价如果馆员能够熟悉以上流程,完全可以理解何谓数字人文;,形成数字人文观察视角,一旦有恰当的时机,便足以为后续机构级的项目做出贡献。3.2.2 提升对技术;的理解当研究团队问及普通馆员(非技术出身、非技术类岗位)对数字人文的看法时,最常见的是技术畏惧;现象。一些代表性意见是:我们又不是学计算机的,技术不行啊,我很怀疑还有能力做相关研究。;我承认现在是技术的时代所以(要)数字人文、数据科学嘛。问题是现在变得

13、那么快,一会云计算,一会物联网太复杂了,啊,头痛,我不太愿意学,我也学不会;不少馆员认为,技术能力或资源限制会使数字人文研究有很大的难度,只有少数技术突出的馆员能够做这方面的研究。畏惧感;影响了不少馆员启动数字人文项目的积极性,使得不少感兴趣的馆员踟蹰不前。其实畏惧;并无必要。实际上,技术;或信息技术;是非常宏观的概念,很多人畏惧的编程;并非最核心、唯一的技术性环节;数字人文项目对技术迭代也不敏感,许多优秀的数字人文实践采纳的技术体系都比较简单(如很多时候,数据管理采纳ACCESS就足以应付),知识更新的频率不高,学习压力不大;很多技术导向;的研究者或机构更开发了系列工具和API接口,便于人文

14、导向;的学者展开交叉研究。但是,数字人文不强调研究者自行开发软件工具和算法,并不意味着馆员不需要掌握或理解数字技术手段。中山大学资讯管理学院数据科学调研组的阶段性报告显示,2016年11月到2017年1月,147所图书馆发布的358个招聘岗位中,66个岗位提出数据能力要求。(属于未公开内部报告,该报告主要成员包括张靖、肖鹏、林芊里)目前图书馆学教育和馆员培训体系都对数字技术有所强调,但仍难以满足实际应用的需求即便没有数字人文,馆员技术理解的薄弱也可能会成为数字时代图书馆发展的掣肘。如果不掌握信息技术方法,数据采集、工具选择等起步工作便无法进行;很多现成的工具虽然不需要复杂的编程,但对界面和功能

15、的基本了解也有其必要性。数字人文未必是未来图书馆唯一的方向,数字化时代;却是无法回避的独木桥。对数字人文感兴趣的馆员应借助数字人文研究契机,进行技术补课;,这是对强调过程性;的另一种关键性解读。在此类项目中,非技术类岗位馆员对技术的关注点可以比照互联网企业中的产品经理;职位,并进一步提升数据处理能力和技术理解,主要包括:对编程思维的理解;掌握一定程度的R语言或python;对数据源和工具的熟悉和操作;对数字人文的意识和思维的训练。4 关键问题馆员在把握上述原则的基础上,如何启动数字人文项目呢?依据现有的材料,需要主要把握三个关键问题:问题意识、数据与工具。4.1 问题意识:灵活借用成型的跨学科

16、理论成果与模型问题意识是研究的起点。数字人文的中心点是人文研究,尽管形式上可能是数据库、可视化的数据结果或其他,但它与生俱来的研究导向;要求实践者必须事先建立起明确的人文问题意识。馆员对问题意识的挖掘,理论上有两个并非泾渭分明的路径:(1)结合日常工作;(2)结合文学、历史等跨领域相对成型的理论模型或理论构建。参考咨询服务和科技查新等岗位的馆员可以运用第一个路径了解科研用户的需要和趋向,把握研究热点;学科馆员和古籍、特藏岗位的馆员更适合以第二个路径进行探索。目前的数字人文导论性课程十分强调对问题意识、专有模型;的把握。表1是2016年美国伊利诺伊大学图书馆与信息科学研究院Ted Underwo

17、od教授对数字人文课程的基本安排。在该课程中,意大利学者弗兰科-莫莱蒂(Franco Moretti)的远距离阅读;(系统地运用图表、地图、树型定向分析文学现象的方法)【6】以及其他社会理论占了很大的比重。而近年在数字文化;与人文危机;冲击下,此类以定量思维研究传统定性问题;的模型和理论屡见不鲜,为我们提供了坚实的理论基础。4.2 数据:形成开放;的传统问题意识形成后,需要考虑获取基础性的研究数据。尽管可以通过自行录入、文字识别、与数据商合作等方式获取数据源,但数字人文的繁荣非常依赖开放数据。即便数据的著录与存储格式并不完善,甚至数据尚未结构化,都能通过特定处理使之可用;。但在我国,尽管有上海

18、图书馆家谱知识服务平台之类的开放个案,但开放;尚未形成有基本共识的传统。对启动数字人文项目的馆员而言,寻找开放数据和建设开放数据应成为核心工作之一。一方面目前已有不少必备的基础性数据源,如中国历代的年份和年号数据、中国历史疆域地理数据均可在网络上直接获取,如CBDB数据库。充分调研已有的数据源,可以大大降低独立研究的难度,将更多的精力用于问题的解决。另一方面,馆员新建的数据库和项目一开始就应坚持开放、透明原则,最好直接提供单机版数据下载或API接口,以促进信息资源的共建共享。4.3 工具:超乎想象的可用工具图谱数字人文研究者经常需要反复进行模式化;工作。例如,统计文本的词频或抽取地理词汇几乎是

19、每个数字人文项目必需的操作流程。由于这些工作过于普遍,不少研究者研发了相应的工具或工具包。前文指出馆员并不必然要具备卓越的编程能力,很大程度上就是因为这些已有的工具足以解决许多基本问题,尽管仍需学会灵活利用它们来对接;和处理;特定问题。由于数字人文在概念上比较模糊,相应的工具图谱;涵盖的软件和应用十分宽泛。国内外各类博客或网站总结的数字人文工具列表几乎涵盖了一切可以处理文字、数据问题的软件或应用,涵盖采集、抓取、识别、挖掘、翻译、分析和管理等流程。表2是肖鹏、肖弈等整理的数字人文工具表的一部分(完整版本将在2017年内公布)。此外,还有专门服务于数字人文研究者的平台。例如,台湾大学数位研究中心

20、开发了集成多种工具的DocuSky平台,允许使用者通过上传个性化的资料来构建独有的数据库,以实现从机构导向的数据库;向相对自由的个人导向数据库;的转变【7】。4.4 其他问题(1)编程技术的掌握虽不必需,但编程思维是必要的。对编程思维的把握有助于人文学者与计算机学者进行良好的沟通。馆员要成为人文学科与计算机科学的桥梁,更需要关注该能力体系。例如,R语言或Python就是相对友好的入门路径,它们广泛运用于数字人文工具谱系,语法和定义清晰明确,易于学习。(2)馆员启动数字人文项目可以从二次文献的数字化开始。二次文献(如各类工具书)本身就是结构化的数据,能减少数据化过程中的再处理问题;而从传统上来讲

21、,不少馆员对索引、书目和其他工具书本来就具备丰富的处理经验。5 结语本研究试图采用行动研究;的思路,将研究焦点放在学术型图书馆馆员身上,探讨他们应当如何启动数字人文项目,总结开展数字人文研究应该遵循的基本原则和关注的关键问题。需要指出的是,Stephen Ramsay的那段话涵盖了一些多少被扭曲的信息古代图书馆并无现代意义上的图书馆员职业,无论是亚历山大图书馆的编目者,还是中国历代的文献学家、目录学家、藏书家,与其说是图书馆员;,不如说他们本就是具有研究气质;的学人。所谓历史传统与当代趋势的巧妙结合,是不是从一开始就是谎言;呢?也不必然。近年我国图书馆学与相关人文专业的博士生群体稳步增长,不少学术型图书馆将馆员入职学历资格提升到博士,这意味着未来一段时间馆员整体的科研水平会有一定提升,给图书馆的数字人文研究带来了很大的机遇,以一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论