数字资产视角下阅读报告的生产与利用_第1页
数字资产视角下阅读报告的生产与利用_第2页
数字资产视角下阅读报告的生产与利用_第3页
数字资产视角下阅读报告的生产与利用_第4页
数字资产视角下阅读报告的生产与利用_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

根据《数字中国发展报告(2021年)》[1](以下简称《报告》)显示:“我国的数据资源价值正在加快释放……开放的有效数据集由8398个增至近25万个。各地积极探索数据治理规则,培育数据要素市场,促进数据流通交易和开发利用。”《报告》同时也提出未来要推进数据资源高效利用,加快激发数据要素活力的展望,主要强调了“推动数据资源的高效流动……创新数据要素开发利用机制模式……打破数据孤岛,释放数据红利,推动公共数据、个人数据等良性互动、融合应用”。《报告》还特别指出,文化产业要与新一代信息技术相互融合,加快推进图书馆等文化资源的数字化,提供方便快捷、资源共享的全国公共文化数字资源服务。在我国产业信息化发展升级的过程中,伴随云计算、区块链、5G等新的技术形态而释放的大数据,具有极高的开发利用价值。因为大数据是人们社会活动的痕迹,蕴藏着若干个体的价值倾向与行为特点及其个体间的隐含关系,大数据还可以将人们在不同平台中的痕迹重新整合、汇集,实现个人信息的全方位重构[2],以便实现“数据画像”。图书馆在业界和学界都对大数据时代图书馆的发展走向进行了相应的实践,并且开展了多方面的深入研究。数字图书馆建设或者图书馆智慧化升级议题伴随信息技术不断发展,已经成为图情学术界不争的热点,大部分图书馆已开始尝试。这既是图书馆应对信息化时代挑战的必要举措,也是在数字时代为用户提供精准服务的重要依靠。魏大威等认为智慧图书馆转型一个重要的目标就是从资源内容中提取信息价值,区块链技术在智慧图书馆数字资源管理中可以发挥重要作用,即把可无限复制的图书馆数字资源转化成可单一标识和可追踪的数字资产块,并对上述数字资源的内容进行封装注册、分布式存储、知识加工、调度和侵权跟踪溯源等全流程管理服务[3]。单纯从数字资产的概念而言,其是指数字资源的资产化,由相应主体所拥有的,预期可能会产生一定经济效益的数字资源。就现状来看,大多数数字资产在于其所具备的文化价值。图书馆可以被数字化的内容包括图书馆馆藏的各类文化实体资产、各类数据库资产、图书馆用户行为统计等,还有学者提出图书馆虚拟数智人[4]的设想,也可被视为数字资产的一部分。孙锐等则认为图书馆中的文献资产元数据才是图书馆对文献资产进行管理的基础[5]。从图书馆数字资源现状来看,经过20余年的数字图书馆建设,不论公共图书馆还是高校图书馆,都积累了海量的数字资源。1998年,康奈尔大学已经基于查询分析开发了网络个性化图书推荐系统Mylibrary,可以将图书馆新到资源和各类通知发送给读者。刁羽和薛红结合高校图书馆用户使用电子资源的行为数据和问卷调查收集的用户满意度情况,利用随机森林法构建了用户电子资源满意度画像模型[6]。但这些数字资源仍然局限于为馆藏服务,因此被学者视作彼此之间缺乏联系,成为相对独立的“孤岛”。本研究立足学者已经获得的研究成果,聚焦图书馆阅读报告数据输出形式,以数字资产的视角对阅读报告生产与利用的现状进行再思考。1作为数字资产的阅读报告数字资产是区块链技术和加密技术得以应用后的一种具体实践,通过NFT(Non-FungibleToken,非同质化代币)的加密,数字资产具备了唯一性、独一无二和不可复制的特点。区块链技术能够给数字内容提供唯一性保证,保护内容生产者的权益。图书馆的数字资源也可利用区块链技术被封装成为虚拟数字资产,并实现资产登记、存储和持有。从阅读报告的生成来看,每一家图书馆的用户使用数据都具有可溯源性,可为读者提供精准服务,最为重要的不仅在于它是对用户过去行为的总结,而是对未来行动的预测。1.1阅读报告的数据价值尼葛洛庞蒂在其《数字化生存》中曾经设想过这样的一种场景:有一个“界面代理人”,这个人可以阅读地球上每一种报纸、每一家通讯社的消息,掌握所有广播电视的内容,然后把资料组合成个人化的摘要,这种报纸每天只制作一个独一无二的版本[7]。现在,大数据结合算法的应用,已然将尼氏的预言变为现实。谢耘耕等在研究人工智能应用对图书出版发行的影响时提到世界知名的出版集团利用大数据和算法,精准捕捉到用户信息,并且能够挖掘用户的社交关系,对用户阅读时间、阅读轨迹、点赞、评论、收藏等指标进行分析,建立用户需求数据库,进而实现精准营销,同时也可以基于用户以往的阅读兴趣,向消费者自动化推荐书单[8]。Mayer认为大数据可以被视作信息资产,但需要新的处理模式,比如更强的决策力、洞察发现力和流程优化能力对其进行加工,才能使这些数据集合成为海量、高增长率和多样化的信息资产。也就是说,大数据本身并无意义,只是通过现代化的信息技术实现海量数据集,只有对大数据进行深层次的加工,才能挖掘用户的价值倾向和行为特征。从阅读报告所反映出的数据加工方式来看,各高校所选取的指标分类维度具有高度的相似性,比如借阅次数最多的书籍、借阅量最多的读者、进馆次数最多的读者等。这些数据的呈现,能够从一定层面反映当代大学生使用图书馆的总体特征,对高校图书馆进行管培或者改善服务具有参考价值。厦门大学图书馆自2013年开始为学生提供关于个人图书馆使用记录的电子账户,每个学生毕业后还可以永久登录“圕·时光”,并在上面看到自己与图书馆的交集,该项目在2016年获得国际图联(IFLA)大会“营销奖”的二等奖,这个项目至今仍在为学生提供服务。1.2阅读报告的算法使用阅读这种行为为什么需要被人了解?阅读是伴随文字的产生而出现的一种人类行为,既可以完全私人化,也可以群体进行。在大数据时代,人们的借阅行为会被记录下来,但其阅读效果并不能被跟踪。18世纪,塞缪尔·约翰逊列出了几种读书的方式:苦读(握笔)、熟读(寻找某些信息)、好奇心驱动的阅读(专注在一本小说中)和简单的阅读(浏览和略读)[9]。阅读报告是基于大数据生成的对阅读用户的整体特征的数据呈现,这些数据无法体现个体购买、阅读某些书籍或者进出图书馆空间的具体动机,需要使用相应的算法来推导读者未来可能发生的阅读行为。算法作为一种新的连接方式,不仅可以勾连外在物理世界人类的内心世界,更体现了存在于用户和实体之间的价值关系。喻国明等认为算法可以被视为一种“新媒介”,是技术社会的底层基础,其作用是通过一系列社会关系的联结、匹配与调适,重新形塑用户认知并整合社会[10]。阅读报告所积累的大量读者数据是基于对群体的特征描述,如果想对用户提供更有针对性的服务,需要利用算法技术完善个体的使用行为轨迹,并预测其走势。具体而言,即通过算法推荐技术满足用户的个性化需求,以缓解信息过载的压力,实现“人找信息”到“信息找人”的模式变化[11]。算法并非刚刚出现的技术,可以肯定的是这种技术经过几十年的更新迭代,处理数据的能力更为强大。1989年,在第一届KDD专题讨论会上,数据库知识发现(KDD)概念被首次采用,即从大量、不完整、有噪声、模糊合随机的数据中提取隐含在其中的有价值的信息和知识的过程。这个概念强调知识是数据发现的最终产品,随之而产生的各类数据挖掘软件也得到了广泛使用,用户也对数据挖掘所发现的知识有所期待,进而诞生了个性化推荐系统。推荐系统是用户地位日益提高的结果,尤其是在电子商务平台,推荐系统能够带来肉眼可见的商业利益。但现实情况是,算法技术的应用依托于对数据资源的掌握和强大的运算能力,需要资金和技术的支持,高校图书馆一般不具有这种规模的平台,因此对于所收集到的数据,只能进行初步的整理和呈现。尽管高校图书馆纸本数量和数据库中数据存量的规模根据学校不同有大有小,但这些馆藏纸本和数据基本属于有限资源,加之用户在经过图书馆所举办的信息检索培训后都已经具有一定的信息检索技能,对自己所要使用的数据资源相对清晰,所以高校图书馆不存在数据增量超过应用软件的负载范围而导致的“信息过载”问题,算法技术也就没有发挥其优势的空间了。李民等对国内116所“211工程”院校的图书馆网站进行了访问,他们发现所有这些高校给用户提供的都是非个性化的推荐服务,包括热门检索、借阅排行等信息[12]。陈国青等人在研究大数据和小数据之间存在的信息不对称关系时指出,只有那些具象的、丰富的、细节的、情景化的体验和感知,才能帮助刻画人们的心理和人格,解构模式和因果[13],也就是使用实例和数据相结合的方式,从整体出发,进而探索局部个例,以对个体行为动机探寻,达到局部映射整体、个例诠释数据的效果。有的高校尝试建立“优秀大学生读者阅读清单”案例数据库[14],以学科专业进行划分,选择专业名次在全年级排名前30%的优秀大学生,调取他们曾经阅读的文献信息资源目录清单,并辅以面对面访谈,确认他们所阅读的文献资源与他们专业学习之间的关系,然后将清单和馆藏数据一并进行数据集成,最终形成“优秀大学生阅读清单数据库”,以供其他读者参考。1.3阅读报告的展示意义类似个人书架可以展示自己的书籍存储量和阅读品味,图书馆阅读报告中的馆藏数量和种类、新进购置书籍数量、进出馆人数等数据,也都具有一定的展示作用。首先,阅读数据具有可展示性。就现有资料来看,图书馆数据已应用的领域十分广泛,比较典型的使用场景即做成可供展示的数据可视化信息,不仅显示实时到馆人数、借阅数量,还可以将阅读报告设计成直观的可视化图表在图书馆内进行展示,西雅图公共图书馆的“MakingVisibletheInvisible”项目在21世纪初已经开展并实施,即通过6个LCD屏幕组成的大屏幕来展示各类动态数据[15]。其次,阅读数据报告本身具有新闻性。媒体对于能够成为新闻的信息有着严格的要求,其中包括时新性、真实性、重要性、在地性等具体指标。每年各个机构最新公布的阅读数据,基本符合上述特性,从而成为各级媒体报道的焦点。在读秀的报纸类目中以“阅读报告”为标题,可以搜索到1431篇相关报道,发布在不同级别的纸质媒体上。既有面向专业领域发行的,如《图书馆报》《中国出版传媒商报》等,也有党报党刊,如《人民日报》《光明日报》等,还有各级都市报,如《新京报》《半岛都市报》等。上述媒体对阅读报告数据的报道,是对全民阅读推进现状的公开展示,对报告所涉及的具体的城市、图书馆都能起到正面宣传效果。最后,阅读报告数据具有反应动态变化趋势的直观性。《人民日报》分别在2011年8月报道《上海首次发布“市民阅读现状报告”数字化阅读喜忧参半》,2021年4月报道《上海全民阅读调查报告公布》。以2021年的报道为例,《2020年度上海全民阅读调查报告》中的数据显示“上海市民综合阅读率(纸质阅读和数字阅读)较高,达97.04%,高出2019年全国国民阅读调查15.94个百分点,其中,纸质阅读率达96.05%,高出全国平均水平36.75个百分点;数字阅读率为99.52%,高出全国平均水平20.22个百分点”[16]。这些数字直观反映了上海市民综合阅读率在全国所处的位置,并且具有相应的权威性。2阅读报告的深度使用场景不论是公共图书馆还是学校图书馆,推出阅读报告的目的绝不应止步于告知读者或者进行宣传,应当在可能存在的条件限制中,结合算法技术,深度挖掘阅读报告中的数据价值,为阅读报告开发更多的使用场景。2.1让书籍成为媒介通过浏览图书馆后台的借阅数据,在增加图书流动率的同时提高图书的互动性。书籍本身就是一种传播媒介,是凝结人类智慧的载体。不仅如此,书籍还可以成为读者交流互动的介质。Naomi着重分析了阅读的社交属性,其以Kindle阅读器中的“流行高亮”功能举例,每个读者都能看到其他读者所做的标记,这是一种对用户与其他读者,甚至是作者进行“对话”的鼓励,在其看来,“注释即对话”。《S.:忒修斯之船》一书出版之际,宣称“向电子书宣战”,其在图书内容编排上加入了许多不同颜色的笔所做的标注,另外,书页间还夹杂着信件、便签、照片、卡片、明信片等小物件,这种在印刷文字之外增加互动实物的编排即是将书籍视作印刷社交媒体的探索。尽管事实证明,《S.:忒修斯之船》之后,很少再有出版社进行过类似的尝试,但在学校图书馆中,图书的读者群体都是不同时段的在校生,相对稳定,不妨挑选一些流通率高的图书,进行试点,比如建立书籍身份卡。在前互联网时代,每本书上都有借书卡,能够看到书籍的流通情况。现在也可以给每本书建立一个独特的身份码,当一个读者在借阅这本书的时候,能够同时看到书籍的流通情况,并且像豆瓣网站那样,看到之前的读者对这本书的评价,也就是让图书的后台数据能够被用户共享。尤其是在高校图书馆中,针对某些专业程度高的书籍,读者可以把自己对具体问题的思考标注下来,后续读者如果看到,能对之形成反馈,长此以往,甚至能就某一领域形成认知创新点和新的体系。高校图书馆之间的借阅数据可以形成文献网络,尤其是一些比较专业的学术读物,在系统检测到某用户的借阅行为后,不仅可以进行同类学术读物的推荐,还可以链接到同样借阅过这本著作的个体,也许是对某一个学术问题有相似研究兴趣的研究人员,形成学术共同体。2.2让数据为个体所用作为个体,其实更关注能够反映个体变化趋势的数据。阅读报告所折射的,大多数是一个图书馆或者一个电商平台的大数据情况,但大数据中的小数据,才是具体的用户所关心的。豆瓣用户会把自己读过的书上传到豆瓣的个人空间,并且和其他的用户产生分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论