2024图书馆领域大模型创新应用需求调研报告V0-WN8正式版_第1页
2024图书馆领域大模型创新应用需求调研报告V0-WN8正式版_第2页
2024图书馆领域大模型创新应用需求调研报告V0-WN8正式版_第3页
2024图书馆领域大模型创新应用需求调研报告V0-WN8正式版_第4页
2024图书馆领域大模型创新应用需求调研报告V0-WN8正式版_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图书馆领域大模型创新应用需求调研报告(征求意见稿V0.9)上海图书馆(上海科学技术情报研究所)智慧图书馆技术应用联盟2024年5月说明科学技术情报研究所)、智慧图书馆技术应用联盟。开分享这些宝贵的学习资源。很多方面如大模漏与不足之处,因此我们对此表示歉意,并希望您提供宝贵的反馈建议。报告各章编辑:第一章前言(嵇婷)第二章大模型行业应用研(许磊)第三章大模型对书馆的影响(嵇婷、周纲、许磊)第四章智慧图大模型应用(嵇婷、周纲、许磊)第五章图书馆典型大模型应用需求及场景举例(嵇婷、周纲、许磊、刘倩倩、姚馨、刘贝玲、徐凡、吕思诗、张春景)第六章总结与展望(嵇婷)联系方式:如对报告有任何建议,欢迎将反馈意见发送:calsp@。目录第一章1

第二章大模型行业应用调研3

2.1大模型行业应用价值3

2.2大模型行业应用服务4

2.3大模型行业应用技术方案.6

2.3.1提示词工程.6

2.3.2检索生成增强2.3.3智能体2.3.4型微调2.4大模型行业应用案例2.4.1医药健康.4.2金融保险2.4.3文化教育第三章大模型对图书馆的影响3.1图书馆大模型影响分析3.2图书馆大模型应用策略...........................................................23

3.3图书馆大模型应用路径图书馆大模型应用范式图书馆大模型技术架构第四章智慧图书馆中的大模型应用智慧服务中的大模型应用智慧业务中的大模型应用智慧管理中的大模型用智慧空间中的大模型应用第五章图书馆典型型应用需求及场景举例5.1智慧咨询5.1.15.1.2场景举例5.1.3已有案例2智慧资源发现5.2.1需求分析5.2.2场景举例5.2.3已有案例5.3智慧阅读推广5.3.1需求分析5.3.2场景举例5.3.3已有案例5.4智慧知识服务5.4.1需求分析5.4.2场景举例15.4.3已有案例5.5智能采编辅助5.5.1需求分析5.5.2场景举例5.5.3已有案例5.6数字资源智能加工5.6.1需求分析5.6.2场景举例5.6.3已有案例5.7数字人文智慧研究与服务35.7.1需求分析5.7.2场景举例5.7.3已有案例5.8馆员智慧助手5.8.1需求分析8.2场景举例5.8.3已有案例第六章总结与展望附:云瀚应用商店AI应用列表2第一章前AI量。在时代浪潮的推动下,以大模型技术为代表的生成式人工智能已经成为推动科技进步和产业变革的重2023年7索优化应用场景,构建应用生态体系。2024年,政府工作报告中明确提出深化人工智能研发应用,开展“人工智能+”行动。国家鼓励人工智能技术与经济社各领域深度融合,以推动各行业应用创新,赋能百业智能化转型升。伴随着新一代技术的兴起,图书馆界也迎来了重要的契机,步入了对将融入运营与服务中的复杂挑战。为了有效应对变革,上海图书馆(上海科学技术情报研究所)联合上海人工智能研究院、智慧图书馆技术应用联盟于2023年9月发布了《图书馆大规模模型创新与应用白皮书》。白皮书从宏观层AI2.0践、生态建设提出了方向性、建设性的参考与建议。大模型技术在图模型应用的总体架图书馆中的应用潜力与可能性,提供图书馆在探索大模型技术新应用的参考,以助图书馆更好地把握人工智能发展所带来的机遇。第三章在详细分析了大模型对据当前技术发展和落地现状,梳理了图书馆在智慧服务、智慧业务、智慧管理、智慧空间四个领域中,当前可实、实施或展望的应用,并进行总结。第五1资源发现、阅读推广、学术服务、采编辅助、资源加工、数字人文和管理决策,通过对这些关键领域的详细讨论域在大模型技术的开发应用和产品设计方面的思考与实践。诚挚邀各界人士进行批评指正,我们将借助各方经验对报进行修改和完善,从而为智慧图书馆大模型创新应用提供有益参考。2第二章大模型行业应用调研2.1大模型行业应用价值2022年月上线的生成式人工智(AIGC,AI-GeneratedContent)应用ChatGPT大模型+大数据+力”科的任务处理能力,是人工智能技术极为关键的发展节点。ChatGPT的横空出LanguageModel,LLM大模型”NaturalLanguageProcessingNLP)领域以小模型为主导的传统发得到的超大型深度学习模型,参数通常从数十亿到超千亿。底层基于Trmer深度神经量数据训练架构使得大语言模型具有了被称为“涌现”的泛化推理能力,使其具AGI体信息结合语言数据进行预训练和指令微调的超大型深度学习模型也是大语言模型的一种发展,通常称为多模态大模型。也可以将上述两者并称为大模型”。大模型的涌现能力”不仅可以实和科学的再创造。大模型的大规模”和预训练”属性,决定了其具有能力泛化、技术融合、应用大核心作用。(1)能力泛方面,大模型预先在海量通用数据上训练使其具备了通用任“大规模预训练﹢调的范式,可以很好地适应不同下游任务,展现出它强大的通用性。(2)技术融合方面,文本大模型融合语言、视觉、听觉等多模态信息,通1中国人工智能学会.中国人工智能系列白皮书——大模型3版)s=/home/article/detail/id/3172.html,2023.2赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https://llmbook-zh.github.io/,2024.3龙志勇,黄雯.大模型时代:ChatGPT开启通用人工智能浪潮[M].中译出版社,2023.4海通国际.MaaSModelasaService模即服务,/pdf/H3_AP2023020815828853752023.3索引擎、代码执行、工具调用等技术,或者与小型融合,从而实现优势互补,性能上实现“1+1>2”的效果,显著提升模型的功能丰富性和性能优越性、。(3能力的重要体现是复杂任务推理为构建大量应用程序提供了机会,从而使大模型有机会成为下一代计算平台/操作系统,有效支撑智能终端、系统、平台等产品应用落地,解决传统应用过程中存在的壁垒多、部署难问题。模型做商业应用的适配“AI+”行业中将承担基础设施代之后,将进入基于大模型的时代。在未来,基于大模型,人工智能将如供水供电一般流向终端,流向用户和企业。2.2大模型行业应用服务。(1AIGC技术基础设施层预训练模型的高成本和技术投入,具有较高的进入门槛,不在本文讨论范围。(2)第二层,为中间层,即垂直化、场景化、个性化的模型和应用工具。预训时兼具按需使用、高效经济的优势。随着兼具模型和多模态的模型加速成为新的技术平台,模型即服务(Modelce,MaaS)开始成为现实。OpenAI创始人山姆·奥特曼(SamAltman)“认为中间那一层会创造很多价值。5腾讯研究院.AIGC发展趋势报告2023,/report?id=AJJ,2023.4够做的关于数据飞轮的事。”(3)第三层,为应用层,即面向端用户的文字、图片、音视频等内容生成服务。在应用层,侧重满足户的需求,将模型和用户的需求无能够被分为四大基础模态,包括文本、音频、图像、视频,每一种模态技术都有着独特的应用场景和特点。——出更为丰富多彩的生成内容。2023周靖人表“MaaS应用开发的整个链路都基于这一理念来做MaaS用户可以直接通过API调用基础大模型,为不同的业务场景,来构建、训练和部署专属模型。云平台提供从数据、模型到应用服务的全周期管理和工具。产业的场景落地一直面临碎片化、长尾场景数据较少导致模型训练精度不够等行业痛点。传统“小模型”范式的应用开发流程一般针对单一场景,独此,应用在定制化需求、长尾求下的开发效率较低,且模型精度、性能、可扩展性等指标质量也会受到影响。随着大模型的出现,应用开发流程转变为,调用通用流程、结合行业经验、解决实际问题。服务商设施与PaaS平台架构,为下提供以大模型为核心的数据处理、模型托管、模型训练、够顺利平台服务获得应用的开、优化及部署,将能力应用渗透到各行各业的场景业务中。6横琴粤澳深度合作区数链数字金融研究院,亚洲数据集能行业智能时代的生产力变革:AIGC产业应用实践,06/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E8%A1%8C%E4%B8%9A%E6%99%BA%E8%83%BDE6%97%B6%E4%BB%A3%E7%9A%84%E7%94%9F%E4%BA%A7%E5%8A%9B%E5%8F%98%E9%9D%A9%EF%BC%9AAIGC%E4%BA%A7%E4%B8%9A%E5%BA%94%E7%94%A8%E5%AE%9E%E8%B7%B5-DAFRI2023.7艾瑞咨询.2023年中国AIGC产业全景报告,/report/202308/4227.shtml,2023.5图2.2:MaaS行业应用服务模式8Azure大厂,都已经推出了服务。以微软云的AzureOpenAI服务为例,就支持开发者调用OpenAI、、Codex和DALL-E等模型的API,来构建、微调模型,为应用提供支持。腾讯云从产业客户需求场景出发,依托腾讯云TI平台打造模型精选商店。腾讯云已联合行业头部企业,为十大行业输出了超过50个解决方案,提供一整套模型服务工具链。传统企业软件服务商金蝶利用百企业管理产品金苍穹GPT。2.3大模型行业术方案大语言模型在语言生成、知识利用、复杂推理等基础能力上存在诸多问题,典型如幻觉、知识时效性、专业化生成能力较弱、推理不一致等问题应用和技术方案提升大模型的稳定性与一致性。2.3.1提示词工程简单来说,现阶段基于架大模型,是根据输入预测下8艾瑞咨询.2023年中国AIGC产业全景报告,/report/202308/4227.shtml,2023.9/news/news_f4b252-cc8b-406d-98f7-05fbe1b48c22赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https://llmbook-zh.github.io/,2024.6Promptengineering在很大程度上影响了大模型在下优化的方法来生成合适的任务提示。提示格式。(1)清晰地表达任务目标。在使用大模型时需要给出清明确的指令。具体来说一个清晰详尽的任务描述中应当包含任务的各种要素输入输出数据和回复限制。(2)分解为简单且详细的子任务。将一个复杂任务分解为若干个相对独立一定的顺序处理这些子任务,模型能够逐步获得最终的答案。(3)提供少样本示例。在提中加入少量目标任务的输入输出作为任务示间的语义映射关系,提升大模型解决复杂任务的能力。(4因此可以从数据可以帮助我们更有效地使用大模型完成特定任务。如Markdown语法、XML标签等。理任务时,则需要更高级的提示策略。其中被广泛应的就是思维链(ChainofThought,)。为增强大模型在各类复杂推理任务上的等人设计了思维链的提赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https://llmbook-zh.github.io/,2024X,Schuurmansal.in-of-ThoughtPromptingElicitsLanguageModels[J].2022.7了中间的推理步骤来指导从输入到输出的推理过程,即“输入,推理步输出”形式,也可称为少样本思维链提示(Few-ShotCoTthinkstepbystep.”之类的诱导性指令,让大模型先生成思维链再回答问题来提高准确Zero-ShotCoTSelf-Consistency(LeastMostpromptinLtM)提示策略可阅读相关综述。图2.3.1:思维链提示样例常用的提示工具有:PromptPerfect15、prompttools、promptfoo、FlowGPT等,更多相关工具见LearnPrompting。KojimaSM,al.LanguageModelsareners[J].2022.SahooSinghAK,al.ASurveyofPEngineeringLanguageModels:andApplications[J].2024.https://promptperfect.jina.ai///docs/intro82.3.2检索生成增强供更多的专业知识作为上下文背成技术(Retrieval-AugmentedGeneration,RAG)通过整合外部数据库的知识,成为一种高效的解决方案。RAG通过传统的检索方法,用外部来源的最新信息补充大模型的训练数,确的回复。一个典型的RAG系统流程分为索引、检索和生成:(1)索引:索引首先从不同格式的文件中提取原始数据将其转换为统一的纯文模型编码为矢量表示,并存储到矢量数据库中。(2)检索:检索时,系统将用户查询转换为向量表示。然后进行语义相似性检索与问题最相关的前k个块。(3)生成:将原始问题和检索到的信息块被合并为提示,一并输入大模型生成最终答案。具体来讲,RAG系统涉及多不同的组件,每个组件都需要精心设计和优的选择,RAG可3种类型则可以根据业务需求在原生RAG基础上合理选择扩展组件和优化策略。R类工具有JinaReaderScrapegraph-aiCrawl4AI等专门为大模型优LewisE,Piktusal.tionknowledge-intensiveAdvancesProcessing2020,33:GaoXiongGaoX,al.LanguageModels:ASurvey[J].2023./jina-ai/reader/VinciGit00/Scrapegrapi9Unstructured、OpenParse滤等功能的RAG检索API;有专用数据框架LlamaIndex和语义检索的Haystack文档理解构建的RAG引擎RAG,也有用于RAG程序搭建的;综合开发框架LangChain33及其衍生低代码平台Langflow34、Flowise35等;Cohere更推出了专为RAG微调优化的大模型CommandR和RAG开发工具包。2.3.3智能体智能体(Agent)简单来说可看作能感知环境及需求、进行决策和执行动Agent主要依赖于规则或强化学习的方法实现。前者容的Ant的核心思想是利用大模型的逻辑推理、工具应用指令遵循等核心列执行动作(Action)的解决方案,进而简化任务难度,执行复杂推理任务,丰富大模型在实际业务中的应用场景。2023年3月,微软发布Microsoft365Copilot,4月开源项目AutoGPT38发布,6月Lilian发布PoweredAutonomousAgents”,基于大模型的Agent的重要性逐渐成为业界共识、、/Unstructure/open-parsec/trieve/ruma/llama_index/infiniflow/ragflow/langchain-ai/langchain:///logspace-ai/langflow/FlowiseAI/FlowiseHuangX,LiuX,al.planningAsurvey[J].arXiv:2402.02716,2024.LilianLLMAutonomoushttps://lilianweng.github.io/posts/2023-06-23-agent/01/1091979/sam-altman-says-helpful-agents-are-poised-to-become-ais-killer-function/10。从技术角度Agent利用特定功能的工具,甚至评身的表现。核心组件一般包括记忆模块(Memory)、规划模块(Planning)和执行模块(Execution)。(1)记忆模块主要用于存储智能体与环境的历史交互记录,包括短期记忆和长期记忆。短期记忆相当于架构约束下的上下文窗口内的输入信息。长期记忆类似于可以根据需要迅速查询和检索的外部向量存储。(2)规划模块赋予智能体类似于人类的解决复杂任务的能力,即将复杂任收反馈影响未来行为,分为无反馈规划和有反馈规划。类规划器基于高效的搜索算法,提供更可靠的规划能力。ReAct的推理行动在环中”人类的价值和偏评估和改进,引入自我完善机制,通过迭代反馈和改进来提高模型的输出效果。)执行模块的目标是将智能体的决策转化为具体结果。它直接与环境互在行动决策过程中执行https://www.deeplearning.ai/the-batch/issue-241/L,MaC,X,al.Asurveyolanguagemodelautonomousagents[J].ofComputerScience,2024,18(6):1-26.11API方模型、大模型自身的内部知识等。最为知名的开发框架是LangChain其他框架包括BabyAGIAgentGPT等;多智能体框架AutoGen46、Met7等;轻量级框架有crewAI48、Agently49、phidata等;可视化工具有Flowi、Dify、Bisheng、FastGPT、coze等。更多相关内容可见awesome-ai-agents。补齐了大模型短板的Agent更具备实用性,将是大模型重要落地方向。入R行的落地方案之一57。如摩根大通推出的FlowMind生成系统,工作流分成2个阶段第一阶段为大模型设置上下文、描述等背景信,第二阶段则是大模型识别用户查询意图调用相应的工具生成并执行代码。微软Copilot则开放测试调用PowerAutomate,与本地系统集成执行更加复杂的自动化任务Agent的工作流程将推动人工智能巨大的进步——甚至可能超过下一代基础模型”。/yoheinakajima/babyagiGPT/MetaGPT/M/phidatahq/phidata/FlowiseAI/Flowises:///langgenius/dify/dataelement/bisheng:///labring/FastGPTon/Z,Choal.FlowMind:AutomaticwithLLMs[C]//ProceedingsofACMInternationalonFinance.2023:73-81.with-power-automate-promising-to-banish-bog-tasks-thanks-to-aihttps://www.deeplearning.ai/the-batch/issue-41/122.3.4模型微调如2.3.2所述,大模型虽然在通用任务上有出色的表现,但在一些细分专业一般进行参数高效微调(Fine-tuning)。这种方法通过只训练型的微调方案有LoRa、适配器微调、前缀微调、提示微调等。测试与估等。基础模型选择可参考各大模型评测榜,如OpenLeaderboard61,ChatbotLeaderboard62,OpenCompass司南大模型评测等。训练数据集的构建则是微调的重要一环。格式化数据集构建主要有以下三种方法:(1)基于现有的证的任务数据集,如机器翻译、情感分析、文本分类等。这些数据集通常有明确的标注和结构,可以直接用于微调模型。这种方法的优点是数据质量高,标注准确,能够快速验证模型在特定任务上的性能。(2)基于日常对话数据构建。这类方法使用来源于实际对话的数据,如社模型适应更广泛过滤敏感信息以及标准化对话格式。)基于合成数据构建。合成数据是通过生成模型或规则程序生成的。这据可以通过数据增强技术、文本生成模型(如GPT)或者基于规则的法(如模板生成)来创建。尽https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard/home赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https://llmbook-zh.github.io/,202413题,并且可以根据需要生成特定类型的数据,具很高的灵活性。RAG和微调都是一种基础大模型RAG在动态环境过拟合,泛化能力较弱。RAG最典型的应用场景是类的智能客服,而微调域应用选择RAG还是微调,取决于应用环境中对数据动定制和计算能力的具体需求。更重要的一点是,提示词工程、RAG、智能体和微调并不相互排型的能力。各个技术方案的综合应用是实现贴合场景的高性能业务应用的最佳方法。图2.3.4:与微调的方案选择2.4大模型行业应用案例虽然目前生成式人工智能主要应用于面向业工作流程增加情景感知和类似于人类的决并彻底改变我们的商业模式。例如,谷歌的客服中心人工智能(CCAI)旨在帮助实现采用自然语言进行客户GaoXiongGaoX,al.LanguageModels:ASurvey[J].2023.14服务交互,而的BioNeMo则可以加速新药的研发。华为盘古气象大模型也已应用于欧洲中期天气预报中心。随着生成人工智能的不断推广和应用,其产生的深远影响和潜在价值正在加推动从实验到消费者领域再到企业领域的应用。据多样性强的行业能够为大模型提供充足的训练和微调的数据,而技术需求、创新能力强、竞争激烈的行业自身就有着拥抱新技术的热情,这些因素决定下大模型在各国、各行业的成熟度并不一致,在各个应用落地的表现也有所不同。交通等领域落地应用,行业渗透率来看,金融业的渗透率最高,已达78%在微软、金山办业的渗透率较低。图2.3大模型垂直应用行业用成熟度67StripeBloom钛媒体.2023中美大模型应用比较研报告,/news/newsdetail/68671,2023.钛媒体.2023中美大模型应用比较研究报告,/news/newsdetail/68671,2023.15科学领域如Profluent、absci;能源行业如C3i开始将生成式应用到内容创建、知识发现、智能客服等场景,引领了行业企采用新一代的风潮。大模型在垂直领域应用的案例不断涌现,业应用可见相关文献、、、、7、、。2.4.1医药健康医学方面,ChatDoctor是一个在LLaMA上微调的医学领域大模型。在相关研究中,研究团队从在线医疗咨询网站“HealthCareMagic”收集了约10万条真从在线医疗咨询网站iCliniq2收集了大约1万条医患对话用于评估模型的性能。中包括大约700种疾病ChatDoctor可以检索相应的知识和当的prompt让ChatDoctor“灵心”的心理陪伴机器人,研究团队构建了超过15万规模的单轮长文本心理咨腾讯研究院.向而行共筑新质生产力行大模型调研报告,/news/newsdetail/68815,2024.IDC&亚马逊云科技.2024生成白皮书,/document/731681598/Idc-%E4%BA%9A%E9%A9%AC%E9%80%8A%E4%BA%91%E7%A7%91%E6%8A%80-2024%E7%94%9F%E6%88%90%E5%BC%8Fai%E7%99%BD%E7%9A%%B9%A6,2024.人民网财经研究国AI大模型产业发展报告,/jiankang/nineteepdf,2024深圳市人工智能行业协会.2024人工智能发展白皮书,/?d=hld&type=f&time=1716431584387&id=7026569&name=%E3%80%8A2024%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E5%8F%9E5%B1%95%E7%99%BD%E7%9A%AE%E4%B9%A6%E3%80%8B.pdf,2024.北京学技术委员会等.北京市人工智能行业大模型创新应用白皮书(2023年)cn/ywdgzdt/202311/t20231129_3321720.html,2023量子位智库.2024中国AIGCs/5R1Y3M5DsFuWuv_bFH821Q,2024.https://www.blog.aiport.tech/p/the-first-truly-global-gene2024TheBusinessImpact,UseCases,tps://blazpregelj.si/2024-hampton-ai-business-report-uses-tools-and-business-impact/,2024赵鑫,李军毅,周昆,唐天一,文继荣.大语言模型,https://llmbook-zh.github.io/,2024.LiLiZ,ZhangK,al.Chatdoctor:medicalchatmodelfine-tunedonalargelanguagemodelmeta-ai(llama)medicaldomainknowlede[J].2023,15(6).16询指令与答案,回答数量超过50万(指令数是当前的常见的心理咨询数据集PsyQA的6.7ChatGPT与GPT4100万轮次的多轮回SoulChatCorpus-multi_turnChatGLM-6B作为初始化模型,提供合理建议的能力2024年5月,Google发布了基于Gemini模型家族的多模态医学模型Med-Gemini,通过自训练微调和网络搜索集成进行高级推理,通过微调和自定义编码器提高多模态理解,使用推理链进行长文本处理有可以直接比较的基准测试中都超过了系列模型。诸多医药公司将人智能视为核心战略,如制药巨头礼来公司(EliLillyandCompany)宣布一系列人工智能药物发现合作伙伴关系;诺和诺德(NoNonordisk)视作加速药物开发2022年以来一直与微软合作构建现来指导心血管疾病治疗靶基因的开发。2.4.2金融保险用OpenAI规模2024年5Chase)发布了生成主题投资篮子的人工智能工具IndexGPT。IndexGPT使用OpenAI的不仅分析新闻文析复杂的金融、展投资视野至非传统企业,制定多样化的主题投资策略和万事两家金融服务企业均将最新的人工智能技术应用于欺诈检测方面,预测交易是否合法。保险业联合健康(UnitedHealthGroup)正在使用人工智能和自然语言处理来/scutcyr/SoulChatSaabK,WH,al.CapabilitiesofGeminMedicine[J].arXivpreprintarXiv:2404.18416,2024./s/l30sz3-fMmL8gnF4-fMA_A.8283igence/2024/jpmorgan-chase-unveils-ai-powered-tool-thematic-i17式加强人工智能最新技术在企业内的应用。2.4.3文化教育文化教育领域中,Legible将Open的ChatGPT集成到其专有的电子书店搜索引擎中,提供一个全新的方式来访问其目录中的两百万本电子书。LibrarianAI可用任何语言流利地交谈,提供快速、友好、全面地响应和建议以及有关图书内容的信息Storybird102023年9月28日动“清华大学人工智能能教学试点课程工作方案”,智能助教系统使用模型为技术底座,通过学科专业资料搭建垂直模型,并辅助知识库,支持个性化学习支持、智能评估和反馈,辅助学生进行深入思考。北京邮电大学于2024年初发布基于讯飞科技文献领域大模型的科研助手,帮助科研人员进行深入的科研成果调研并进行智能分析,通过对话方式深入探索文献内容,生成研究文献综述。国内外数据库产商或学术搜索服务商也都推出了各类应用助手,如Scopus88、ElsevierSciBiteChat89、CNI学术研究助手90、SciSpace91、Elicit92、AminerReadPaper等。此外,中国科学院文献情报中心与科大讯飞合作研发”三大功能的星火科研。同方知网则与华为共同打造了全栈自主可控的中华知识/s/l30sz3-fMmL8gnF4-fMA_As://beta.legible.ai/auth/signin:///a/ziyuan/dianziziyuan/AIkeyanzhushou//https://typeset.io///news/fwcx/202311/t2023110_6915220.html18大模型——。电子书阅读APP微信读书和得到则在2024年上半年灰度上线了功能。前者遗产方面,字节跳动和北京大学推出的识典古籍于2024年3月上线了基于云雀大语言模型开发的古籍智能助手”“助手助手”Livdeo的MultilingualAudioChatbotsfMuseumsandulturalInstitutions利用和艺术名人进行多语种的对话,为参观者提供独特的互动体验//the-ai-revolutiohits-museums-how-chatbots-are-transforming-the-visitor-experience-e054df5b992f19第三章大模型对图馆的影响3.1图书馆大模型影响分析生成式人工智能的发展可能对图书馆产生广泛而深刻”模型技术的能力与影响,有助图书馆中应用最新的技术,为智慧图书馆建设提供新的技术路径和赋能支撑。人工智能特别兴趣小组在2023年月20告特别提到了人工智能技术在图书馆中的应用,包括馆藏资源的规模化描述、的优化,以及提升公众素养等方面,对图书馆系统、用户、馆藏、、元数据、设施、推广、培训、策划团队都有重要影响。大模型被广泛考虑作为多种任务的通用工具,这归功于大模型的核心能力,报告从大模型的核心能力出发,考虑对图书馆行业主要业务具体影响。著的自动化和智动了人工智能技术广泛应用和持续创新。表3.1从大模型典型任务能力出发,分析其在图书馆中的作用和影响。通过的创和发展。作用影响的图书馆领域包含了参考咨询、资源发现、学术服务、/g/ai/developing-a-library-strategic-response-to-artificial-intelligence/上海图书馆(上海科学技术情报研究所)等智慧图书馆大模型创新与应用白皮书,/do20的效果与能力。表3.1任务功能对图书馆的作用影响大模型典型任务功能作用与影响影响领域举例自动生成各类文档、报告、新闻稿等,文本生成辅助图书馆内容创作和信息发布。可用学术研究、阅读推广等于创作、学习与开发。理解用户查询的深层含义,提供更精准语义理解的咨询回复、搜索结果等信息服务。可信息检索、交互问答用于问答式交互。信息抽取可探索对话式发现,改变图书馆资源检索、资源推荐模式。检索推荐、资源发现等任务推理理解并执行复杂的用户指令,自动化完成特定的图书馆服务任务。图书馆服务平台、后端系统AI升级、机器流程自动化等机器翻译将不同语言的文献资料进行互译,扩大服务范围和读者群体。可用于语言文献服务、跨语言阅读。读者服务、文献服务、学术研究等识别分类对图书馆资源进行自分类、自动标注、元数据创建,优化源组织和检索效率。采编、数字资源加工与开发、数字人文研究等总结摘要自动生成文献或报告的摘要,帮助用户快握核心内容。资源发现、学术研究等息转换为图像或视频,增强信模态转换息可访问性和表达力。可用于多媒体档案保存、内容制作、信息可视化、阅阅读推广、数字人文等读障碍支持。数据分析可进行数据处理、格式转换、报表分析、指标分析、数据挖掘。可在图书馆数据系统、数据中台基础上,构建AI数据业务分析、用户行为分析、决策支持等分析能力,提升运营效率。知识图谱构可构建和维护知识图谱,增强图书数字人文、知识管理、学术研建知识管理和服务能力。究、学科服务等21大模型技术对图书馆的影响,主要源于生成式变革了技术服务模式和内容生产方式,从而带来了三点重要改进。一是人机交互界面的革新推动了图式变革了用户与图书馆服务动方式,实现了用户界面的突破,使得用户型能准确理解用户需求,转化为任务,调度资源,最终清晰呈现结果。成式能够实现精准的语义理解和复杂的文本分析,自动化地生成和丰富元内容处理,加之其趋势预测与模式识别功能,极大地提升了图馆在知识组织、知识管理与服务。的强大的内容生成和处理能力,图书馆能够自动化执行繁琐的任务,从而释放人力资源,提升工作效率和服务质量。生成式技术实现了知识的高效模式现有数据知识生成丰富多样的内容,包括多模态内容。性。(1面向对话式交互的参考咨询、文献检索与知识服务。(2)变知识集成方式。大模型技术通过自动化生成元数据、跨语言处理、知度、互联互通的知识网络,从而促进了知识的现和创新。(3自动标注与分类、自动摘要总结、知识图谱构建等,提高了图书资源加工效率,22模式转变,进一步提高图书馆资源加工的效率和质量。(4特色资源等历史文化特色馆藏资源进行开发、挖掘、利用,充分发挥语料价值,文化,激发这些资源的文化影响力。(5)提升图书馆管理决策能力。大模型应用可以更好地对图书馆的各项业务数理决策更加科学、合理和有效。图3.1大模型技术对图书馆的影响3.2书馆大模型应用策略在入思考图书馆大模型应用之前,有必要探讨生成式的应用策略及应用方式。国际图联(IFLA)在其《图书馆对人工智能战略响应》中,提出了三项策略建议,旨在指导图书馆如何有效利用I技术,提升服务效能,同时确保其应用的伦理性和可解释性。三项策略分用图书馆的能力构建负责任且可解释的描述性应用;利用图书馆员的数据能力增强组织的能力;23推广人工智能素养以提升组织和社会的能力。此外,美国国会图书馆(LibraryofCongress系统中数据、模型和人员三个要素的重要性,并提出了理解、实验和实施”分阶段的方法论,以实现负责任的实践。图书馆可在上述权威性应用策略的指导下进行实践,本报告归纳了如下的策略要点供图书馆进行参考:(1)考虑馆藏与数据价值籍和特藏,明确可以优先应用技术的数据。高度重视数据治理,包括数据清操作性(2)进行概念验证与服务转化实施小规模的概念验证项目,以测试生成式技术在图书馆服务中的可行性。对于技术挑战(例如图像分类等)开发或整合高效的算法,提升处理的精确度。成功的概念验证项目应转化为可持续的服务,以实现技术的长期价值。(3)持续监控与质量保证建立监控机制,根据反馈持续改进服务,确保服务质量。考虑使用数据为中心的评估方法,通过科学地评估和测试,确保系统的稳定性和可靠性。(4)积极培训与参与提升图书馆用户的素养,并通过社区反馈优化服务。支持并参与来自不同机构的独特资源和专业知识。(5)好经济性与工具评估对技术应用进行成本效益分析,确保所选工具解决方案在预算内提供能够最大化投资回报率的工具。(6)关注法律与伦理框架确保应用遵守所有相关的法律法规,特别是在数据保护、版权和知识产/g/ai/developing-a-liry-strategic-response-to-artificial-intelligence//thesignal/2023/11/introucing-the-lc-labs-artificial-intelligence-planning-framework/24权方面。建立伦理审查流程,确保应用不会侵犯个人隐私,避免算法偏见和歧视。3.3图书馆大模型应用路径技术应用于智慧图书馆中,以实现图书馆服务业务的智能化升级。本报告归纳了图书馆整合和应用生成式技术的六种方式路径。(1)无需开发集成的服务:图书馆无需进行任何开发工作,重点放在素养、而是侧重于通过馆员组织培训、活动等方式向用户和社会提供I服务。该路径无需系开发、无需数据处理。(2直接集成第三方提供的产品的性能和适用性,为图书馆直接所用。例如不少图书馆上线资源商开发的学术助手开发量低、几乎无需数据处理。(3产品的对接。该应用方式下,图书馆需要对运营数据、服务数据、资源数据等进行一定程度的适配和优化,以确保产品与图书馆平台服务无缝集成。例如基于图书馆资的数据处理任务。4和系服务数据、资源数据进行分析、处理,提供支持的果展现、建议决策等。服务平台(LSP)副驾驶等。该方式面临着发工作和数据处理任务。(5/联合开发的原生应用:图书馆利用自身馆藏数据、用户数据,投入资源,开发新型前后端的原生应用。此类应用需要对图书馆资源数据进25路径开发工作量大,数据处理任务重。(6求。该路径需要深度的数据准备和技术研发能力。图3.3图书馆模型应用的六种路径举例方式来应用人工智。对于路径1,在推广人工智能素养方面发挥领导作用,是当前最符合现有图书馆实践和图书馆员身份的策略。对于路径2-5,在实施负责任的应用时,建议多数图书馆基于MasS行应用。对于路径6,要求图书馆具备一定的资源能力、技术能力或研究能力。语模型提供服务/blog/2023/01/23/sweden-library-ai-open-source/26源和知识服务智能化。资源的最优配置和利用效率的最大化。对于技术基础较弱或希望快速实现服务的图书馆,可以考虑从集成第三方服务开始,逐步积累经验和技术能力。对于具有较强技术实力和研究背景的图书馆,可以考虑自主研发或联合开发A保应用能够切实解决问题、提升服务体验的前提。此外,险评估与管理是保障应用稳健性的重要环节,图书馆需制定相应的风险管策略,以应对潜在的技术风险和道德挑战。为了适应技术的快速发展,图书馆还需制定长期的技术发展规划,以保持其服务的前瞻性和竞争力。3.4图书馆大模型应用范式图书馆通过上述六种实施路径,在应用策略方针的指导下,成功地运用并实施生成式技术,以此深入慧图书馆的转型。这一转型主要体现在两种成技术进行重塑,提高了服务质量和流程效率;另一方面,图书馆开创开发原生应用,推书馆服务智能化跨越式发展。这正对应了《智慧图书馆大模型创新与应用智慧图书馆+智慧图书馆”两种不同的应用范式。统应用的技术得到增强辅助的采编流程、数字资源的加工与开发等,通过化现有工作流程,提升型的智能化能力实现服务和效率的双重提升大模型”的应用范式。/rmydb/202310/t20231017_512798.html上海图书馆(上海科学技术情报研究所)等智慧图书馆大模型创新与应用白皮书,/do27开发原生应用:关于原生应用这一概念并没有准确的定义,仍存在不同支撑的应用。这一类应用直接根植于生成式技术最核心的能力,如提供个性化服务和内容创新创造。典型的应用例如智能聊天机器人、写作助手、原生应用如:研究助手、个性化学术教练等,为用户提供定制化的信息和5联合开发的图书馆个体的特色性。随着技术的不断发展,越来越多的原生应用将被开应用,智慧图书馆中的大模型应用则逐渐由“+大模型”向“大模型+”范式转变。当然,原生应用中还包括了智未触及的应用领域。尽当前尚未广泛实程自动化、具身智能应用以及高智能员工等概念。这些潜在应用有望进一步发展机遇。图3.4图书馆“+大模型”+”应用范式283.5图书馆大模型技术架构高度扩展性和集成性,以满足图的发展和创新需求。足图书馆的发展和创新需求。图3.5图书馆大模型技术架构(1)底座层:硬件方面要考虑GPU或CPU设备,还要关注最新的硬件进展。例如,的TensorRT是一个为深度学习推理优化的软件库,而Intel的VINO则提供了跨不同硬件的推理优化。在选择云端本地部署时,AzureAWS提供的容器务和(K8S于实现资源的弹性伸缩和智能调度。(2MaaS)的兼容性。模式涉及模型的全生命周期管理,从数据处理到特征工程,再29到模型训练、调优和部署。此外,模型服务还包括API和开发工具,以便于开的管理办法,如《生成式人工智务管理暂行办法》。(3)平台层:平台层的设计应支持与现有图书馆服务平台、数字人文平台等的集成,并能够通过API网关与各类信息化应用对接。模块化的大模型应用框架,如Langchain、Dify和FastGPT,提供了易于扩展和定制的能力。运维工具如LangSmith和PromptLayer,监控工具如arize、fiddler和Helicone,以及防火墙如arthur,都是平台层的重要组成部分,确保大模型应用的稳定性和安全性。(4应用层:应用层的设计应包含应用框架和数据管理提供应用级的基LangChain提供了一个用于构建和部署大模型应用的框架。数据管理工具如LlamaIndex和MindsDB,可以帮助组织和检索大量的结构化和非结构化数据。向量数据库如chroma、Milvus和Weaviate,对于处理和索引大规模的向量数据尤其重要。此外,应用和工作流工具如Retool、Streamlit和gradio,可以用于快速开发和部署基于大模型的应用程序。本内容生成、图多媒体处理、数据处理与分析,以及工作流编排和管理等。通过构建这些功活性和管理效率,以满足不断演化的图书馆服务需求。30第四章智慧图书馆中大模型应用图书馆应积极关注并推动生成式的创新应用和场景落地,尤其要关注大模型技术如何有效提升服务成效和服务量。虽然大型模型技术仍在持续迭代,生成式技术也在不断发展之但图书馆可以积极思考挖掘大模型技术在智展的主动权。发展现状,下文重点梳理智慧图书馆建设中,那些当前可实验、施或展望的应用。图智慧图书馆中的可实验、实施或展望的大模型应用上海图书馆(上海科学技术情报研究所)等智慧图书馆大模型创新与应用白皮书,/do314.1智慧服务中的大模型应用在智慧服务中主要集中在增强客户体验,体现在如下几个领域:一是智慧读者服务的智能升级。通过自然语言处理技术提供智能问答服务、个性化推荐等,带来读者服务中的咨询问答、检索发现、资源推荐的智能升级。这些应用已经开始由图书馆厂商开发并逐步推向市场。与学科“学术助手”“AI助教”为典型的应用也已在市场推出。三是驱动图书馆创新服务。通过激活自有数据价值,结合元宇宙等新技术,领域开辟新的前沿。这类应用目前主要体现在结合特藏的数字馆员服务、阅读产品创新体验、知识服务等领域。下。(1)传统服务赋能领域1:智慧咨询服务目标:使用大模读者提供准确、实时的信息咨询服务。模型能力:问答、搜索/信息抽取等馆咨询询、动咨询、用户使用咨询、使用故障解决等。技术方案:提示词工程、RAG、智能体应用路径:需整合开发的产品与服务领域2:智能检索与发现注:本章中所呈现的目标设定、应用建、模型能力、技术方案、应用路径旨在提供参考,并非唯一确定的解决方案。32目标:运用大模型帮助读者快速、准确地发现和检索到他们所需的信息和资源。模型能力:问答对话、搜索/信息抽取等发现。引入智慧增强功能,优化过程,借助自然语言处理和多轮对话系统,使读者能够以更直观、更高效的方式来发现馆藏的纸质和数字资源。技术方案:提示词工程、RAG、智能体应用路径:需整合开发的产品与服务领域3:个性化智能推荐目标:通过大模型技术,为读者提供全新智能化的书籍和资源荐。模型能:问答对话、搜索/信息抽取、数据分析等据库推荐知识库。技术方案:提示词工程、RAG、智能体应用路径:需整合开发的产品与服务领域4:智慧学术模型能力:问答对话、搜索/信息抽取、文本理解、机器翻译、数据挖掘、数据分析、文本生成等建议源,发现潜在的研究方向和创新点,帮助实现个人文管理与知识研究智能化,据库供应商是否提供相关功能。改进图领域的特色专题服务,提供基于学科领域的数据分析、知识图谱问答服务。技术方案:提示词工程、RAG、智能体33应用路径:直接集成应用的产品工具、需整合开发的产品与服务领域5:智慧情报服务目标:运用大模型提供更加丰富慧的情报服务产品。模型能力:问答对话、搜索/信息抽取、文本理解、机器翻译、数据挖掘、数据分析、文本生成等服务效。技术方案:提示词工程、RAG、智能体应用路径:直接集成应用的产品工具、需整合开发的产品与服务领域6:智慧教学与学科服务服务的智能化水平,以实现个性化学习和研究支持。模型能力:问答对话、搜索/信息抽取、文本理解、机器翻译、数据分析、文本生成等建议:提供学手,增强个性化学习路径规划、互动式学习体验、学习效学方法改进提供决策支持。技术案:提示词工程、RAG、智能体、模型微调应用路径:直接集成应用的产品工具、需整合开发产品与服务、集成定制开发的后端流程、自主/联合开发的生应用(2)创新服务驱动领域7:虚拟人、数字人、数字馆员34用户体验感。模型能力:问答对话、搜索/信息抽取语音识别与合成等建议:利用虚拟人和数字馆员实4/7在线咨询服务,提供及时且准确的信息Agent数字馆员升级。技术方案:提示词工程、RAG、智能体应用路径:直接集成应用的产品工具、需整合开发的产与服务领域8:智慧创新阅读与体验目标:利用大模型为广大读者提供新颖、智慧的新型阅读体验服务。模型能力:问答对话、搜索/信息抽取、文本生成、图像与语音识别、多模态创作等建议:需要开拓创新。除了引入阅读工具辅助文献阅读外,可重点结合阅读推广服务,开发创新型阅读体验,例如基于特色馆藏的AIChatbot,融入增强元宇宙沉浸式阅读的互动性等。技术方案:提示程、RAG、智能体应用路径:直接用的产品工具、需整合开发的产品与服务、自主/联合开发的原生应用领域数据与知识服务产品目标:发挥图书馆专有数据、基础数据设施优势,构全新数据服务、知识服务、模型语料提供等,提高知识的传递能力模型能力:问答对话、搜索/信息抽取、文本别、知识图谱理解与构建、内容生成等35间层和应用层产品,通过跨界合资源整合、服务对象拓展,提供基于的人文知识服务、深度解析服务、艺术及文学作品溯源服务,提供诸如古籍解读、碑帖识别、历史人/物识别、人文创作体验服务等。技术方案:提示词工程、RAG、智能体、模型微调应用路径:需整合开发的产品与服务、自主/联合开发的原生应用、参与研发行业基础大模型4.2智慧业务中的大模型应用随着技术的持续进步,智慧图书馆的业务流程中,将越来越多地体现人机共存和人机互补的理念,这将成为图书馆智慧业务中大模型应用的重要趋势。执行采编、资源加工、知识组织等核心业务流程。这不仅包括自动分类和编目,图书馆的运营效率和服务质量。和文献进行高效的数字化处理,包括保存、修复、识别、评估、分类、开发等。通过结合各类技承提供丰富的原和深度分析。络构化的知识体系,为专业研究提供更为丰富和深入的学环境。领域10:智能采编目标:利用大模型提高图书馆采访和编目的效率和质量。36据分析等据比较和分析,解放馆员的重复工作。技术方案:提示词工程、RAG、智能体、模型微调应用路径:集成定制开发的后端流程、自主/联合开发的原生应用领域11:智能数字资源加工源的高效管理和知识的持续传承。元数据生成、格式迁移、数字恢复、数据分析挖掘等换、机器翻译等。采用进行数内容的格式迁移和规范化,以适应数字保存像的自动标引、和物体识别技术视觉材料的元数据标记,提升检索效率。采用先进的体内容的质量。技术案:提示词工程、RAG、智能体、模型微调应用路径:需整合开发的产品与服务、集成定制开的后端流程、自主/联合开发的原生应用领域12:古籍与数字人文智慧研究/news/webinar-ai-andthe-future-of-digital-preservation-call-for-proposals/37字人文研究和服务的质量与效率。模型能力:语义分析、机器翻译、文字识别、图像识别与处理、知识图谱构建、问答对话、搜索信息抽取、数等情感分析、时空分析、图像修复、古籍修复等。嵌入数据分析工具、可视外部基础数据,构建、开发图书馆特色的历史人文专题特色资源知识库的知识服务应用与产品。技术方:提示词工程、RAG、智能体、模型微调应用路径:需整合开发的产品与服务、集成定制开发的后端流程、自主/联合开发的原生应用、参与研发行业基础大模型领域13:智慧学术研究、情报研究目标:借助大模型协助馆员进行学术学科研究、情报分析,提供一个集成功能工具的知识研究助手或研究环境。模型能力:文本分析与理解、搜索/信息抽取、信息整合、机器翻译、数据分析与挖掘、知识图谱构建等服务馆员、情报服务馆员建立智慧的专业研究环境。技术案:提示词工程、RAG、智能体制开发的后端流程、自主/联合开发的原应用4.3智慧管理中的大模型应用38支持,包括:馆员间高效的知识共享和业务沟通。面的能力,提升图书馆智能决策水平。而提升作效率。作效率。领域14:馆员知识库升级沟通,提高处理业务的效率和准确性。模型能力:文本分析与理解、搜索/信息抽取、问答对话等相关的咨询和问整合API调用现有应用系统的能力,能够将返回的结果融入到回答中为馆员提供全方位且精准的信息支持,确保信息的准确性和可靠性。技术案:提示词工程、RAG应用路径:直接集成应用的产品工具、集成定制开的后端流程领域15:智慧分析与智能决策务质量与管理效率。39展示等迁移、自动报表、智能问答等功以支撑图书馆在数据驱动决策方面的需求。数据中台的中台。技术方案:提示词工程、RAG、智能体应用路径:直接集成应用的产品工具、集成定制开发的后流程领域16:图书馆平台管理副驾驶(Copilot)强决策支持能力。据的深入分析和的核心组成部分。技术案:提示词工程、RAG、智能体应用路径:集成定制开发的后端流程、自主/联合开发的原生应用领域17:智慧办公与运营协助目标:为图书馆员工在宣传、推广、人事、财务等各自日常工作领域中提供效率工具。40器翻译、数据处理、数据分析等制作和编辑图像与视频内容;提供支持的培训、财务、后勤。通过技术促进员工工作效率和工作质量的提升。技术方案:提示词工程、RAG、智能体应用路径:直接集成应用的产品工具、集成定制开发的后端流程4.4智慧空间中的大模型应用的应用,当前可尝试领域的包括:无障碍服务、空间预约等,全面提升了图书馆空间的运营效率和用户服务体验,推动了图书馆服务的智能化转型。二是利用技术拓展虚拟空间服务。通过虚拟助手、数字人、元宇宙交互服务,增强用户性和体验感。领域18:智慧预务目标:整合大模型技术,实现图书馆空间和资源的智能预约管理。模型能力:任务理解、资源优化分配、自动化工作流程等建议提供自动化的确认和提醒服务,减少人工干预,提高预约流程的效率用户便利性。技术方案:提示词工程、RAG、智能体应用路径:需整合开发的产品与服务、集成定制开发的后端流程刘炜,赵冬梅.图书馆智慧空间建设:概念、演变、评价与设计[J].图书情报工作,2022(01):122-13041领域19:实体机器人常运营和服务。模型能力:语音识别、问答对话、搜索/信息抽取等行自然语言交流,提供信息咨询、导览、导航和辅助服务。具备知识检索能,OCR识别结果,补全漏字,准确分类图书信息等。技术方:提示词工程、RAG、智能体应用路径:直接集成应用的产品工具、需整合开发的产品与服务领域20:无障碍智慧服务目标:通过大模型技术为视障读者提供无障碍的图书馆服务。模型能力:语音识别、自然语言处理、文本到语音转换、图像识别与描述等帮助视障用户理书馆内自由移动所有用户,包括视障人士,提供更加便捷和贴心的服务。技术方案:提示词工程、RAG、智能体应用径:直接集成应用的产品工具、需整合开发的产品与服务领域21:元宇宙空间智慧服务目标:利用生成式技术,在元宇宙空间提供沉浸式和互动性的虚拟图书馆体验。模型能力:自然语言交互、个性化推荐、情境感知、图像与语音生成等42建议:将生成式融入虚实融合的元宇宙空间服务中。在图书馆的虚拟镜像或使得系统能够根据用户的行为和反应实时调。技术方案:提示词工程、RAG、智能体应用路径:需整合开发的产品与服务、自主/联合开发的原生应用领域22其他(楼宇控制、安防等)模型能力:图像分析、行为分析、预测分析、情感识别、智能决策支持等于数据的资源优化和策略制定,确保图书馆长期稳定运行。技术方案:提示词工程、RAG、智能体应用路径:集成开发的后端流程43第五章图书馆典型大模型应用需求及场景举例图书馆通过融入并持续驱动服务模式迭代更新。根据腾研究院2024年5月份发布的《行业大在各行业中的应用仍处于探索孵化期和实验熟期关产品,探索性成果和研究成果陆续发布。当前,图书馆行业大模型应用落地显示出一定的特征:1,在图书馆服务端,大模型技术的应用实施显示出较为迅速的进展。当前主要集中在提升用户体验(如智能数字馆员)和增强学术服(如学术助手)。尝试通过增强用户互动和个性化服务,来提升服务质量。2,与服务端相比,后端业务生产流程的大模型技术应用落地进程较慢。行业当前正积极探索和尝试如何通过大模型技术提高后端操作的自动化和智能化水平,以提高生产流程如采编、资源加工等环节的效率。3,图书馆正积极推进基于大模型技术的智能化工具助手,部分产品已达试用阶段。通过开发如图书馆平台副驾驶、馆员助手等应用,图书馆旨在提升馆员的后台工作效率,实现管理流程的优化。参考咨询、资源发现、阅读推广、学术服务、采编辅助、资源加工、数字人文、管理决策。通过析这些领域的需求要素、潜在应用场景、当前案例情况,本章旨在展示相关馆界大模型应用提供参考。腾讯研究院.向而行共筑新质生产力行业大模型调研报告,/news/newsdetail/68815,2024.44图5.0图书馆大模型典型应用场景5.1智慧咨询服务5.1.1需求分析务熟练度也会影响问答的准确性,且回答风格缺乏统一标准。需求建议:以最新大模型技术级面向读者的智慧参考咨询服务,读者可以123)4故障排解;(5)合数字人、机器人技术,进行交互体验服务。5.1.2场景举例场景1:问答式参考咨询服务图如何参观预约上东馆?”新活动于故障处理,当读者提问后,用自然语言引导读者进一步告知具体的故障现象,45一部分简单的故障,若不能处理则流转至人工。场景2:智慧数字馆员服务不限于图书馆开放时间、借阅规则、馆藏资源位置等。利用自然语言处理技术,移动终导用户进行自助图书馆服务中不可或缺的一部分。场景3:智慧机器人馆员服务器和人工智能算障读者使用图书馆设施时遇到的技术难题,如自助打印机操作、电子资源访等。5.1.3已有案例1.国家图书馆推出问答系统,46国家图书馆智能问答系统以文心大模型”数字阅读体验,可进行语音问答、书籍查找,游戏互动等体验。2.台湾公共资讯图书馆打造了A馆员——晓书台湾公共资讯图书馆与东海大学合作开发了一款名为“晓书”的生成式智ChatGPTDigital够全面解答读者关于图书、阅读以及图书馆内部设施的各类咨询。3.云瀚应用海恒小海豚数字馆员”务办理等多种服务。能提供个性化主动式服务,将流程引擎和模型进行结合,能推进程,并进行流程节点的判断。4.云瀚应用-ChatBK博看智慧咨询书馆自行对私有知识进行上传、编辑及预训练学习。5.2智慧资源发现5.2.1需求分析和个性化推荐,众多的资源和数,往往缺乏必要的了解和选择指导。资源航助手,帮助用户推荐最适合的数据库。5.2.2场景举例场景4:启发式资源检索服务/read/amp/story/7009/784121306fbFm3w47启发式文献检索服务区别于图书馆传统基于关键词搜索模式的文献检索模术数据库进行搜索。例如读者可出以下问题:关于大模型、人工智能领域近1年的文章有多少篇?”“智慧图书馆研究最有影响力的文章是哪几篇?”“转基因技术对于农业生产的帮助是什么?系统为读者提供简明且可信赖的研究主题相关的启发式追问,来启发用户多轮提问。路功能综述报告功能是根据检索结果的论文,自动分析总、生成研究综述。定量的高被引论文进行分析。告诉读者该主题的相关论文主要集中在哪些年份,文分析内容生成综述报告。检索结果可视化功能是对搜索结果进行可视化展示,界面,内置相似文章推荐,并提示有待进一步探索的问题。场景5:跨资源智能馆藏检索与推荐化的资源代理检源中,为读者推的文献资源。读者可能的提问方式包括:请帮我推荐可以了解最新进展的数据库”“图书馆有没有时间简史这本书?”“Nature期刊的最新发文有哪些?读者不同的问题需要查找的图书馆文献资源可能是不同的,提问的实现依赖于大语言模型API的调48示。如由机器人服务,可以继续进行导航指引。此外,在进行馆藏资源推荐时,以在获得读者信息的基础上,根据读者的历史行为画像,进一步分析做准推荐。大模型能列出推荐的书单和理由,针对推荐等资源,可提供总结。读者如不满意,可以追加描述,直到定位到满意的书单。5.2.3已有案例1.日本横滨市立图书馆推出借书检索服务日本横滨市立图书馆推出图书检索服务,用户通过关词或描述性句子即可获激发读者阅读兴趣。2.清华大学图书馆上线导航助手导航助手能根据提问,提供精准的数据库资源介绍,并在每次问答之后,推荐3个相关数据库链接供直接访问。3.卢森堡国家图书馆针对数字化的期刊和报纸进行馆藏语义搜索展语义搜索,从而实现对馆藏内容的深入理解和高效检索。5.3智慧阅读推广5.3.1需求分析书本位”向“本位”的转型。阅读推广部门承担着图书及资源的策略性推荐、营销传播,以及系统性的阅读要通过新媒体渠道进行多媒体制作与互动传播等一系列复杂任务。读推广工作中,浅阅读”https://libraryview.me/2024/01/22/16742/#more-16742gT65LjOQA49方合作。需求建议:充分利用大模型、生成式等新技术手段,为读者提供智能化、个性化、1技术的智能阅读陪伴或推荐系统,源推荐,提高推广的针对性和吸引力。(2)建立阅推知识库语料库,为推荐提3浸式的虚拟阅读场景,激发阅读兴趣。(4)通过技术,辅助馆员高效生力,减轻馆员工作负担。5.3.2场景举例场景6:智能阅读伙伴服务这项创新服为读者提供基于图书馆资源的个性化阅读推荐和智能化阅读辅助。图书于自身丰富的资源,结合生成式技术,打造图书馆品解读者的阅归还图书,并推荐附近图书馆的相关资源。还能根据读者的兴趣爱好,50可通过算法,根据读者的阅读兴趣、偏好、水平等因素,自动将具有相似阅读爱好的读者组织到同一个虚拟阅读社区中。场景7:元宇宙虚拟馆员服务在图书馆的元宇宙虚拟空间中,驱动的智能虚拟馆员将全程陪伴和引导读典作品的情节与人物,发读者的思考与共鸣。此外,虚拟馆员还可以担任动策划员的角色,味性和参与感。通过虚拟馆员的引导,读者能够在元宇宙中获得全新的沉浸场景8:馆员阅读推广工作站提供馆员阅读推广工作站,馆员可利用工具进行阅读推广活动与内容的创作与开的推广结合数字人物与虚拟环境,馆员还能够制作出引人入胜的音视频材料。这些技术的应用将极大地减轻馆员在视频拍摄和制作方面工作负担。此外,还可以辅助馆员进行内容加工与管理。可以动标记和归档视频、文档,标馆员可以将形成的视频资源库、文案素材、活动资料等,发展为专题库,为未来的阅读推广提供素材支撑。5.3.3已有案例511.新加坡国家图书馆管理局推出书籍聊天机器人ChatBookChatBook“辩论买或借阅书籍的推荐,以鼓励深索在线资源。2.新加坡国家图书馆推出StoryGen人工智能图像生成服务StoryGen验。用户可依据书籍中的角色、类型、故事等关键词,创意性地生成相应图,打造出属于自己的故事世界,为用户带来一场沉浸式的阅读体验。3.上海图书馆进行虚拟人阅读推广,以及推广视频制作上海图书馆阅读推广部在阅读日历”项目中,使用GPT-SoTS和Heygen等软件音或数字人口播视频。通过runway、suno等工具尝试视频、音乐创作用于阅读推广。4.嘉兴图书馆、上海图书馆利用生成式为少儿读者提供活动服务、嘉兴市图书馆利用StableDiffusion模型开发了适合未成年读者的绘图系统——AI绘梦大师,并同步开展关培训课程与活动。上海图书馆员工利用StableDiffusion模型打造文生图模型应用,少儿读者可以在馆员的指导下,体验用生成式创作作图,并将设计的图片进行个性化印刷,完成自创绘本制作。5.帕洛阿尔托市图书馆ChatGPT高级数据分析实验通过优化mmons的分类体系以更精准地匹配读者的兴趣,旨在增强个性化推荐功能性,进而提升用户在网页端的阅读体验。5.4慧知识服务5.4.1求分析.sg/main/about-us/press-room-and-publions/media-releases/2023/2024-Year-in-Previewns/media-releases/2023/2024-Year-in-Preview/s/I3nXhVNZ1UhLNTCrHj3fIQ/s/izpIBoWF7aqNSC-7jjeg/articles/1786752的支持和服务还不够完善和高效水平有待提升;用户信息素养和媒介素养教育需求增长的挑战。需求建议:(1Personalknowledgeenvironment简称PKE),成为学者的研究助手。该环境能建立在图书书馆或多个数据商的智能学术研究工具,提供智能研究环境。(2)增强智慧教学与学科服务,通过学习助手为师生提供个性化和智能化的学习支持,包括个性化学习路径规划、互动学习体验及学术研究辅助。助手的应用深化了教学和学习的互动3平台和虚拟环境提高学生、馆员、公众的信息素养和技术使用能力。5.4.2场景举例场景9:个人知识研究环境(PKE)服务场景图书馆可建立一个最大限度整合的学术资源的个人知识研究环境(PKE),为用户提供一个生成研究大纲,以及内容生成、审稿检查等功能,覆盖个人知识研究的全流程。(1)PDF题、解释学术概念,支持交互式问答,生成概念知识谱。(2)选题与学习路径建议:根据研究领域或问题,生成选题建议,提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论