构建企业级+RAG+系统的创新实践-阿里云+费跃_第1页
构建企业级+RAG+系统的创新实践-阿里云+费跃_第2页
构建企业级+RAG+系统的创新实践-阿里云+费跃_第3页
构建企业级+RAG+系统的创新实践-阿里云+费跃_第4页
构建企业级+RAG+系统的创新实践-阿里云+费跃_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

构建企业级RAG系统阿里云/PAI人工智能平台模块化RAG架构企业级RAG能力集成检索增强生成(RetrievalAugmentedGeneration,RAG)从数据源中检索信息来辅助大语言模型(LargeLanguageModel,LLM)生成答案。•准确性•数据安全•需求具有多样性,常规RAG链路难以满足不同场景的企业级RAG系统架构模块化RAG架构高级高级RAG模块化模块化RAG图片来源:/pdf/2407.21059•白盒化:模块可以灵活添加/修改•快速构建:可通过配置文件/UIdashboard修改模块配置•代码开源:兼容LlamaIndex开源协议•模块编排:通过编排和路由匹配不同场景需求评估端到端和各模块性能格式多样性:企业级数据格式多样,需要适配不同类型文件的结构和内容内容复杂性:文档内容可能包含文块等多种复杂元素。非结构化文本:PDF或者扫描类文档解析难度高知识库中内容会过期失效结构化文件JSON结构化文件JSON编码•存储表格key-value信息非结构化文件转MarkdownPDF解析算法闭源PDF解析API•DocumentMind•LlamaParse开源PDF解析模型•EasyOcr•PDF-Extract-Kit-embedding的序列长度限制1.Markdown输入,降低解析复杂度3.特殊元素处理•减少查询和文档之间的语义差异•假设文档(HyDE)•回溯提示(STEP-BACKPrompting)•LLM•AgentPrompt路由:根据问题选择对应的prompt•不同问题场景切换prompt•多语言查询的prompt切换向量检索–Embedding模型选择•MTEB榜单•知识库的语言(中文/英文/多语言)•关键字检索:BM25,稀疏embeddingEmbedding模型微调权重和阈值比较困难。•交叉编码器,比Embedding更精准•开源模型:bge-reranker,bce-reranker,gte-reranker等LLM重排序如何选择合适的LLM•文本块顺序:lostinthemiddle•输出固定格式(JSONformat)•高质量FAQ召回多模态多模态RAG离线解析:•两种embedding:文本embedding,CLIPembedding在线查询•两路查询,text_top_k,image_top_k•多模态大模型进行文图推理应的RAGpipeline•对RAGpipeline的运行企业级RAG能力集成•企业自有身份供应商集成阿里云SSO•基于角色SSO的访问控制,只读/编辑/管理员•PrivateLink访问•在线服务/可观测数据反馈•生产环境有严格的权限管控•A/B实验LLM-LLM-as-a-Judge:量的辅助模型。•HitRate•MAP(Faithfulness)(Correctness)BladeLLM/vLLM推理加速场景1.客服+FAQ-Q1:忘记账户密码如何重置?-Q2:打印机安装指南。-Q1:上个月杭州门店的销量情况-Q2:哪个门店的会员增长数量最多场景1.多模态RAG问答-Q1:A款和B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论