RAG 的开放性及企业落地_第1页
RAG 的开放性及企业落地_第2页
RAG 的开放性及企业落地_第3页
RAG 的开放性及企业落地_第4页
RAG 的开放性及企业落地_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

RAG

的开放性及企业落地姜勇Dify

架构师目录建设

RAG

目前的困境RAG

发展史Enterprise

RAGRAG

的展望1.2.3.4.RAG

难点from:

/html/2401.05856v1RAG

难点FP1MissingContentFP2MissedtheTopRanked

DocumentsFP3NotinContext-ConsolidationstrategyLimitationsFP4NotExtractedFP5WrongFormatFP6Incorrect

SpecificityFP7

Incomplete第一阶段:Basic

RAGRAG

发展史AnswerRetrievebasedonvector

searchRAG

发展史BasicRAGPipeline:Indexing&

QueryingRAG

发展史RAG

发展史第二阶段:Advanced

RAGHybrid

RetrieveAnswerResult

ProcessRAG

发展史RAG

发展史Query

typeKeyword[NDCG@3]Vector[NDCG@3]Hybrid[NDCG@3]Hybrid+SemanticRanker[NDCG@3]Conceptseeking

queries39.045.846.359.6Factseeking

queries37.849.049.163.4Exactsnippet

search51.141.551.060.8Websearch-like

queries41.846.350.058.9Keywordqueries79.211.761.066.9Lowqueryterm

overlap23.036.135.949.1Querieswith

misspellings28.839.140.654.6Long

queries42.741.648.159.4Mediumqueries38.144.746.759.9Short

queries53.138.853.063.9RAG

发展史Hybird

RetrieveAnswerResult

ProcessQuery

TransformRAG

发展史“GarbageInGarbage

Out.”RAG

发展史类型示例问题与语料不相关询问产品配置库关于货物运输的问题问题模糊“这篇文章的作者是谁?不是关于事实召回“总结一下这篇文章的主要内容”包含多个子问题"今年的欧洲杯在哪里举办,什么时候开始?"需要多跳逻辑“Whowonthe2023superbowlandwherewastheirheadcoach

from?”包含非语义组成(结构化)“Whataremoviesaboutaliensin1980”-shouldfilterby

year=1980问题包含比较“江苏省房贷利率政策从2022年至2023年有哪些调整?”Howtodealwithbelowqueries

?RAG

发展史RAG

发展史类型解决方案问题与语料不相关检索前增加问题分类或检查步骤,如查询路由(Queryrouting)问题模糊基于历史的问题重写(Rewrite)不是关于事实召回(总结)索引过程中实现摘要(Summary

Index),分层检索(Recrusive)长文本窗口模型(LongContext

Model)包含多个子问题子问题拆分(sub-question)后并行查询需要多跳逻辑问题规划(Question

Planing)迭代召回(Iterative

Retrieval)包含非语义组成(结构化)元数据过滤器(Metadata

Filter)问题包含比较问题规划(Question

Planing)RAG

发展史ModelMax

Tokengpt-4o128Kclaude-3200KGemini1.5

Pro1Mqwen-long10Mdeepseek-chat32KERNIE

Speed128Kglm-4128Kdoubao-lite-128k128Kmoonshot-v1-128k128K第三阶段:Multiple-mode

with

longcontextRAGThemodel’s

contextsizeis

huge,so,RAGis

notrequired

???RAG

发展史机会:分块算法更灵活,可以达到文档级别文档之间的分析和比较更容易总结更容易更容易的记忆管理,减少压缩技巧的使用减少幻觉为大模型支持无限

Context前的过滤手段,减少成本Long-context&

RAGRAG

发展史Parentchunkforlong-context,childchunkforretrivalEnterprise

RAGRAGSemantic

CacheModerationAuthenticationObservationEvaluationLoad

BalancingRAG

展望RAG

系统的本质是基于自然语言的开放域问答系统,难点也在于“开放域”。要想获得符合预期的召回效果,需要对应用情景进行概括和收敛,寻找合适的检索模式或组合。在动手设计一个

RAG

系统之前,最好先考虑好你的用户是哪些人,以及他们最可能问出什么样的问题。——《引入混合检索(Hybrid

Search)和重排序(Rerank)改进

RAG系统召回效果》RAG

展望没有最好的,只有最适合场景的策略Nooneisbetterthantheotherbutjustwhenonefitsmoreincertaintypeofquestions.RAGPipline联系方式Dify.AI

官方公众号如果你喜欢Dify,欢迎:在

GitHub

上贡献代码,与我们一同共建更好的Dify;通过线上线下活动、社交媒体向你的朋友们分享

Dify,以及你的使用经验;在GitHub上给我们点亮⭐/langgenius/dif

yDify.AI

官方小助手麦思博(msup)有限公司

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论