




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
=<>大数据百家讲坛第135期2025.03.29王吉伟,《一本书读懂AIAgent:技术、应用与商业》作者,AIGC&超自动化分析师,知名科技博客王吉伟频道创始人。多年来持续关注互联网+、IoT、产业互联网、产业升级及数字化转型,专注业务流程、人工智能、超自动化与RPA,致力于探索IOT时代产业升级新机会,为企业经营和创业创新提供前沿技术、商业模式及方法论的解读与分享。目前重点观察与研究AIGC、AIAgent及超自动化在各行业的落地应用与创业创新。已撰写各类文章上千篇,作品见诸内容平台、学术网站及杂志。AIAgentDeepSeekAIAgent行AIAgent如AIAgent的AIAgent的=<>Agent2023年3月AutoGPT横空出世,7月OpenAI的翁丽莲发表名绍基于LLM的AIAgent,给出了AIAgent的理想技术架构。关于AIAgent(智能体)的概念很多,很多组织都给出了定义基于大语言模型的AIAgent推荐类Agent对话型Agent推荐类Agent对话型Agent…………2023年3月AutoGPT横空出世,7月OpenAI的翁丽莲发表名2023年3月AutoGPT横空出世,7月OpenAI的翁丽莲发表名绍基于LLM的AIAgent,给出了AIAgent的理想技术架构。大模型聚焦语言处理,以文本交互被动响应指令,应用于内容生成等场景;AIAgent以LLM为核心,具备多模态交互和自主执行能力,可完成跨场景复杂任务。还有很多人在问,AIAgent与大模型的区别。两者的区别,可以体现在以下几个方面:从单智能体到多智能体智能体的四种设计方式吴恩达教授提出的智能体设计方法有四种:反Collaboration多智能体协作正是其中之一。从这四种设计方式而言,现在的大语言模型尤其是推理模型能够反思、规划和进行简单的工具使用,都可以算是智能体。=<>DeepSeek等推理模型对AIAgent前面简单介绍最近两年AIAgent发展的基本路径。其实所有问题的原点,最终还要回到大模型上。LLMBasedAgent的能力与功能取决于LLM的性能,如果大模型能力足够强大,智能体也就能做到胜任更多业务场景。当然大模型足够强大了,可能也就不需要智能体了,这个涉及到了模型即应用,后面会讲。一言X1、混元T1这样的高质推理模型的出现,对AIAgent性能与功能的提升有着很大的赋能,这里总结了几点。•市场格局:DeepSeek的技术突破推动中国从AI规则接受者转变为标准共治者,其开源策略和国产化优势可能重塑全球AIAgent市场的竞争与合作模式。=<>Manus通用智能体带来的行业启示多代理协同架构:规划代理通过MCTS算法拆解任务为DAG结构,执行代理调用工具链完成操作,验证代理检测逻辑矛盾并核对数据源。模型调度与优化:整合Claude3.5、DeepSeek等模型,降低调用成本,支持高并发任务调度,任务执行准确率达98%。动态任务调度引擎:动态分配算力资源,支持边缘计算与云端协同,响应时间控制在50ms以内,记忆模块优化后续任务路径。安全与稳定支撑:采用联邦学习保障数据隐私,拦截恶意攻击,异常处理模块自动修正偏差,确保任务执行成功率。•Manus技术架构通过工具链整合优化而非底层模型创新,实现了从任务理解到结果交付的全链路自主执行,同时兼顾效率与成本优势。•从官方视频展示来看,Manus可以用于零售与电商、金融、教育与研究等领域的多种应用场景。我在书里介绍了智能体在多个领域的应用,在技术部分提到了相关技术架构,在智能体技术发展趋势和应用发展趋势方面也有介绍多智能体,可以帮助读者理解这种智能体。•Manus在工程化方面下了很大功夫,率先产品化了,能够一步到位给与用户想要的直接结果。可以给到普通用户更多智能体应用的感知和更好的体验,这是目前依托那些智能体平台构建的智能体尚未实现的,也是需要努力方向。Manus技术架构通过工具链整合优化而非底层模型创新,虽然大家对它的评价褒贬不一,但作为通用智能体还是为行业带来了不少的启示Manus的出圈也证明了能够自主执行相对复杂任务的智能体在现阶段是可行的,虽然需要耗费很多的token和时间。接下来肯定会有更多同类产品出现,也会进行更多优化与迭代。加上大语言模型快速发展,今年内这类智能体体验应该能有很大提升。=<>AIAgent行业现状1智能体应用现状51智能体应用现状5225.8%,反映了小型企业在资源有限下对AI43个人用户使用的AIAgent,主要依赖Coze、文心智能体等AIAgent构建平台上Agent或者使用一些厂商提供的开箱即用AIAgent成品,部分用户使用一些支持AIAgent的AI应用客户端,还有一部分懂技术的用户会在本地部署一套包括大模型在内的AIAgent系统,比如Dify、Ragflow等。lAI辅助放射学报告的生成将关键发现检测的准确性和速度提高了20%(NCBI,2018年)。lAIAgent自动执行89%的临床文档任务,显著提高医疗保健提供者的效率(NCBI,2023年)。l用于斑块检测的CT图像处理中的AIAgent达到97%的准确率,有助于心脏病的早期诊断(NCBI,2024年)。lAIAgent可以将初始简历筛选所花费的时间减少75%,使人力资源专业人员能够专注于战略计划(OdinAI,2024年)。l94%的人力资源专业人士认为,AIAgent通过识别最佳候选人来改进招聘流程(ScienceDirect,2023年)。l96%的人力资源领导者认为AIAgent可以提供个性化的学习和发展机会,培养一支更加敬业和熟练的员工队伍(Getodin.AI,2024年)。lAIAgent通过自动化日常任务和提高流程效率来帮助降低HR的运营成本,从而节省高达25%的成本(Getodin.AI,2024年)。l收入增长:69%使用AIAgent的零售商报告说,由于个性化和预测分析的改进,收入显着增长(Statista,2024年)。l降低成本:利用AIAgent提供客户服务的零售商的运营成本降低了72%(Salesforce,2024年)。l增加收入:69%使用AIAgent的零售商观察到年收入增加,其中一些报告增长了5%到15%不等(OdinAI,2024年)。l高达91%的财务专业人士对AIAgent持中立态度,专注于他们在欺诈预防、风险评估和简化财务流程方面的作用。l8%的人表示乐观,这凸显了AIAgent提供个性化客户体验并通过实时分析改进决策的能力。l82%的金融机构报告说,由于实施了AIAgent,运营成本降低了(OdinAI,2024年)。l客户体验增强:34%的金融机构利用AIAgent通过聊天机器人、虚拟助手和推荐系统改善客户体验(ScienceDirect,2024年)。l提高运营效率:43%的金融专业人士观察到使用AIAgent提高了运营效率(福布斯顾问,2024年)。l根据HSO的说法,AIAgent可以以95%的准确率预测设备故障,显着减少停机时间和维修成本高达40%。lAIAgent优化生产计划和调度,将生产吞吐量提高20-30%,并将库存和人员成本降低高达20%(OdinAI,2024年)。l分析实时数据流的AIAgent可以及早检测到异常,将报废和返工成本降低10-30%(OdinAI,2024年)。l实施AIAgent可以将工厂生产力提高多达50%,并将生产吞吐量提高20%(OdinAI,2024年)。lAIAgent将产品开发时间缩短了30-50%,从而提高了产品性能并降低了成本(OdinAI,2024年)。企业级解决方案企业级解决方案……AIAgent的产品及服务形态,主要有以下几种常见Agent产品包括聊天助手、编码助手、AI搜索等当前的AIAgent具有以下产品通性AI搜索、编码助手是比较成功的AIAgent产品,目前ChatGPT、Kimi、通义千问等基于大语言模型的聊天AI搜索、编码助手是比较成功的AIAgent产品,目前为用户提供企业级的AIAgent解决方案。当然企业软为用户提供企业级的AIAgent解决方案。当然企业软市面上的AIAgent大多基于特定知识库或数据构建,虽在问答交互方面表现出色,但在程序联动和操作方市面上的AIAgent大多基于特定知识库或数据构建,虽在问答交互方面表现出色,但在程序联动和操作方智能体构建平台产品,已经成为智能体应用构建与承载的中流砥柱。更多智能体平台面向开发者,普通用户想要构建想要的智能体还有门槛,当然用起来没有问题。Coze等智能体构建平台初步把智能体改造成了基于LLM的低代码平台,低代码平台也正在积极融合Agent技术升级为Agent构建平台。•Agent市场由主要科技公司和越来越多的初创公司主导,竞争环境激烈。•AIAgent市场正在显著扩展,主要受到自动化和效率需求的推动。•marketsandmarkets报告数据显示,该市场从2024年的51亿美元增长到预计2030年的471亿美元,复合年增长率为44.8%。•初创公司和细分市场参与者:CBInsights市场地图识别出超过170家初创公司,包括Harvey,该公司在2025年30亿美元估值融得3亿美元,专注于法律AI代理TheAI•其他值得注意的初创公司包括CrewAI(40%的财富500强企业使用其多代理协调功能)和ServiceNow(最近推出AIAgentOrchestrator,用于自定义代理部署)大公司的各种动作,最能彰显技术及市场动向。最近几个月科技巨头公司在AIAgent方面动作频频,有些公司已经取得了不错产品成果与市场进展。头部的大语言模型创业公司,也都在重点开拓AIAgent领域。大公司的各种动作,最能彰显技术及市场动向。最近几个月科技巨头公司在AIAgent方面动作频频,有些公司已经取得了不错产品成果与市场进展。头部的大语言模型创业公司,也都在重点开拓AIAgent领域。月之暗面……AIAgent全景图:随着更多AIAgent产品与解决方案的推出,越来越多涉足AIAgent的公司与创业团队浮出吹面,AIAgent的行业版图也在逐渐清晰。左边是NewEconomies绘制的6月份市场全景图,右边insightpartners给出的12月市场全景图。AIAgent全景图:随着更多AIAgent产品与解决方案的推出,越来越多涉足AIAgent的公司与创业团队浮出吹面,AIAgent的行业版图也在逐渐清晰。左边生态图谱来自甲子光年4月份报告,右边来自infoQ第二季度报告。智能体应势而生:单从AIAgent构建平台来说,5月份王吉伟频道盘点了全球80多个Agent构建平台,现在的数量已经远远超过这个数字,国内就已经有十数个。详见公众号文章《AI智•大语言模型(LLM)是AIAgent的核心,提供强大的自然语言处理能力,支持多语言和多领域任务。••大语言模型(LLM)是AIAgent的核心,提供强大的自然语言处理能力,支持多语言和多领域任务。•AIAgent具备多模态能力,整合图像、音频和视频处理,适用于智能家居、医疗诊断和内容创作。•AIAgent通过高级规划和推理技术进行自主决策,能够调用外部工具和API,扩展其功能。•AIAgent现可调用外部工具和API,如搜索引擎、数据库或软件接口,显著扩展其功能。•记忆和学习机制使其能够存储和检索信息,增强学习•AIAgent的架构通常包括感知、认知和行动三个组件,支持多种分类和多代理协作。GPT-4o、谷歌的Gemini2.0和Anthropic的CGemini2.0原生支持工具使用。这一特征使AIAgentAIAgent通常包括感知(输入处理)、认知(决策)和行动(任务执行组件。分类包括反应式Agent(即时响应)、基于模型的Agent(预和学习型Agent(自适应优化)。多代理系统(如OpenAISwarm)技术现状:AIAgent技术正朝着多个创新方向发展,以提升性能和用户体验。增强多模态交互未来将更好地处理视频、3D数据和触觉输入,应用于智能家居、医疗诊断和虚拟现实。例如,Meta的Llama3支持多模态输入,扩展了应用场景。提高自主性和可靠性增强多模态交互未来将更好地处理视频、3D数据和触觉输入,应用于智能家居、医疗诊断和虚拟现实。例如,Meta的Llama3支持多模态输入,扩展了应用场景。提高自主性和可靠性让AIAgent更独立,减少错误,专注于复杂任务的自校正和鲁棒性。例如,Anthropic的Claude3.5强调安全性和可靠性,适合企业关键任务。多Agent协作开发多代理系统,多个AIAgent合作完成共同目标,模拟人类团队协作。例如,OpenAI的Swarm平台支持多Agent协同优化供应链。边缘计算与端侧部署将AIAgent部署到智能手机、PC等边缘设备,提升隐私和响应速度。例如,苹果的Siri正在向端侧处理方向发展。可解释性和信任增强决策过程的透明度,开发解释性AI技术以构建用户信任。例如,IBM的ExplainableAI工具帮助用户理解Agent决策。个性化与适应根据用户偏好和行为调整AIAgent,提供定制化体验。例如,亚马逊的Alexa通过学习用户习惯优化交互。•提高自主性和可靠性:使AIAgent更独立,减少错误,专注于复杂任务的自校正和鲁棒性。例如,Anthropic的Claude3.5强调安全性和可靠性,适合企业关键任务。•多Agent协作:开发多代理系统,多个AIAgent合作完成共同目标,模拟人类团队协作。例如,OpenAI的Swarm平台支持多Agent协同优化供应链。•边缘计算与端侧部署:将AIAgent部署到智能手机、PC等边缘设备,提升隐私和响应速度。例如,苹果的Siri正在向端侧处理方向发展。•可解释性和信任:增强决策过程的透明度,开发解释性AI技术以构建用户信任。例如,IBM的ExplainableAI工具帮助用户理解Agent决策。•个性化与适应:根据用户偏好和行为调整AIAgent,提供定制化体验。例如,亚马逊的Alexa通过学习用户习惯优化交互。技术现状:这些当前的热门技术,可以多关注热门技术AIAgent技术栈:AIAgent技术发展到现在,技术生态基本已经成型,用于构建AIAgent的各种技术正在不断完善。左边是去年AuraVentures整理的市场全景,右边是Letta在今年11月推出最新技术栈统计。图源:AuraVentures《TheRiseofAutonomousAIAgents;DebundlingtheMarket图源:Letta《TheAIagentsstack》AIAgent技术生态图:把翁丽莲的AIAgent框架图用技术和企业进行具象化,可以看到下面这张由ActivantCapital绘制的技术供应商角度的AIAgent生态系统图。图源:activantcapital,详见图书第15.2.4节AIAgent技术进展:基于大语言模型的AIAgent技术,正在快速发展与迭代可用的大型语言模型一般用例特定实现可用的大型语言模型一般用例特定实现模型基础工具最终用户UI大语言模型发展前景图七种流行的RAG技术架构AIAgent技术进展:AIAgent技术框架不断推陈出新Jules技术框架/方案名称描述AIAgent开源项目与闭源项目:已经推出AIAgent技术框架、产品及解决方案的开源与闭源项目来源:e2bGithub仓库awesome-ai-agents问题与不足:虽然AIAgent已经逐渐在很多领域实现商用,受限于现阶段的技术、生态、用户接受度等因素,仍然存在一些问题和不足。程稳定性上存在随机输出和异常处理问题。安全性和隐私保护面临数据泄说明AIAgent遇到的系列行业问题,可以参考图书第11章:AIAgent行业应用挑战。及缺乏可重用的基础设施。碎片化的工具、集成问题和可扩展性问题使流程进一步图源:langbase《state-of-ai-agents》报告面临的挑战具体描述调研类场景容忍度较高。多任务场景下错误容面临的挑战具体描述调研类场景容忍度较高。多任务场景下错误容或高含知识任务时失败率高。单次生成结果议标准化作业(如MCP规范渗透性差)。览器与专业报表工具)。生产环境中模型易受对抗样本攻击(如利用FG•错误容忍度问题:在不同场景下的错误容忍度差异显著。例如在代码生成场景中错误容忍度极低(需专业程序员介入),而调研类场景容忍度较高。多任务场景下错误容易被累积放大,直接影响最终输出质量。•记忆与上下文管理瓶颈:大模型依赖上下文窗口提供历史信息模拟记忆,但超大上下文窗口性能不足(如模型处理长文本时表现下降)。RAG技术面临嵌入质量与召回准确率的挑战,难以实现有效记忆。•模型智能程度的限制:复杂场景下模型能力急剧下降,例如处理多文件代码或隐含知识任务时失败率高。单次生成结果的质量直接影响Agent整体表现,模型需更高精度。•自我评估能力的缺失:现有Agent缺乏结果自检能力,无法判断任务是否达到预期目标,需依赖外部反馈或人工干预。•工具集成与协调难题:工具调用成功率低(约50%失败率),且缺乏统一协议标准化(如MCP被质疑适配性差)。跨环境操作能力不足,Agent难以自由切换不同应用软件(如浏览器与专业报表工具)。•数据相关挑战:垂直领域样本稀缺,需依赖对比学习、元学习等技术,但数据合成成本高。多模态对齐困难,文本、图像、语音的异构性导致信息整合效率低。•鲁棒性与安全性风险:生产环境中模型易受对抗样本攻击(如利用FGSM算法生成的恶意输入),需引入验证机制降低风险。实时监控与热更新机制不足,难以应对数据分布偏移问题。面临的问题:模型即应用是挑战也是机会•现在有一个很明显的趋势:模型即应用(服务模型本身直接构成最终产品或服务,而非通过应用层(如API或第三方软件)二次开发。比如OpenAI的DeepResearch模型能够端到端自主完成研究报告生成,无需外部工具调用或人工干预,ClaudeSonnet3.7可直接完成复杂任务(如代码库管理)而非仅作为生成代码的工具,还有很多大模型推出的DeepResearch等功能。•这个趋势,可能会造成2个结果:一是API时代将被终结,大模型厂商(如OpenAI、DeepSeek)将停止对外提供API,转为直接提供模型作为产品,这个时间可能也就两年。二是应用商直接集成能力的功能淘汰。AIAgent-Agenticworkflow-AgenticAI:AIAgent向AgenticWorkflow的发展以及AgenticAI的兴起,正推动行业效率提升和数字化转型。这些技术改变了企业运营模式,改善了客户体验,并为决策支持和自动化服务带来革命性变化。同时,它们也延伸了应用价值链,改变了行业业态,尽管面临技术挑战,但为行业带来了前所未有的发展机遇。):的智能实体。它基于预设的目标或任务,在给定的环境中通过独立思考和调用工具逐步完成任务。AIAgent可以模拟人类对话,以自然且直观的方式与人类交互,并在多个领言模型(LLM)调用静态完成任务的工作流。在这个工作流中,AIAgent作为一个自主做出决策、采取行动、解决复杂问题,并在训练机器学习模型的数据之外与外部环境进=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 注册会计师考试的内容结构与试题及答案
- 微生物检测的新设备与应用试题及答案
- 全方位提升项目管理专业知识试题及答案
- 微生物检验的风险评估试题及答案
- 微生物检测的技术创新与挑战试题及答案
- 试题及答案:批判性思维与微生物
- 教校长课题申报书
- 注册会计师考试2025年应对财务舞弊的有效策略试题及答案
- 课题申报书序号格式
- 微生物检验中的仪器使用与能力要求试题及答案
- 2024年河南轻工职业学院单招职业适应性测试题库必考题
- 中医药行业数字化转型的机遇与挑战
- 工程塑胶材料采购合同(2篇)
- 新污染物环境风险评估:理论与制度构建
- 2025中考英语冲刺-传统文化诗词
- 金融科技学知到智慧树章节测试课后答案2024年秋重庆工商大学
- 2025届北京市朝阳区高三语文一模议论文“说托举”写作导引(5篇范文)
- 2025年中考数学压轴模拟试卷(含答案解析)
- 2025年四川荥经县国润排水有限责任公司招聘笔试参考题库含答案解析
- 宣传工作流程及管理规范
- 超尔星雅学习形势与政策(2025春)课程作业参考答案
评论
0/150
提交评论