




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机/计算机/行业专题报告/2024.12.01“AI操作系统”时代已至投资评级投资评级:看好(维持)Agent由于其C端入口特性,有望成为首个“爆款”AI应用。当前市场中长期缺乏“爆款”AI应用,我们认为主要系C端大众对AI的感知度仍然较低,尽管有大量可下载、可付费的AI应用存在,但从广大用户体验来讲,各类AI软件对其生活重塑的边际变化不大。而近期,包括手机端苹果、荣耀、Vivo等,以及PC端联想等厂商上新操作系统级Agent作为新的人机交互形态,以端侧入口形式首次深入群众,令其“被迫”体验接受新的操作范式,有望打造首个“爆款”AI1.《智驾月报:10月车市环比向好,文远知行上市》2024-11-182.《计算机行业2025年投资策略:多维共振,精彩纷呈》2024-11-173.《外政预紧,内需预旺,国产科技迎腾飞机遇》2024-11-10Agent能力。智谱的Agent能力主要来源于其底层大模型的训练与迭代:CogAgent是18B参数的视觉语言模型(VLM专门用于GUI理解和导航,基于视觉语言模型CogVLM并结合高分辨率交叉模块,实现了高效GUI推理;AutoWebGLM通过简化HTML增强网页阅读能力,添加人类与AI混合方法构建的网络浏览数据集进行微调,大幅提升大语言模型的Agent1.《智驾月报:10月车市环比向好,文远知行上市》2024-11-182.《计算机行业2025年投资策略:多维共振,精彩纷呈》2024-11-173.《外政预紧,内需预旺,国产科技迎腾飞机遇》2024-11-10GLM-Phone:可实现跨APP操作、支持超长任务流程、支持更多主流APP,针对手机端应用提供了新的解决方案,显著扩展了其在手机端的应用场景和操作能力2)GLM-PC:办公领域将迎来生产力跃升,GLM-PC可实现会议替身、文档处理、网页搜索与总结、远程和定时操作等3)GLM-Car&More:Agent为AI终极形态,加速万物智能、万物互联,未来Agent有望渗透至各类智能设备,落地AI原生设备,实现设备主动服务用户。投资建议:见正文。风险提示:技术迭代不及预期;商业化落地不及预期;政策支持不及预期;全球宏观经济风险。谨请参阅尾页重要声明及财通证券股票和行业评级标准2 4 6 6 82.3AutoGLM:图形用户界面的自主基础Agent,可用于网页浏览与安卓手机操作 4 5 6 7 8 9 9 谨请参阅尾页重要声明及财通证券股票和行业评级标准3 谨请参阅尾页重要声明及财通证券股票和行业评级标准41AI+OS,操作系统级Agent开启人机交互革命并利用工具自主执行动作的智能化应用,其包括规划、记忆、工具、行动四大核众多细分行业的应用智能化与流程自动化,包括办公、金融、医疗、法律、教育、创意设计等。不过其中一些非交互性、高度流程化的应用功能,也存当前市场中长期缺乏“爆款”AI应用,我们认为主要系C端大众对AI的感知度谨请参阅尾页重要声明及财通证券股票和行业评级标准5十个网站的无人驾驶;GLM-PC启动内的技术探索,涵盖会议代理、文档处理、网页搜索与总结、远程及定时操作、隐作电脑,目前仍处于测试阶段,而当前智谱已实现了Agent技术似,存在环境的反馈监督,以及随着推理训练时间的增加,模型能力也显著用、短距离的任务复杂度,但当计算量突破一定程度模型突然能够实现跨应用长距离的复杂任务,同时还能在从未训练过的环境执行命令,泛化能力显数据来源:智谱清言官方发布会,财通证券研将会成为全新生产力工具,汽车+AI将会让车成为人们的智能第三生活空间,大Agent技术不仅在操作系统和应用层面引领用户体验的革新,更将这一变革延伸谨请参阅尾页重要声明及财通证券股票和行业评级标准6数据来源:智谱清言官方发布会,财通证券研2建立交互数据集,深耕Post-Training,获得“从Chat走向Act”通用Agent能力受1120×1120的高分辨率图像输入,使其能够识别微小的页面元素和文本。CogAgent是基于预训练的VLM(理高分辨率输入。添加该模块主要是因为高分辨率图像会导致极大的计算时长和内存开销:视觉语言模型通常将文本和图像特征序列连接起来作为输入提供给解图像能够有效地描绘大多数物体和布局,然而在清晰呈现文字方面有分辨率模块强调与文本相关的特征,对于理解图形用户界面至关重要。因此,该谨请参阅尾页重要声明及财通证券股票和行业评级标准7分辨率图像中各种大小、方向和字体的文本能力,数据包括来自语言预训练数据员以问答的形式标注了屏幕元素、潜在任务和操作方法。同时还利用Mind2Web谨请参阅尾页重要声明及财通证券股票和行业评级标准8CogAgent作为一个通用的视觉语言模型,在众多视觉问答基准与富含文本的视觉问答基准测试当中都表现优异,尤其相比通用模型有明显得分优势,与微调专业模型相比也属于领先梯队。此外,CogAgent在PC和然后由自动化浏览程序执行这些决策。该模型有几大创新点解决了传统LLM的谨请参阅尾页重要声明及财通证券股票和行业评级标准9页上操作的通用性:鉴于人工成本高昂以及当前大模型在自动数据生成的不足,作者在网页识别、简单任务操作、复杂任务操作构建方面都采用了人机混合的方法,人工筛选网站并构建网页操作类型分割,大模型辅助生成任务和操作意图。输出与正确答案相结合,构建具有正负对的对比数据,让模型通过认识自己的错误进行强化学习;拒绝采样微调采用监督学习模型来生成推理路径,奖励模型会收集准确并拒绝错误的路径,随后将其用作扩充的微调数据集。谨请参阅尾页重要声明及财通证券股票和行业评级标准10键。数据集构建分为两个主要阶段,第一阶段是网页识别任务和简单任务操作构任务操作数据集的主要目标是训练模型执行单步网络操作。这包括在网页上执行基本功能,如点击链接、填写表单或导航到特定部分。l通过复杂网络任务开发数据集,使模型能够在网络浏览场理。数据集中的每个样本都包含复杂网络浏览任务、完成该任务的操作序列以及每一步的意图。通过浏览器插件,利用人工标注来捕获网页任务执行情(中文-英文)基准AutoWebBench,并评估了谨请参阅尾页重要声明及财通证券股票和行业评级标准11据集当中缺乏决策数据,互联网包含大量的静态人类知识,无法充分捕捉人类决现实世界环境的直接交互,要么通过从合成轨迹中学习。户交付的可部署的Agent系统。其中包括了两个创新的设计:如点餐、打车、查询信息并发布等常见场景下取得较高成功率,加速Agent进入谨请参阅尾页重要声明及财通证券股票和行业评级标准12图10.通过AutoGLM在美团App上“点一杯半糖瑞幸热椰奶拿铁”谨请参阅尾页重要声明及财通证券股票和行业评级标准133GLM多端Agent家族,打造手机、PC、汽车等终端交互入口的解决方案,显著扩展了其在手机端的应用场景和操作能力,标志着智能手机人机交互进入了一个全新的高度。通过在淘宝进行产品复购的案例,表明前版本的谨请参阅尾页重要声明及财通证券股票和行业评级标准14之间筛选价格更实惠的肯德基套餐并下单购买,表明在已有功能的基础上,升级在“打开美团选择肯德基并下单全家桶—切换饿了么搜索商品—对比价格后订单”等任务中,达成多个平台间的的数据传递和智能化决策,而无需用户手动干预,等平台外,新增了抖音、微博、饿了么、京东、拼多多等更多主流平台。这意味频娱乐和外卖服务,提供了一站式的操作体验。文本、图片等)进行理解并提取关键信息,且能够根据所得信息,通过逻辑规划和动态交互完成任务规划,并分步骤拆解及逐一完成,在此过程中实现了不同阶段的数据传递,能够在短时间内快速完成复杂任务。谨请参阅尾页重要声明及财通证券股票和行业评级标准15群聊并识别群用户板块,逐个循环进行首条朋友圈动态点赞(指进入-点赞-退出-情景,满足自动化处理高频重复操作的需求,减少用户的谨请参阅尾页重要声明及财通证券股票和行业评级标准16),时执行任务)等。GLM-PC是能够帮助用户操作文字等,并自动操作电脑。例如在会议替身场景下,用户发布指令“加入这个飞能够大幅提升用户办公效率,有望成为未来桌面端的必备数据来源:智谱官方微信公众号,财通证券研数据来源:智谱官方微信公众号,财通证券研谨请参阅尾页重要声明及财通证券股票和行业评级标准17数据来源:智谱官方微信公众号,财通证券研数据来源:智谱官方微信公众号,财通证券研谨请参阅尾页重要声明及财通证券股票和行业评级标准18单的文字指令让其搜索特定网页、查找商品或总结文章内容,对百度、微博、知乎、Github等数十个网站实现自动操作。这体现了WebAgent在提升用户体验、谨请参阅尾页重要声明及财通证券股票和行业评级标准19智能语音助手,可通过简单的语音指令激活,对调节车内环境、设置导航、播放音乐、查询天气等要求迅速响应并精准执行,全面提户。通过全域数据的快速整合与深度洞察,Agent将具备快速处理复杂任务的能间的推移逐步学习用户的需求与偏好,从而提供更加个性化的服务,真正做到与图24.智谱与小鹏合作的“AI小P”谨请参阅尾页重要声明及财通证券股票和行业评级标准20数据来源:智谱清言官方发布会,财通证券研4投资建议Agent在PC端实现落地,办公领域AI软件有望加速推广,办公软件厂路,以及其他智能终端包括扫地机、割草机等有望受益,建议关注联想集团、传音
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼师能力测试题及答案
- 文化产业管理证书考试的心理准备试题与答案
- 卫生管理健康服务资源分配试题及答案
- 2024年激光技术工程师考试须知试题及答案
- 文化产业管理考试的综合考察方式分析试题及答案
- 2024文化产业管理疾风突击试题及答案
- 文化产业管理证书试题解析技巧
- 铅笔穿新衣(教学设计)-2024-2025学年赣美版(2024)美术一年级上册
- 注意事项税务师试题及答案
- 准备2024年专利代理人资格考试的有效方法试题及答案
- 人教版七年级英语下册 Unit5 Here and Now(上课、复习课件)
- 智能交通系统在城市管理中的应用与前景
- 果园种植管理合作合同范本
- 2025年江苏省高职单招《英语》高频必练考试题库400题(含答案)
- 电力检修安全培训
- 八年级数学下册 第2章 单元综合测试卷(湘教版 2025年春)
- 劳务外包服务投标方案(技术标)
- 2025年南阳农业职业学院高职单招职业适应性测试近5年常考版参考题库含答案解析
- 自动准同期装置技术规范书
- 【MOOC期末】《创新创业与管理基础》(东南大学)中国大学慕课答案
- 《中医体重管理临床指南》
评论
0/150
提交评论