人工智能-WAIC 2024国产AI+应用“百花齐放”

上传人：策*** IP属地：山西上传时间：2024-07-11 格式：DOCX 页数：25 大小：815.88KB 积分：19.9 举报 版权申诉

已阅读5页，还剩20页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1/16WAIC2024，国产AI+应用“百花齐放”oWAIC2024举办，多家厂商携大模型及AI应用成果亮相展会2024年7月4-7日，2024世界人工智能大会（WAIC2024）举办。本次大会重点围绕AI核心技术、智能终端、应用赋能三大板块，聚焦大模型、算力、机器人、自动驾驶等领域，集中展示了一批“人工智能+”创新应用成果。在大模型及行业应用领域方面，此次包含金山办公、科大讯飞在内的多家上市公司，以及百川智能、智谱AI等厂商均展示了生成式AI领域的最新成果。我们认为随着底层通用模型的持续迭代，以及各厂商在细分应用场景内的持续探索，AI应用生态有望加速构建。o以讯飞星火、华为盘古等大模型为底座，国产AI+行业应用生态日臻完善近期讯飞星火、华为盘古、商汤日日新等大模型迎来密集迭代，模型综合能力保持持续提升态势的同时多模态能力实现显著迭代。除大厂外，本次WAIC期间，阶跃星辰也发布了Step-2万亿参数语言大模型正式版，在数学、逻辑、知识等方面体感全面逼近GPT-4。国产AI大模型生态已渗透至医疗、教育、工业、智能驾驶等领域，商业空间有望加速打开。o国产大模型综合能力持续提升，OpenAI禁令有望推动国产AI生态加速成熟近期OpenAI宣布终止对中国提供服务，未来国内企业及个人用户将需要更多依赖国产AI大模型提供的能力和服务，有望推动国产AI生态加速成熟。从模型综合性能看，根据OpenCompass测评榜单，国产大模型持续缩小与海外GPT-4o、Claude3.5等大模型的性能差距，模型性能不断提升的同时有望加速在各细分应用场景的渗透。o建议关注标的AI基础设施：软通动力、海光信息、中科曙光、浪潮信息、寒武纪-U、云天励飞；AI大模型：科大讯飞、云从科技-U、百度-SW、商汤；AI行业应用：金山办公、汉王科技、星环科技、拓尔思、虹软科技、格灵深瞳、第四范式、焦点科技、万兴科技；o风险提示1、AI技术迭代不及预期的风险；2、AI商业化产品发布不及预期；3、政策不确定性带来的风险；4、下游市场不确定性带来的风险。2/16请务必阅读正 41.1多家国产厂商携大模型及行业应用成果亮相展会 41.2OpenAI禁令加速推动国产AI生态，国产大模型性能持续提升 4 62.1讯飞星火V4.0大模型，点亮教育、办公等行业生态 62.1.1科大讯飞发布星火V4.0大模型，全面对标GPT-4Turbo 62.1.2讯飞星火大模型加速教育、医疗等领域的应用落地 72.2华为发布盘古大模型5.0系列，持续赋能千行百业 2.2.1模型能力持续提升，并发布具身智能垂类大模型 2.2.2盘古5.0赋能华为小艺再次升级，丰富行业应用亮相本次WAIC 92.3商汤“日日新5o”模型亮相WAIC，多模态能力实现突破 2.3.1通用大模型快速迭代，首发toC可控人物视频生成模型Vimi 2.3.2行业应用：商汤绝影率先实现原生多模态大模型的车端部署 2.4阶跃星辰发布万亿级MoE模型，加速构建C端用户生态 3/16图表目录图1：讯飞星火V4.0模型核心能力对标GPT-4Turbo 6图2：星火V4.0模型多模态能力显著提升 6图3：星火医疗大模型各项指标优于GPT-4Turbo 6图4：星火4.0大模型教育场景能力对标GPT-4o 6图5：大模型赋能企业“人工智能+”行动的两种方式 7图6：星火赋能企业打造专属大模型 7图7：讯飞晓医可构建个人数字健康空间 7图8：科大讯飞发布星火智能批阅机 7图9：华为发布盘古5.0大模型 8图10：盘古大模型5.0三大能力全新升级 9图11：华为小艺能力全面升级图12：盘古大模型5.0重塑智能驾驶图14：商汤发布可控人物视频生成模型Vimi 图15：商汤绝影在行业率先实现原生多模态大模型的车端部署图16：商汤绝影车载端侧8B多模态模型性能行业领先图17：阶跃星辰发布Step-2万亿参数MoE语言大模型表1：WAIC2024参展厂商AI大模型及应用梳理（不完全） 4表2：OpenCompass大语言大模型评测月度榜单（2024年5月） 5表3：OpenCompass多模态大模型评测月度榜单（截止2024年6月26日） 54/16请务必阅读正2024年7月4日～7月7日，2024世界人工智能大会（WAIC2024）举办。本次大会重点围绕AI核心技术、智能终端、应用赋能三大板块，聚焦大模型、算力、机器人、自动驾驶等领域，集中展示了一批“人工智能+”创新应用成果。在大模型及行业应用领域方面，此次包含金山办公、科大讯飞在内的多家上市公司，以及百川智能、智谱AI等厂商均展示了生成式AI领域的最新成果。我们认为随着底层通用模型的持续迭代，以及各厂商在细分应用场景内的持续探索，AI应用生态有望加速构建。金山办公WPSAI2.0————————资料来源：中新网、东方财富、飞象网、金融界、新浪财经近期OpenAI宣布终止对中国提供服务，有望加速国产AI生态构建。6月25日凌晨，多个用户收到OpenAI通知，自今年7月9日起，OpenAI将开始阻止来自非支持国家和地区的API（应用程序接口）服务。目前OpenAI共支持161个国家和地区，不包括中国内地和中国香港。OpenAI向中国API用户表示，将采取措施，以阻止来自不再支持的国家和地区名单上的地区的API流量。国产大模型性能持续提升，多模态能力不断迭代下有望加速渗透各类应用场景。根据OpenCompass2.0大语言模型月度榜单（2024年5月）数据，目前国内外大语言模型在综合能力方面，OpenAI的GPT-4o以及GPT-4-Turbo仍处于领先地位，而国产大模型中豆包Pro-4k、千问Max、智谱GLM-4等模型均进入榜单前十名，在大语言模型能力方面国内厂商正在不断缩小与海外头部厂商的差距。5/16在多模态能力方面，目前OpenAI的GPT-4o以及Anthropic的Claude3.5模型能力优势明显，但是根据OpenCompass的月度测评榜单，近期国产大模型多模态能力持续提升，目前国内云从科技、智谱AI、阶跃星辰等厂商的多模态大模型也已进入前十序列，国产多模态模型保持快速迭代态势。结合本次WAIC各参展厂商的大模型及商业化产品，以及国产底层大模型能力的持续迭代，我们认为未来国产AI+行业应用有望加速迎来“百花齐放”局面，商业空间有望加速打开。6/162.1.1科大讯飞发布星火V4.0大模型，全面对标GPT-4Turbo2024年6月27日，科大讯飞正式发布基于全国产算力平台训练的星火大模型V4.0。星火V4.0大模型在文本生成、语言理解、知识问答等领域核心能力实现全面升级，除代码和多模态能力外，其它领域测评结果已全面对标GPT-4Turbo。星火V4.0模型多模态能力显著提升。在复杂版面的全要素解析、融合篇章语义的文字识别、专业领域的符号识别等能力上，星火大模型V4.0表现持续升级并且在测评中超过5月份发布的GPT-4o模型。星火4.0赋能行业大模型加速迭代，医疗、教育垂类模型能力再次升级。随着讯飞星火4.0大模型的发布，星火医疗大模型也再次升级，目前在医学相关的知识问答、复杂的语义理解、专业文书生成，还是诊断治疗以及多轮对话的各项指标上，已实现对最新的GPT-4Turbo模型的超越；而在教育领域，星火大模型面向教育复杂场景的图文识别效果进一步提升，在语文、数学、英语以及OCR识别方面均实现与GPT-4o的对标，7/16讯飞发布智能体平台，赋能企业构建岗位专属助手。科大讯飞发布的星火企业智能平台，并推出了首批32个企业从生产、科研、办公到管理中特别需要的相关智能体，如商机、销售、客服、科技情报以及编程等。讯飞星火的代码智能体可在代码生成、架构设计、问答、测试、数据库优化以及审核6个场景上赋能企业用户。代码在科大讯飞内部的采纳率从去年10月份的30%，增长至目前的52%，单元测试行覆盖率从30%提到50%。2.1.2讯飞星火大模型加速教育、医疗等领域的应用落地AI大模型医疗、教育领域垂类应用加速渗透。在医疗领域，公司于去年10月推出的个人健康助手讯飞晓医APP现在已经累计下载1200万次，用户好评率达98.8%。目前讯飞晓医APP可以帮助用户自主诊断1600种常见疾病，可识别2800种以上的常见药品，理解26万个药品相互作用，并且能够理解和分析6000种以上常见的检验报告。目前讯飞晓医APP可实现将个性化的电子病历检查报告以及过去问诊情况，在个人健康空间保存，在看病、用药、检查时给予用户更深入具体的帮助。在教育领域，星火渗透至教师批改阅卷场景，AI+教育产品应用矩阵进一步完善。伴随着星火大模型V4.0的发布，公司推出了星火智能批阅机的软硬件一体化解决方案，可进行自动批改，并通过批改自动分析全班学习情况，给出分析。根据公司给出的数据，星火智能8/16批阅机可将原来90分钟的作业批改时间缩短至5分钟，60分钟的学情统计时间可以缩短至1分钟，并且学生的错题解决率从50%提到73%。2.2.1模型能力持续提升，并发布具身智能垂类大模型2024年6月21日，在华为开发者大会2024（HDC2024）上，华为正式发布盘古大模型5.0版本。盘古大模型5.0系列在全系列、多模态、强思维三个方面进行了全面升级，标志着华为云在人工智能领域再次迈出了坚实的步伐。在模型全系列方面，盘古大模型5.0包括十亿级、百亿级、千亿级、万亿级等不同参数规模，提供盘古自然语言大模型、多模态大模型、视觉大模型、预测大模型、科学计算大模型等。其中：（1）盘古E系列：10亿参数级别，可支撑手机、PC等端侧的智能应用；（2）盘古P系列：100亿参数级别，适用于低时延、低成本的推理场景；（3）盘古U系列：有1350亿参数和2300亿参数两种，适用于处理复杂任务，可以成为企业通用大模型的底座；（4）盘古S系列：万亿级参数，可以处理跨领域多任务，够能帮助企业更好地在全场景应用AI技术。华为云发布具身智能大模型，推动人形机器人技术再升级。华为云在HDC2024上正式推出了盘古具身智能大模型，会上搭载盘古能力的人形机器人也同步亮相。盘古大模型能够让机器人完成10步以上的复杂任务规划，并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频，让机器人更快地学习各种复杂场景。大模型的多模态能力以及思维能力的快速提升，使机器人能够模拟人类常识进行逻辑推理，并在现实环境中高效精准地执行任务，从而有效解决了复杂环境感知与物理空间认知的难题。通过集成多场景泛化和多任务处理能力，盘古大模型有望赋予机器人适应性和灵活性，灵活面对工业环境还是家庭生活场景。9/162.2.2盘古5.0赋能华为小艺再次升级，丰富行业应用亮相本次WAIC在盘古大模型5.0加持下，华为推出了全新的小艺助手并且更加智能化，更加流畅，同时也变得更加地人性化。华为小艺能够根据外面的天气情况制定用户的个人出行方式，而且能通过不断地学习，变得更加适合用户使用习惯。除此之外，华为云盘古大模型过去一年中，已在30多个行业、400多个场景中落地，覆盖到政务、金融、制造、医药研发、煤矿、钢铁等多个细分行业。10/16盘古大模型5.0亮相WAIC2024，持续重塑千行万业。在自动驾驶领域，盘古大模型5.0通过创新的可控时空生成技术，结合场景视频生成、4DBEV视频生成、自动驾驶仿真库及路网信息，能更好地理解物理规律，大规模生成和实际场景相一致的驾驶视频数据，还可以灵活增加控制条件，生成不同路况、不同光照、不同天气的训练视频数据，加速自动驾驶技术的快速成熟。在钢铁领域，盘古大模型能够对热轧生产线的最优参数进行预测。在切换钢板生产规格时，操作工人往往需要对模型参数进行调整优化，盘古大模型可实现此过程耗时由一周时间缩短至仅4小时，提效显著。在实际生产中，在上海宝武钢铁热轧生产线中，基于盘古大模型，精轧宽展预测精度较传统模型提高5%以上，钢板成材率提升0.5%，预计每年可以多产钢板2万余吨，年收益达9000余万元。未来盘古大模型还将应用于高炉场景，对炉温、铁水温度等炉况进行仿真，从而辅助高炉精准控制，降低能源成本。在铁路领域，高铁巡检机器人搭载盘古大模型后，可精准识别动车零部件的变形、异物、松动、丢失等3.2万个故障检测项点，覆盖8大类、350多种复杂故障，不仅提升高铁运营效率、降低巡检成本，而且减少凌晨时段人工巡检的作业负担。在媒体内容生产和应用领域，盘古大模型能够将实拍视频快速转换成特定风格的动漫，并保持角色样貌特征前后一致，舞蹈、武打等大运动轨迹也能确保合理一致的视觉效果，制作周期从月级缩短到天级，大大提升制作效率，作品一次拍摄多元化制作，实现价值最大化。2.3.1通用大模型快速迭代，首发toC可控人物视频生成模型Vimi商汤于WAIC2024发布“日日新5o”模型，交互体验对标GPT-4o，有望实现全新AI交互模式。商汤通过整合跨模态信息，基于声音、文本、图像和视频等多种形式，国内首个所见即所得模型“日日新5o”带来一种全新的AI交互模式，即实时的流式多模态交互。商汤底层通用基础大模型迭代至“日日新5.5”，基础大模型综合性能较“日日新5.0”平均提升30%，在数学推理、英文能力和指令跟随等能力明显增强，交互效果和多项核心指标实现对标GPT-4o。“日日新5.5”采用混合端云协同专家架构，最大限度发挥云边端协同，降低推理成本，模型训练基于超过10TBtokens高质量训练数据，包括大量合成的思维链数据，提升推理思维能力。商汤加速推进B端用户生态构建。为了让更多企业用户低门槛接入并使用“日日新”大模型体系的强大能力，商汤于近期推出了“大模型0元Go”计划。凡是“日日新”的新注册用户，都可获得涉及调用、迁徙、训练等多项免费服务大礼包。同时，商汤还将免费赠送5000万Tokens包，并且派出专属搬家顾问，帮助OpenAI用户实现零服务成本迁移。公司推出首个面向C端用户的可控人物视频生成大模型Vimi。Vimi基于商汤日日新大模型的能力，仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频，并支持多种驱动方式，可通过已有人物视频、动画、声音、文字等多种元素进行驱动。据商汤介绍，与图片表情控制类技术只能控制头部表情动作不同，Vimi不但可以实现精准的人物表情控制，还可实现在半身区域内控制照片中人物的自然肢体变化，并自动生成与人物相符的头发、服饰及背景变化。同时光影变化也能做到合理生成，让人物动作和视觉效果流畅自然，画面和谐唯美。更重要的是，Vimi具备极强的稳定性，可稳定生成长达112/16分钟的单镜头人物类视频，画面效果不会随着时间的变化而劣化或失真，真正满足娱乐互动等需要长时间稳定视频生成需求。2.3.2行业应用：商汤绝影率先实现原生多模态大模型的车端部署本届WAIC大会上，商汤发布基于全新发布的商汤“日日新5.5”原生多模态大模型打造的智能驾驶和智能座舱产品。商汤绝影展示了可解释、可交互的自动驾驶大模型DriveAGI，同时还发布了行业首个车载生成式交互界面“随心界面”（FlexInterface）、“随意操控”（AgentFlow）等车载AIAgent应用。在本届WAIC上，商汤绝影在行业率先实现原生多模态大模型的车端部署，并对外展示了在3个不同算力平台上运行2.1B或8B端侧多模态大模型的适配能力。商汤绝影车载端侧8B多模态模型可以实现首包延迟低至300毫秒以内，推理速度达到40Tokens/秒。而商汤绝影自研的首个应用于驾驶决策规划的智驾大模型——DriveAGI，增强了端到端系统的可解释性，不仅让车辆能够更像人一样理解复杂的现实世界，洞察各类交通参与者的行为动机，快速学习各种交通规则，掌握瞬息万变的道路信息，还能向用户解释驾驶决策的推理过程。目前，商汤绝影DriveAGI智驾大模型能在无限宽标识的道路上，安全顺利穿过两个石墩形成的狭窄通道；它还能准确辨识并理解包括公交车道、潮汐车道及施工车道等各类交通标识，并自主进行变道或规避，甚至当后方有救护车接近时，DriveAGI会进行思考推理，最终进行及时变道避让。13/16在本届WAIC上，商汤绝影正式发布行业首个生成式交互界面产品“随心界面”彻底改变用户与车载系统的交互方式。FlexInterface在大模型解析用户需求的基础上，结合设计系统的框架和范式，实现高度动态和个性化的界面生成。无论是天气、时间、节日、纪念日，还是周围环境变化，FlexInterface均能自动变换界面风格，提供最佳用户体验。AgentFlow通过大模型的推理能力，模拟人类点击操作，实现对APP和网站的直接操作。用户只需使用自然语言，就能让AI自主选择多个工具完成复杂任务，无需主机厂进行额外的研发适配。这种能力不仅提升了操作的便捷性，还极大地扩展了车载系统的功能范围。在现场演示中，用户通过FlexInterface生成了一个“欧洲杯”风格的主题，大模型自动生成具备欧洲杯元素的中控屏幕桌面和图标，同时，用户还能通过AgentFlow随时播放欧洲杯或足球相关的音乐，展示了这些创新产品在实际应用中的强大能力和灵活性。本次WAIC2024上，阶跃星辰发布三款Step系列通用大模型产品，分别是Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型。公司最新发布的Step-2万亿参数语言大模型正式版，采用了创新的MoE混合专家模型架构。同时，基于阶跃星辰行业领先的系统能力，Step-2大幅提升了训练效率，在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面逼近GPT-4，企业和开发者可以通过阶跃星辰开放平台申请体验。14/16新升级的Step-1.5V千亿参数多模态大模型，在图像感知和理解能力上全面提升，并具备出色的视频理解能力。模型能准确地识别视频中的物体、人物和环境，并理解视频的整体氛围与人物情绪。在Step-2万亿参数大模型的加持下，Step-1.5V推理能力大幅增强，能根据图像内容进行解答数学题、编写代码、创作诗歌等高级推理任务，体现出公司在多模态大模型领域取得了突破性进展。公司新发布Step-1X图像生成大模型，则代表了阶跃星辰在推动多模态理解和生成统一的技术路线上取得重要进展。Step-1X模型采用全链路自研的DiT（DiffusionModelswithtransformer）模型架构，支持600M、2B、8B三种不同的参数量，能够满足不同场景的需求。Step-1X具备更加强大的语义对齐和指令跟随能力，还针对中国元素和文化进行了深度优化使其更具中国风格。公司加快垂类行业生态建设，在金融行业领域与券商形成深度合作。近日阶跃星辰智能科技有限公司、上海财跃星辰智能科技有限公司和国泰君安证券，签署三方战略合作协议，将在拓展智能化应用场景、丰富金融语料数据、构建国产信创算力集群、互联网业务运营、产业投融资、财富管理和产业研究等十大领域展开深度合作，三方将联手在模型、信创算力、金融语料、应用场景等方面努力推动大模型应用加速落地。另外，公司与国泰君安共同研发的君弘灵犀大模型已经上线，作为业内首家千亿级参数多模态证券垂直类大模型，其应用场景涵盖君弘智投、综合诊断、智能选股、热点资讯、多模态处理等十大功能，致力于解决传统模型在语义理解、多轮对话和答案丰富性上存在的运营成本高、投资服务匹配度低等问题。15/16AI基础设施：软通动力、海光信息、中科曙光、浪潮信息、寒武纪-U、云天励飞；AI大模型：科大讯飞、云从科技-U、百度-SW、商汤；AI行业应用：金山办公、汉王科技、星环科技、拓尔思、虹软科技、格灵深瞳、第四范式、焦点科技、万兴科技；1、AI技术迭代不及预期的风险；2、AI商业化产品发布不及预期；3、政策不确定性带来的风险；4、下游市场不确定性带来的风险。16/16股票投资评级说明以报告日后的6个月内，证券相对于沪深300指数的涨跌幅为标准，定义如下：1.买入：相对于沪深300指数表现＋20％以上；2.增持：相对于沪深300指数表

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能-WAIC 2024国产AI+应用“百花齐放”

文档简介

温馨提示

最新文档

评论

人工智能-WAIC 2024国产AI+应用“百花齐放”

文档简介

温馨提示

最新文档

评论

相关文档