2023年AIGC策略分析报告 AIGC商业模式、应用场景及市场趋势介绍_第1页
2023年AIGC策略分析报告 AIGC商业模式、应用场景及市场趋势介绍_第2页
2023年AIGC策略分析报告 AIGC商业模式、应用场景及市场趋势介绍_第3页
2023年AIGC策略分析报告 AIGC商业模式、应用场景及市场趋势介绍_第4页
2023年AIGC策略分析报告 AIGC商业模式、应用场景及市场趋势介绍_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023年AIGC策略分析报告AIGC商业模式、应用场景及市场趋势介绍一、AIGC行业梳理(一)AIGC的概念与内涵2022年是AIGC爆火出圈的一年,随着AI作画风行一时,chatGPT刷爆网络,不仅消费者竞相追捧AIGC,投资界也积极关注,还被全球各大科技企业竞相追逐。据中国信通院AIGC白皮书定义,AIGC(Al-GeneratedContent)即人工智能生产内容,可用于代码生成、文本问答、图像生成等,既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合。AIGC技术能力根据面向对象、实现功能的不同可分为三个层次:智能数字内容孪生(可分为智能增强技术和智能转译技术)、智能数字内容编辑、智能数字内容创作。根据Gartner测算,当前生成式人工智能占所有数据产量不到1%,其生成数据渗透率有广阔提升空间,预计至2025年将上升至10%。(二)AIGC的发展流程据甲子光年智库分析,人工智能主要包括六大学科,当下业界讨论往往聚焦机器学习这一学科,其在各种领域都具有广泛的应用前景,包括自然语言处理、计算机视觉、电子商务等等。人工智能算法的不断迭代是AIGC发展进步的源动力,诸多AI技术累计融合,尤其是深度学习模型方面的技术创新,催生了AIGC的技术变革,使AI工程化门槛不断降低,有望重新定义生产力。基础的生成算法模型不断突破创新,Transformer、扩散模型等深度学习的生成算法相继涌现;预训练模型(PLM)引发了AIGC技术能力的质变,2018年以来,预训练语言模型及其”预训练-微调”方法已成为自然语言处理(NLP)任务的主流范式,规模越大的模型不仅在已知任务上有着更好的表现,同时展现出完成更复杂的未知任务的强大泛化能力;多模态技术推动了AIGC的内容多样性,让其具有了更通用的能力。据创新工场定义,AI发展周期可以划分为以下两个阶段:AI的1.0时代(2012年-2018年):主导逻辑是大数据、小算力、专用决策范式。存在单领域、多模型的限制,数据集、模型碎片化明显、AI泛化能力不足,大多数行业需要花费巨大成本来收集和标注数据以利用AI,从而导致规模不经济。AI1.0缺乏规模化能力来降低应用开发的门槛,打造完善生态链,因此商业化价值较小。AI的2.0时代(2017年至今):预训练大模型在无需人工标注的海量数据的学习训练后具有良好的通用性和泛化性,通过微调等方式适配和执行五花八门的任务,能显著降低AI工程化门槛,让其成为自动化内容生产的“工厂”和“流水线”。GPT-3的出现让大数据、大算力和通用范式成为典型模式,AIGC模型有望逐步达到具有预测、决策、探索等更高的认知智能,真正有望实现平台化的效应,进而探索商业化的应用创新机会。未来文本、图片、语音、代码等场景将逐步走向成熟,将助推技术向多模态融合发展,五大方向路径分别为:文本到文本AIGC,如大型语言模型聊天机器人ChatGPT;文本到图像AIGC,如谷歌推出的文本到图像的扩散模型Imagen;文本到3DAIGC,如谷歌推出的DreamFusion可以根据给定的文本创建3D模型;音频相关AIGC,如MurfAI推出的人类语音生成器;图像到图像AIGC,如PreferredNetworks推出的Crypko可以创作上半身动漫形象。(三)AIGC的产业分布AI的七大关键能力为感知、认知、决策、学习、执行、社会协作能力以及符合人类情感、伦理与道德观念,这些能力在进化中逐步扩展累积,逐步“解放大脑”。AIGC的本质是内容与场景的融合,其发展需要AI模型、基础设施、上层应用的相互配合,后端基建,算法、算据和算力三要素耦合共振。AI全栈技术架构分为三个层级:算力层、平台层和算法层,其中,算法层包括应用层、中间层和基础层或模型层中间层可向下对接大模型能力,向上提供个性化服务,由一批专门负责调整大型模型以适应具体应用需求的初创企业构成。而基础大模型将逐步走向统一,形成寡头格局,开发人员将基于这些基础模型研发AI应用。目前,AIGC产业生态加速形成和发展,产业链呈现为上中下三层架构,包括上游基础层、中间技术层、下游应用层三个层级。基础层由于预训练模型的高成本和技术投入,因此具有较高的进入门槛,主要参与机构为头部科技企业、科研机构等;中间技术层使模型即服务(MaaS)开始成为现实,预计将对商业领域产生巨大影响;应用层旨在无缝衔接AICG模型和用户需求,以实现产业落地。二、AIGC商业模式(一)ChatGPT引入Plugins,大幅拓展应用能力OpenAI于3月24日发布ChatGPT,即ChatGPT插件集,插件是专门为以安全为核心原则的语言模型设计的工具,可以帮助ChatGPT访问最新信息、运行计算或使用第三方服务。从OpenAI的等待列表中被邀请的插件开发人员可以为ChatGPT构建一个插件,如由Expedia、FiscalNote和Instacart等创建的第三方插件,普通用户可以选择自己需要的插件使用。OpenAI专门为chatGPT开发了两大插件:网络浏览器(Browsing)和代码解析器(Codeinterpreter)。Plugins引入后,ChatGPT的应用能力将得到极大的扩展,进一步催化至多场景的业务处理能力。开发者想从一小部分用户开始,基于此了解更多信息,逐步推出更大规模的访问,以塑造人机交互范式未来的社区。Browsing实现了ChatGPT的联网能力,可以读取互联网上的最新信息;Codeinterpreter则实现了用Python代码去解决定性或定量的数学问题,进行数据分析,以及格式转换等。当前,插件还在alpha期间,OpenAI将与用户和开发人员密切合作,对插件系统进行迭代。插件可以成为语言模型的“眼睛和耳朵”,使它们能够访问非常近期、非常个人或者非常具体而不能包含在训练数据中的信息。在响应用户的明确请求时,插件还可以使语言模型代表用户执行安全的、有约束的操作,从而提高系统的整体有用性。引入插件后的chatGPT影响力将显著提升,生态规模极速扩大,应用层百花齐放。插件的价值可能远远超出现有的限制,从浏览产品目录到预订航班或订购食品,帮助用户使用各种新的用例。OpenAI认为,插件可能会产生广泛的社会影响,他们发现使用工具的语言模型可能会比没有工具的语言模型产生更大的经济影响,并预计当前的人工智能技术浪潮将对工作转换、取代和创造的速度产生重大影响。(二)开启API收费服务,与微软深度合作,OpenAI商业化进一步推进2023年3月1日,OpenAI宣布以收费形式开放ChatGPTAPI和WhisperAPI(应用程序接口),允许外部公司开发者将ChatGPT集成至他们的应用程序和服务中。宣布之时共有5家公司接入ChatGPTAPI,分别是Snapchat母公司Snaplnc、全球学习平台Quizlet、日用百货配送公司Instacart、消费者购物软件shop的开发商Shopify以及教育软件Speak的开发商。OpenAI根据API调用的token(分词)输入和输出总数计费,同时token总数还需低于模型最大限制。新发布的ChatGPT模型其API收费标准为0.002美元/1000tokens,与前一代使用模型相同,但比现有的GPT-3.5模型价格便宜了90%。WhisperAPI是一种语音转换文字(speechtotext)模型,可以转写或翻译语音,支持包括英语、中文、阿拉伯语和日语等几十种语言,现在通过该API提供了large-v2模型,WhisperAPI的使用费用为每分钟0.006美元。在订阅渠道,2023年2月1日,OpenAl宣布,推出其人工智能聊天机器人ChatGPT的订阅版本ChatGPTplus,每月收费20美元,订阅用户即使在高峰时段ChatGPT也可以正常访问,有更快的响应时间,还可以优先访问新功能。同时OpenAl也继续提供ChatGPT的免费访问。OpenAI已同意将GPT-3授权给微软用于他们自己的产品和服务。微软作为OpenAI最为重要的合作伙伴和投资人,其旗下产品与OpenAI的相关模型深度融合,在微软的消费者和企业产品中引入新的体验。如搜索引擎结合GPT4的技术,企业服务平台Dynamic365结合ChatGPT的技术推出Dynamics365Copilot,开发者工具PowerPlatform结合ChatGPT技术推出PowerVirtualAgents和AIBuilder。微软产品在融合了OpenAI技术后展现出了更优秀的产品性能和市场竞争力,而OpenAI将利用微软Azure云计算服务提供的算力,以更快地实现AI的突破。微软投资OpenAl扩展合作伙伴关系,一方面为了加强AZure竞争力来对抗云计算领域的巨头亚马逊,另一方面,微软正式推出由ChatGPT支持的最新版本Bing(必应)搜索引擎和Edge浏览器,直接挑战了谷歌的搜索引擎巨头地位。三、AIGC应用场景基于软件服务、云服务、硬件基础设施等产品形式,结合消费、制造业、互联网、金融、元宇宙与数字孪生等各类应用场景,人工智能赋能产业发展已成为主流趋势。根据艾瑞咨询统计,2022年,人工智能产学研界在通用大模型、行业大模型等促进技术通用性和效率化生产的方向上取得了一定突破。商业价值塑造、通用性提升和效率化应用是AI产业发展战略方向,人工智能将参与到社会建设的千行百业中来。目前,AIGC已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化,如数据科学、医疗、游戏、艺术等。除应用场景的横向扩展外,场景与场景的融合交互也是未来的发展趋势之一,例如“文旅+游戏”、“商业+艺术”等。根据红杉资本对市场格局的分类,AIGC按不同细分方向应用可分为:文本领域。是发展最完备的领域,目前在通用的中、短篇写作方面表现还算不错,但通常只被用来生成初稿或对初稿做迭代完善。随时间推移,有望看到更高质量及更长篇的内容,并且针对各垂直领域有特定的优化。代码生成。如GitHubCoPilot,它能极大提高程序开发者的生产力,也能助力非专业人员编写代码。图像领域。其应用爆发是新近之事,因为相较文字图像是社交媒体上更受欢迎的分享方式。市面上出现了很多不同审美风格的图像模型,以及编辑和修改生成图像的不同技术。语音合成。语音合成的应用出现较早,如语音助手Siri,但消费与企业级的应用才刚刚起步,如将来能为电影和播客等高端应用一次性生成与配音演员或主播录音一样不机械、有自然质感的作品。视频和3D模型领域。这一领域的进步较为缓慢,包括电影、游戏、VR、建筑和实体产品设计等。预计在未来1-2年内,能看到一些基础的3D和视频生成模型。其它领域。其它许多领域还处于基础模型研发阶段,如音频、音乐到生物与化学领域。(一)B端应用2023年3月16日微软发布了AI服务Microsoft365Copilot。微软将其内置于Word、PowerPoint、Excel、Outlook、Teams等Microsoft365应用中,以聊天机器人的形式呈现在办公软件的侧边栏上。同时还可以通过全新产品BusinessChat使用,该软件被应用于大型语言模型、Microsoft365应用以及用户的日历、电子邮件、聊天、文档、会议和联系人,用户可以运用自然语言命令,使其根据会议、电子邮件和相关聊天记录等生成一个进度更新报告。Dynamic365是微软旗下的企业服务平台,2023年3月9日推出的的Dynamics365Copilot结合了ChatGPT相关的AI技术,跨业务功能提供交互式、AI驱动的帮助,运用于客户关系管理(CRM)和企业资源规划(ERP),可为销售、服务、营销、运营和供应链等跨业务的人员提供支持,例如帮助向客户编写电子邮件回复,创建团队会议的电子邮件摘要,为营销人员提供灵感等。(二)C端应用2023年2月8日,由ChatGPT提供支持的全新搜索引擎Bing正式亮相。新Bing在传统的搜索外还有对话窗口,将“搜索+答案+创造+聊天”融为一体,可用类似于ChatGPT的方式,向它提问或是征求它的意见,还可以进行创作。新版Bing在技术和功能上的革新,使其能够更加灵活地满足用户的多样化需求,为用户带来更为智能的使用体验。新版Bing在短期内获得了庞大的用户群体,在超过百万的新版Bing预览用户推动之下,Bing每日活跃用户已突破1亿,在这数百万活跃用户中,大约三分之一是Bing的新用户。此外,微软还在2月22日宣布为移动端发布新版Bing应用程序。此外,据德勤白皮书分析,基础数据服务受AI商业化落地驱动高速增长,人工智能基础数据服务应用于众多下游场景,但不同下游场景对数据采集类型以及数据标注对象有着各自的差异化需求,自动驾驶当前是人工智能基础数据服务最重要的应用领域,并将在未来继续维系这一地位,自动驾驶AI算法的升级迭代及模型训练数据量的指数级增长,将持续拉动人工智能基础数据服务需求,自动驾驶AI算法的升级迭代及模型训练数据量的指数级增长,将持续拉动人工智能基础数据服务需求。四、AIGC市场趋势(一)市场规模及未来增速近些年来,在政策和市场的共同驱动下,人工智能持续升温:投融资规模持续扩大,AI领域论文发表量和专利申请量逐年增长,人工智能基础设施蓬勃发展,相关产品和服务持续优化创新,人工智能向着各行各业不断渗透,该产业进入了高速发展阶段。据IDC统计,2021年全球市场人工智能市场收入规模(含软件、硬件及服务)达850亿美元,IDC预测该市场规模将于2025年突破2000亿美元大关,2021年-2025年均复合增长率可达24.5%,并预计中国的该市场规模将于2025年突破160亿美元。据德勤预测,2025年世界人工智能市场规模将超过6万亿美元,2017年-2025年均复合增长率可达30%。(二)算力需求持续增加,有望推动AI服务器放量自OpenAI于2020年推出GPT-3以来谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构相继推出超大规模预训练模型,包括SwitchTransformer、DALL·EMT-NLG、盘古、悟道2.0、紫东太初和M6等,不断刷新着各榜单纪录。当前,预训练模型参数数量、训练数据规模按照300倍/年的趋势增长,继续通过增大模型和增加训练数据仍是短期内演进方向。复杂的深度学习模型往往需要消耗大量的存储空间和计算资源,难以在端、边等资源受限情形下应用。轻量化深度学习成为解决这一挑战的重要技术,包括设计更加紧凑和高效的神经网络结构、对大模型进行剪枝等,从而减少计算量、提升计算效率。当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速演进。这主要源于算力需求的驱动,一方面体现在模型训练阶段,根据OpenAI数据,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距;另一方面,由于推断的泛在性,使得推断用算力需求持续增长。基于GPU的训练芯片持续增多,面向GPU创新的企业开始发力,出现了摩尔线程、天数智芯等一批专注GPU赛道的初创公司。基于ASIC等架构云端训练芯片能力提升显著,寒武纪的思元370、原科技的“邃思2.0”以及百度的昆仑2等相对上一代产品均有3-4倍以上的算力提升。而英伟达在GPU领域的强劲实力使其成为HPC(超大规模数据中心和高性能计算)需求增长的受益者。NVIDIAA100TensorCoreGPU可针对AI、数据分析和HPC应用场景,在不同规模下实现出色的加速,有效助力更高性能的弹性数据中心。A100的性能比上一代产品提升高达20倍,并可划分为七个GPU实例,以根据变化的需求进行动态调整。A100提供40GB和80GB显存两种版本,A10080GB将GPU显存增加了一倍,并提供超快速的显存带宽(每秒超过2万亿字节[TB/s]),可处理超大型模型和数据集,为数据中心提供了强大的端到端AI和HPC平台。(三)国内市场前瞻随着信息通信技术的高速发展,中国乃至全球的数据规模都将迅猛增长。据IDC统计,中国数据规模将从2021年的18.51ZB增长至2026年的56.16ZB,CAGR为24.9%,增速位居全球第一。数据是AI模型开发和迭代的基础,是推动产业智能化发展的重要资源。大规模的可用数据,为人工智能深度学习带来巨大助力。企业应将大数据机遇转化为发展红利,打通数据壁垒,实现数据汇聚,进而提升商业价值。人工智能技术在我国呈现为政策大力支持、商业化应用逐步落地、产业技术加速创新升级的发展趋势,该行业蕴藏着庞大的发展潜力,市场前景十分广阔。从2015年以来,人工智能先后被写进“十三五”、“十四五”国家发展规划纲要,国家持续推动人工智能产业发展,积极布局产业新规划,给予该行业很大的增长动力与长期保障,人工智能政策红利日益凸显。根据2017年国务院《新一代人工智能发展规划》所制定的战略目标,到2025年,核心产业规模应超过4000亿元,带动相关产业规模超过5万亿元。目前中国正加速推进5G基站、人工智能等新型基础设施建设,其中AI芯片是支撑人工智能技术和产业发展的关键基础设施之一,未来将催生大量高端芯片、专用芯片的需求,正向促进AI芯片、深度学习等相关产业的技术突破与应用发展。近些年,中国人工智能行业整体呈快速发展趋势,产业规模持续增长,AI逐渐渗透进各行各业中,行业大环境持续向好。据艾瑞测算,2022年中国人工智能产业规模达1958亿元,年增长率7.8%,整体平稳向好,预计2027年人工智能产业整体规模可达6122亿元,2022年-2027年的相关CAGR=25.6%。五、AIGC产业链拆分当下一级市场中AIGC企业按技术架构下的产业链分布来看,算法层竞争度高,算力层竞争度小。算法层中又以基础层和应用层企业居多,中间层企业较少,中间层企业未来机会空间较大。其中,大厂较多布局算力层、算法层的基础层和平台层的模型生产和训练等,聚焦高投入、大算力需求、大数据量级、通用能力好的环节。中间层、应用层和平台层的数据平台环节所需投入少、算力需求不高、数据量级要求低,未来可能会涌现出很多中小企业。(一)算力层包括AI芯片及处理器、AIDC智算中心和AI传感器。算力层投资价值体现为:由于数据规模和模型复杂度增速远超算力增速,当前AIGC对算力的需求指数级增长,算力供需已经失衡,需求拉动下成长空间较大;新计算产业已成为中国数字经济发展的必由之路、重中之重,受政策鼓励扶持,具有战略价值;相比于大模型投入成本低;专业性壁垒高;具有先发优势:先发布属于填补空白,突破卡脖子,社会效应高。AI芯片根据所在服务器在网络中的位置可以分为云端AI芯片,边缘及终端AI芯片,云端芯片侧重训练,边缘+终端层芯片侧重推理,这两类芯片均具有较高成长空间。训练AI芯片代表企业有:NVIDIA、寒武纪、摩尔线程和壁仞科技等,推理AI芯片代表企业有:NVIDIA、Google、Intel和寒武纪等。(二)平台层包括模型生产、训练平台和数据平台,其中数据平台又包括数据采集、数据清洗、数据标注、数据合成和数据溯源。根据IT技术人员重要性调研反馈,数据处理与应用环节更为值得投资机构的关注。代表企业有:百度、阿里和华为等。(三)中间层中间层预期未来将涌现一批初创企业,专门负责调整大型模型以适应具体AI应用需求,提供更精准化、更专业的预训练模型并反哺给大型模型。中间层属于蓝海市场,成长空间大,有专业性、深度进入壁垒;先训练、先迭代,具有一定容错率。中间层普遍具有数据飞轮效应,更多数据可以训练出更好的模型,吸引用户从而产生更多用户数据用于训练,形成良性循环。从现有中间层的AIGC企业分布情况来看,企业布局主要聚焦智能机器人、计算机视觉应用、智能交互、机器人操作系统、chatBOT等方向,在内容生成、推荐引擎、机器学习应用、知识图谱、机器翻译等领域布局较少,未来潜力较大。六、AIGC海外玩家(一)谷歌2023年3月21日,谷歌正式宣布开放Bard的访问权限,其采用了先进的深度学习算法,具有包括翻译、摘要等在内的一系列能力,并由大量文本提供支持。Bard暂时只能进行英文对话,编程功能暂不可用,在生成内容的形式方面Bard能一次性创建几个不同的版本,供用户从中择优选用。2023年3月6月谷歌推出大型视觉语言模型PaLM-E。通过PaLM-540B语言模型与ViT-22B视觉Transformer模型相结合,PaLM-E最终的参数量高达5620亿。作为一种多模态具身视觉语言模型(VLM),PaLM-E不仅可以理解图像,还能理解、生成语言,甚至将二者结合起来,处理复杂指令。文本功能方面,PaLM-E是一个仅有解码器的LLM,在给定前缀或提示下,能够以自回归方式生成文本补全。图像功能方面,经过单个图像提示训练,PaLM-E不仅可以指导机器人完成各种复杂的任务,还可以生成描述图像的语言。PaLM-E展示了前所未有的灵活性和适应性,代表着一次重大飞跃,特别是人机交互领域。ChatGPT和BERT都属于Transformer模型的变体,但它们之间还存在着一些关键的差异。ChatGPT使用的是transformer的Decoder结构,在模型训练时,GPT模型从左到右依次生成被预测词,只能看到被预测词前面的词而无法看到被预测词后面的词。因此GPT在语言生成类任务上有着更好的表现,例如机器翻译,文本生成等。与此相反,BERT使用的是transformer的Encoder结构,采用双向Transformer结构进行预训练,能够对单句或双句文本进行建模,模型能够根据被预测词的上下文语义信息预测出中间词出现的概率。因此BERT更加擅长语言理解类的任务,如文本分类,实体抽取,情感判断等。在训练数据方面,BERT采用预先训练和微调两个阶段来学习通用的文本表示并将其应用于特定的NLP任务,而ChatGPT则通过大量输入更广泛的文本来学习文本表示。(二)微软2023年3月9日微软推出Dynamics365Copilot,为各项商业应用全面引入互动式的人工智能助手,通过整合CRM和ERP系统,帮助客户从各个业务层面加速创新和增加营收,提升员工、客户体验及运营效率。2023年3月16日微软发布了AI服务Microsoft365Copilot。Copilot是将大型语言模型GPT-4内建到Microsoft365。在程序里面可以用非常口语化的方式使用AI,还可以通过各个程序的配合,达到预期效果,开启全新工作方式。3月16日微软还推出了PowerPlatformCopilot,基于GPT能力让制作者用自然语言描述想要的应用、流程或机器人,在几秒内完成创建并提供改进建议。(三)Meta2023年2月25日,Meta官网公布了一个新的大型语言模型LLaMA(LargeLanguageModelMetaAl)。从参数规模来看,Meta提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型,并用20种语言进行训练,且具有以下特点:参数规模小,对算力要求低;训练数据多;AI能力出众,在逻辑推理等方面优于GPT-3,在代码生成方面优于LaMDA和PaLM。七、AIGC国内玩家大模型生态涉及底层服务支持、算法平台以及行业应用,厂商主要包括百度、阿里、商汤、华为等人工智能企业,也有智源研究院、中科院自动化所等研究机构,许多科技巨头已布局多年。其中百度早在2019年3月发布预训练模型ERNIE1.0,2021年12月鹏城实验室与百度联合发布了大模型ERNIE3.0Titan,2023年3月推出了文心一言(ERNIEBot);2021年4月,华为发布盘古大模型;2021年7月,澜舟科技推出了孟子大模型;2021年9月,中科院自动化所打造了大模型“紫东太初”;2021年11月,商汤科技和上海人工智能实验室等发布了书生(INTERN),2023年3月推出了书生(INTERN)2.5;2022年4月,清华大学和阿里达摩学院等合作设计了大模型“八卦炉”;2022年4月,腾讯对外披露混元大模型;2022年9月,阿里发布通义大模型系列。大模型增强AI技术的通用性,让开发者以更低成本、更低门槛,面向场景研发更好的AI模型,助力普惠AI的实现。基础大模型得到大规模产业应用并成为产业基座不仅需要有与场景深度融合的大模型体系,还需要有支持全流程应用落地的专业工具和平台,还需要开放的生态来激发创新;“模型+工具平台+生态”三层之间交互赋能,才能形成良性循环的产业智能化生态共同体,也更容易借助长期积累形成竞争壁垒。(一)百度百度率先在2019年3月发布预训练模型ERNIE1.0,持续投入大模型的技术创新与产业应用,布局了NLP、CV、跨模态等大模型,率先提出行业大模型,构建大模型工具与平台,探索产品与社区,在企业端和用户端均有不同程度的突破。在近年的大模型技术探索与产业实践中,百度文心形成了支撑大模型产业落地的关键路径,构建文心大模型层、工具平台层、产品与社区三层体系:建设更适配场景需求的基础、任务、行业三层大模型体系,提供全流程支持应用落地的工具和方法,孵化基于大模型的任务系统与创新产品,营造激发创新的开放生态。目前,文心大模型已经建设了36个大模型,其中基础大模型包含:NLP(自然语言处理)大模型、CV(计算机视觉)大模型、跨模态大模型,任务大模型包含对话、搜索、信息抽取、生物计算等多个典型任务,行业大模型包含与来自8个行业的头部企业或机构共建的11个行业大模型。(二)科大讯飞在ChatGPT引发的AI技术新一轮热潮背景下,讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。核心算法方面,已将Transformer深度神经网络算法广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平。数据积累方面,讯飞在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据。算力支撑方面,讯飞在总部自建有业界一流的数据中心,为大模型训练平台建设奠定了很好的硬件基石。此外,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。行业应用方面,讯飞计划采用“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本,以进一步提高大模型在细分行业的实用性。(三)360作为一家搜索引擎厂商,360在发展人工智能大语言模型上具备数据获取和处理的工程化能力、人工知识训练、场景三大核心优势,将坚持“两翼齐飞”战略,先占据场景,同步发力核心算法技术。360大模型战略在ToC端,将推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品;在ToSME端,将基于生成式大模型推出SaaS化垂直应用,以解决中小微企业数字化转型难题;在ToG&ToB端,360已将核心数字安全能力融入安全AI模型,计划结合数字安全业务推出企业私有化AI服务,满足客户对私有知识、资产的索引需求。(四)阿里巴巴2021年,阿里巴巴达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论