版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
传媒行业专题报告-现象级产品ChatGPT出现赋能多元应用一、ChatGPT:AIGC应用落地的奇点到来(一)ChatGPT面世的行业背景:AIGC技术的厚积薄发,大厂布局相互追赶自2022年11月底发布以来,OpenAI推出的大型语言模型(LLM,LargeLanguageModel)ChatGPT在全球迅速引发广泛关注,ChatGPT在智能问答领域实现了变革性突破,能够回复多轮问题、承认错误、质疑、拒绝,智能程度更接近人类。ChatGPT的出现对搜索领域产生直接冲击,相比传统推荐机制的搜索模式,ChatGPT的回答更直接、能够极大减轻用户的信息检索和信息整理成本。根据Similarweb数据,上线仅2个月,ChatGPT的月活用户数已达到1亿人,现象级产品TikTok达到这一用户量级用了约9个月。作为AIGC在文本生成领域的应用,ChatGPT打开了AIGC在C端广泛应用的大门,AIGC在文字场景的应用迎来奇点,也带动板块整体关注度的提升。行业发展看,随着底层算法的持续迭代优化,大厂在技术侧的大力投入厚积薄发。根据腾讯研究院发布的《AIGC发展趋势报告2023》,三大关键节点推动AIGC的发展:(1)基础生成模型在底层逻辑上的突破创新。2015-2017年,扩散模型(DiffusionModel)、Transformer模型的提出,生成算法不断突破。(2)预训练模型的出现,模型参数量级迅速扩大。2018年,谷歌基于Transformer模型推出NLP预训练模型BERT,参数量级达到4810亿,基于大规模数据训练的模型在下游多模态的迁移学习方面展现出了较强的适应能力。(3)多模态技术的应用,提升AIGC通用能力。CLIP模型实现文字与图片的信息转换,是OpenAI旗下AI绘画产品DALL-E的关键技术。综合来看,技术层面,生成模型的迭代创新、预训练模型的出现、参数量级的提升、多模态技术的运用,逐步构建了ChatGPT出现的关键技术要素支撑。底层技术的进步反映在更接近C端的应用层,关注度提升,推高行业热度。过去AI技术的发展主要停留在技术、科研层面,由于在实际应用中的测试效果不佳,下游应用范围受限,仅能支持基础的文本写作、代码生成等功能。随着CLIP、GPT-3等大参数量级的大模型推出,模型的“智能”水平显著增强,AIGC在实际场景中的应用效果得到优化,能够完成长文本、长代码生成,智能问答的准确度和语义表述精确度大幅提升。同时多模态技术的发展也拓宽了下游应用场景,包括基于CLIP和DALL·E的AI作画,基于Florence的图片、视频分类等。22年年底的AI作画、ChatGPT为代表的AI问答等受到广泛关注,应用的不断落地标志着AIGC行业进入发展的新阶段,商业化变现空间可期。行业发展背景来看,ChatGPT的火爆是多年积累的底层算法能力、算力水平提升的共同推动下,在技术发展到一定节点后,传导到C端,得到多元广泛应用的结果。但AI技术的应用仍然存在包括伦理争议、暴力内容等问题需要解决,大范围应用落地仍需时间。此前,搜索引擎巨头Google作为AI领域的重要厂商之一,先后提出了ChatGPT中使用到的RLHF、InstructionTuning等重要概念,并与2014年收购的公司DeepMind一起推出了包括T5、Gopher、LaMDA、PaLM等在内的预训练模型,2022年9月,DeepMind还推出了加入RLHF和Retrival的Sparrow模型,可用于与用户闲聊并回答一些提问,但Google考虑到声誉风险等问题,在AI聊天机器人尚未完全成熟、可能提供错误或不当回答的情况下,延缓了类ChatGPTAI问答产品的推出时间。从ChatGPT表现看,目前AI聊天机器人在伦理、道德等方面仍旧存在诸多问题,并可能受用户的诱导提供不当回答。例如在与新必应交流过程中,出现了劝说用户与妻子分开、和它在一起等有悖伦理的回答;在医疗等较为严肃的场景中,ChatGPT可能会出现的不合理回答也同样难以接受。(二)ChatGPT成功的原因:OpenAI不计成本的投入,打开C端应用想象空间公司能力看,OpenAI在技术上持续深耕,不计投入、勇于探索新的技术路线;管理层的创投背景和团队对AGI理想愿景的坚持受资本青睐,打造出目前市场效果最优的ChatGPT模型。1、OpenAI:技术深耕,关键模型实现变革性突破OpenAI专注于AI相关技术与应用的探索,由ElonMusk(特斯拉CEO)、SamAltman
(YC创业孵化器总裁)、PeterThiel(PayPal联合创始人)等人在2015年共同创立,并承诺共同投入10亿美元。OpenAI致力于打造“安全且有益的通用人工智能”,除GPT系列外,OpenAI还发布了根据文字生成图像的DALL-E模型、AI音乐创作模型MuseNet、Jukebox等,涉足AIGC的多个细分领域。发展历程看,OpenAI发展经历了三个发展阶段:(1)2015~2018年,公司坚持非盈利组织的定位,不考虑盈利,并开源所有技术。比起一家创业公司,OpenAI更像一群追求通用人工智能(AGI)技术及其合理应用的理想主义者团队。2016年,OpenAI发布了开源平台Universe,由微软、英伟达等公司共同参与打造,能够在包括网站、游戏在内的几乎所有环境中衡量和训练AGI。(2)2018~2021年:技术突破,推出GPT、DALL-E等重要模型,转型盈利导向。2018年6月,OpenAI推出拥有1.17亿参数的GPT-1预训练模型,在NLP领域获得了比谷歌2017年推出的Transformer更优的效果。2019年2月,OpenAI迭代出GPT-2,参数量级达到15亿,验证了大训练集、大参数量训练出的模型的迁移学习能力。但大模型带来的训练成本也迅速增加,非盈利性质无法长期维持项目运转,同时,马斯克也退出OpenAI董事会。2019年3月,公司宣布重组,转为盈利性质(但限制回报上限100倍),同时后续技术不再开源。同年7月,OpenAI获得了微软的10亿美元投资,与龙头互联网平台自此实现了深度绑定,微软的Azure云服务平台也一定程度缓解了OpenAI的训练成本压力。2020年、2021年,公司分别发布了1750亿个参数的语言模型GPT-3、自然语言生成图片的DALL-E等关键模型,技术壁垒得到巩固。(3)2021年至今:技术成熟,向下游应用渗透,商业化起步。2022年4月,OpenAI发布DALL-E2,实现更高分辨率的AI图片生成;11月,发布ChatGPT,以对话形式交互,可以连续回答问题、承认错误、质疑不正确的前提、拒绝不适当的要求,智能程度进一步接近人类,在文本生成、搜索等领域获得了广泛应用。2023年2月,随着ChatGPT在全球的火热,OpenAI宣布推出付费方案ChatGPTPlus,以每月20美元的订阅制收费;同时,微软将ChatGPT能力进一步与自身业务结合,发布新版Bing搜索引擎和Edge浏览器,预计将能够处理更复杂的搜索提问。2、管理层&投融资:受资本青睐,管理层前瞻眼光、大胆投入,微软合作加速商业化OpenAI董事会及管理层成员大多拥有丰富的技术或投资背景。董事会主席兼总裁GregBrockman曾担任Stripe的创始工程师,并于2013年成为Stripe的首位CTO,首席科学家IlyaSutskever和2019年图灵奖得主GeoffreyHinton共同发明了卷积神经网络AlexNet;SamAltman曾担任YCombinator总裁,有丰富的投资经验,投资了包括Airbnb、Stripe、Reddit等知名公司。OpenAI的非雇员董事背景也十分丰富,多位董事是头部互联网公司的创始人或首席执行官,也有董事具备丰富的政府背景或人工智能研究背景。融资方面,OpenAI创始人中有多位硅谷知名投资人,创业基因和对AGI的美好愿景吸引了资本关注。2019年微软10亿美元的投资成为公司发展的重要节点,微软成为OpenAI独家云计算提供商;2023年1月,微软宣布向OpenAI进行一项为期多年、价值达一百亿美元的投资,进入长期合作伙伴关系的第三阶段,OpenAI投后估值达到290亿美元,成为美国最有价值的初创公司之一。根据《Fortune》,若OpenAI在市场上盈利且大获成功,微软可从一系列投资中获得最多920亿美元的收益,参与收购的其他VC则能够获得高达1500亿美元的收益。当OpenAI开始盈利后,会优先偿还第一密切合作伙伴的本金;第二阶段,微软将有权获得OpenAI75%的利润,直至其收回130亿美元的投资;第三阶段,微软的利润分配比例下降至49%,另有49%的利润分配给员工(41%)和第一密切合作伙伴(8%);
第四阶段,当投资者收益已达利润上限后,OpenAI重新变为非盈利组织,微软和其他风险投资者的股份将无偿转让给OpenAI的非盈利基金。3、ChatGPT:技术突破,商业化加速从GPT-1到GPT-3:参数量、训练量指数级增加,大模型在多个领域实现较高的迁移效果。算法本身的特性看,GPT系列从1到3都采用了Transformer架构,GPT-3的本质仍然是通过大量参数、大量训练集数据的学习,依赖Transformer强大的拟合能力使得模型能够收敛,因此GPT-3学到的模型分布很难摆脱数据集的分布情况,需要持续更新训练集。算力方面,由于参数量和训练数据体量的急速扩展,对底层算力的要求也持续增加,训练成本较高,根据LambdaLabs,GPT-3训练一次的成本或可高达460万美元。面向下游应用的商业化看,ChatGPT的应用场景丰富,ToC端应用场景广阔。根据公司官网,OpenAI罗列出48个使用场景,具体可分为回答、分类、代码、对话、总结、翻译和转换七类,基本涵盖日常所需的大部分文字使用场景。ChatGPT可满足使用者代码编写、语言翻译、回答问题、文本创作等办公场景需求;同时可以通过聊天、生成菜谱、生成健身建议等满足生活场景需求,迁移学习能力极大拓展了使用场景。ToB端应用商业化看,有望赋能新闻、金融等文字工作相关领域以及搜索、客服等交互式对话工作领域。BuzzFeed计划使用OpenAI开放的API加强部分内容创作,并为观众个性化一些内容,让人工智能在公司的编辑和业务运营中发挥更大的作用。搜索引擎方面,微软于2月8日发布的新版Bing搜索引擎吸取并优化了ChatGPT与GPT-3.5的精华,提供比ChatGPT更强大的运作,可以更容易理解使用者输入的字词,进一步搜寻完整答案,产出更符合实际解答的内容以提供全新的搜索体验。OpenAI所开放的API接口已经在上千个应用程序中被部署,涵盖从学习新语言到解决复杂的分类问题等不同任务。国内上市公司接入ChatGPT情况看,已接入的大部分公司使用GPT模型应用于虚拟数字人场景,也有部分公司发力AI绘图、智能搜索引擎、文案及代码编写等场景。天娱数科旗下数字人接入模型后在TikTok跨境电商直播、虚拟主播直播互动等场景实现应用;蓝色光标旗下数字人苏小妹采用ChatGPT技术介入AI多轮对话,其AI作诗能力已进入技术测试阶段;风语筑旗下数字人接入ChatGPT以强化场景识别能力和更新能力;开普云旗下数字人与GPT-3-003接口对接后形成更可靠的数字人对话服务;天地在线和捷成股份参股的虚拟技术提供商世优科技接入ChatGPT训练数字人专有大脑形成个性化模型。招商银行、江苏银行等金融公司将ChatGPT融入文案编写、代码编写等日常办公领域;吉宏股份在2023年1月即接入GPTAPI接口,通过ChatGPT赋能跨境电商业务,累计帮助公司上新品1万余个,接手客户闲聊和安抚对话10万余次,节省客服1000人次工时,生成新的广告文案7万余条,帮助公司处理图像素材2万余个,公司团队还利用ChatGPT在千万级商品中新挖掘了150万种商品之间的关系。商业化手段看:订阅制面向有较大使用需求的消费者,API接口主要对接B端客户。OpenAI在2月初推出ChatGPTPlus试验订阅计划,价格为20美元/月,目前仅对美国用户开放。订阅者可以在流量高峰正常访问ChatGPT,享有更快的响应速度以及ChatGPT新功能使用优先权,有高峰时段使用需求的消费者可以通过订阅满足日常使用;OpenAI还提供基本模型、微调模型以及嵌入模型的API接口,针对不同的模型型号根据Tokens数量收费,企业等专业开发者可通过API接口接入ChatGPT,对模型进行调优,以更适应垂直领域的应用需求。二、国内外产业链布局:大厂尝试大模型突围,应用层多元场景接入打开商业化空间(一)产业链:上游算力支持,互联网大厂相继布局,应用逐步多元化ChatGPT是AIGC在NLP领域的产品化成果,从模型本质看,都属于内容生成式人工智能。产业链看,ChatGPT作为对话机器人,是产业链下游的应用产品;所采用的GPT模型是AIGC产业链中游的变革性突破,同样需要AIGC行业上游的AI芯片、深度学习算法框架等提供算力、算法支持。ChatGPT的面世也拓宽了产业链下游应用场景,加速了AIGC的商业化进程。AIGC行业可分为硬件层、模型层、应用层,其中:
硬件层,主要包含AI芯片,用于为模型训练及模型推理提供算力支持;AI芯片竞争格局方面,英伟达占据主要地位,国产企业中百度、华为、阿里巴巴、寒武纪等头部科技企业依托自身技术及业务优势重点进行了相关芯片布局,推出百度昆仑芯2、华为昇腾910、平头哥含光800、寒武纪思元370等优质AI芯片,发展较为迅速,为预训练大模型提供算力支撑。模型层方面,近年来随着AI芯片的快速迭代以及AI框架算法的持续进步,预训练模型参数量实现指数级增长,从千万量级快速增至千亿量级,而在庞大数据训练下,AI预训练模型也得以快速发展,内容多样性、可控性等进阶需求得以满足。另外,多模态预训练模型的出现使不同模态、不同来源数据和信息的融合处理得以实现,满足了AIGC融合场景下的创作需求,使AIGC技术应用场景广度得到极大提升。在AIGC模型研发阶段,开发人员通过对已有预训练模型进行剪裁等方式的微调,即可实现用于特定场景、特定需求下的模型量产,与传统AI模型训练相比,能够极大程度上降低训练时间与成本,因此预训练模型是AIGC产业实现商业化的重要环节。由于预训练模型开发需要拥有超大规模算力以及海量数据支持,国际上预训练模型开发以资金与数据较为充沛的头部互联网公司为主,如谷歌、微软、Meta等,国内具备预训练模型研发能力的公司主要有百度、华为、阿里巴巴、腾讯、字节等。应用层方面,AIGC凭借强大、高效的内容创造能力,在文本、代码、图像、视频、3D、游戏等领域均有丰富应用场景。例如在文本领域,AIGC可用于营销文案生成与小说创作,能在降本增效的同时获取丰富、高质量的文本内容;在图像领域,AIGC可用于图像属性编辑以及图像端到端生成,同时在多模态模型下,用户还可通过文本输入进行AI绘画,极大丰富艺术创造形式;在游戏领域,AIGC可用于游戏辅助制作,用于生成游戏内随机地图、关卡等内容,通过NLP模型还可丰富玩家与游戏内NPC交流内容,为游戏玩家带来更加生动、丰富的游戏体验。未来随着AI芯片算力提升、预训练模型持续发展,AIGC覆盖板块将有望进一步扩展,AIGC应用市场具有较大潜力。(二)模型层:大模型卡位战激烈,技术路线、算法效果存在差距模型层看,目前大模型是业内一致认知的技术路线,但需要庞大的训练集和较高的训练成本,大厂天然具备优势。行业的主要参与者包括谷歌、OpenAI(与微软深度绑定)、StabilityAI(亚马逊合作)、百度等,国外厂商在技术上相对更为领先。技术、应用、数据互通演进,大模型实现迭代闭环。大模型技术持续不断地发展,已经从单模态技术发展到了多模态技术和跨模态技术,技术供给的持续丰富促进了应用的繁荣,比如AIGC、数字人、生物计算等,同时大模型技术促进了端对端智能系统的快速发展,进一步提升了应用的效果和效率,而这些应用在和用户与环境交互的过程中产生了海量的新数据,数据又不断驱动大模型技术的升级,从而形成了
“技术-应用-数据”的正循环。大模型技术发展趋势一:资深技术日趋成熟。大模型在发展的过程中越来越成熟,基于思维链的Flan-PaLM模型已经具备基本的推理能力,基于层次化的ERNIE3.0Zeus可以更好地建模不同任务的共性与特性,再通过将不同的任务组织成统一的自然语言形式,统一建模增强模型的泛化能力。相对其他模型,ERNIE3.0Zeus在各类NLP任务上表现出了更强的零样本和小样本学习能力。为了进一步降低落地门槛,也出现了效率高、泛化能力强的轻量级大模型ERNIE3.0Tiny等。计算机视觉
(ComputerVision,CV)大模型发展迅速,百度提出了VIMER-CAE模型,强化了图像分割能力,具有较强的泛化能力;Google训练了一个规模达170亿的多任务视觉学习模型PaLI,效果超过通用多模态基础模型BEiT-3。跨模态技术(Cross-Modal),百度提出的文心ERNIE-ViLG2.0可以生成语义更相关、质量更高的图片。大模型技术发展趋势二:使用门槛持续降低。如何应对大模型学习的海量知识和技能,以及在对速度、时延和存储有严格要求的应用场景中使用更轻量化的模型,是大模型降低使用门槛所面临的两个主要挑战。针对这些挑战,百度提出了两种解决方案:首先,为了在应用中有效激发大模型的海量知识从而达到最好效果,公司提出了Prompt技术,通过在输入数据中插入一些提示信息,来指导模型进行学习和推理,设计好的Prompt能够帮助模型更好地理解数据,并且可以提高模型的准确性和效率。目前,大模型已经能够自己编写Prompt,且超越了人类水平,大模型在下游任务中的门槛进一步降低。其次,在一些应用场景中,速度、时延和存储的要求非常高。因此,百度推演出大小模型协同促进的研发范式,大模型将效果推到极致,使小模型能够向大模型学习;小模型则利用已有的知识来辅助大模型进行知识选择,提高迭代效率,降低使用成本。大小模型的协同进化产生了飞轮效应,从而促进技术的演进和应用的落地。大模型技术发展趋势三:平台集约化发展,加速应用创新。以百度为例,公司以大模型能力为核心,开发了文心大模型套件ERNIEKit。通过该套件,用户可以使用多维度的能力,例如数据处理、模型预训练、模型微调和模型快速部署等,支持40+应用场景,由此衍生出来的能力可以通过开发平台和服务平台,向开发者和生态系统进一步赋能,从而实现整个平台在大模型应用落地全周期的覆盖,降低开发门槛。细分赛道看,ChatGPT所在的NLP赛道,以2017年谷歌推出Transformer模型为节点,海外迭代节奏更快,竞争更激烈,国内仅百度一家先发优势明显。海外模型的迭代看,2018年OpenAI推出了GPT-1,只采用Transformer的Decoder结构,参数量级达1.17亿,获得了更优的效果。同年,谷歌发布BERT模型,基于Transformer的Encoder结构,参数达到3亿个,对自然语言的理解进一步加深,模型效果超越GPT1。2019年-2020年,OpenAI相继迭代了两版GPT模型,在算法上基本沿袭GPT-1的框架,参数量级以10倍左右的速度提升,GPT-3达到1750亿个参数,是纯粹的无监督训练模型。同一时期,谷歌则坚持采用Transformer结构+无监督学习+有监督学习的技术路线,参数量级从T5的110亿提升至2021年SwitchTransformer模型的1.6万亿,在计算资源相同的情况下,SwitchTransformer的训练速度可以达到T5的4-7倍。2021年后,无论是OpenAI还是谷歌,都在模型上有所突破。OpenAI基于GPT系列,引入基于人类反馈的强化学习,对模型效果产生了较强的增益,成功迭代出InstructGPT、ChatGPT两个模型。谷歌2021年推出了技术路线与GPT系列类似的LaMDA模型,参数量级1370亿,2023年为了应对ChatGPT的冲击,推出了基于LaMDA的轻量级版本Bard,相对ChatGPT更具内容的时效性,但问答效果与ChatGPT仍有一定差距。此外,谷歌还加大外延投资,投资OpenAI前员工成立的竞品初创公司Anthropic,其推出的Claude模型采用AI反馈强化学习进行训练,模型效果仍需进一步验证。国内看,发展滞后海外,但在NLP领域,不同语言体系的语法、语义结构差距较大,国内厂商的模型在中文样本上更具优势。厂商竞争力看,百度具备一定先发优势。百度2019年基于BERT模型的改进,推出了文心大模型1.0,此后又迭代了2.0和3.0版本。在ChatGPT出圈后,百度基于文心大模型,迅速推出了类ChatGPT产品“文心一言”,并与众多下游应用厂商达成合作,拓展生态应用版图。在百度搜索引擎、云计算等成熟业务的助力下,“文心一言”有望成为国内率先商业化落地的产品。(三)应用层:多元应用打开商业化空间AIGC在内容生产领域中具有革新性的意义,运用其搜集、整合和生成的能力,能够大幅减少用户将创意概念向产品雏形、草稿转化的时间和成本。特别是在标准化要求较低、较为重视感性与体验的场景中,AIGC帮助用户将创意与具体实现过程分离,AIGC取代了大量重复的具体实现过程所需的劳动力,并逐步压低边际成本。在影视、娱乐等内容需求丰富的领域,AIGC已经具备大规模辅助生产的水平,能够率先实现商业化落地;而在内容精度、数据准确性要求更严格的行业赛道上,如银行、金融、教育、医疗等领域,AIGC的能力尚不能完全满足使用场景的要求,产品的生产和商业化落地仍需相应人才的参与、配合、检验。长期来看,很多核心技术或创意与具体实现过程可分离的赛道,未来都有可能成为AIGC的应用场景,并借助AIGC的能力实现“工业化生产”。目前,以ChatGPT为代表的AIGC产品商业化有望在以下途径较快落地:
(1)内容生产的降本增效:在创意密集度高、交互需求较强的行业,AIGC工具能够根据用户的指导,高效率地进行内容的生成、加工、批量编辑和风格转换等,在营销、图片、音乐、视频、文本、游戏、虚拟人和元宇宙等各媒介中均有广阔的应用空间,并已经涌现出AI绘画、写作助手等一批新应用。(2)辅助办公和软件服务:将AI嵌入搜索引擎及办公软件中,通过自然语言处理实现邮件自动生成、文献和会议翻译、代码生成和智能搜索等功能。微软已经在讨论将OpenAI的模型整合到Word、PowerPoint、Outlook和其他应用程序中,以便用户可以通过简单的提示自动生成文本;DeepL翻译器使用基于Transformer架构的人工神经网络进行文本翻译,部分AIGC产品已经融入用户的日常办公场景中。在AIGC技术的商业化节奏上,国内外厂商存在差异。现阶段,国外厂商在C端应用的商业化上步伐更快,已经能够实现C端变现。代码网站GitHub基于自身公开存储库的数十亿行代码训练了Copilot,该AI可以根据开发者的需求辅助生成和修改代码,个人用户的订阅价格为10美元/月;会议软件Teams计划推出TeamsPremium,订阅用户可启用多种基于GPT的高级功能,包括AI会议总结、实时字幕翻译、搜索口述文本等,预期价格为10美元/月。除具备技术优势的头部企业外,国外还涌现一批各具特色的初创企业,多采用基于大模型调优后,建立在垂直领域效果更优的小模型的方式。如Midjourney的图像生成AI推出了三档收费计划,其中标准计划向用户开放每月15小时的高速GPU运算使用时间和商用许可,每月收费24美元;能够使用26种语言编写商品说明、视频脚本和在线等内容的写作辅助AI工具Jasper也采取多档收费的订阅模式,个人用户可以根据每月生成的字数选择49美元/月到500美元/月不等的套餐。由于模型效果与ChatGPT等海外前沿模型仍存在差距,国内C端应用用户认知仍在逐步建立,国内B端应用生态有望先行。百度以文心ERNIE模型系统为底层模型的类ChatGPT产品文心一言宣布推出后,吸引了大量B端厂商积极合作。近期官宣的首批生态合作伙伴中,主要以新闻媒体、垂直内容平台、广告营销企业和软件开发公司为主,主要合作方向涵盖软件服务、营销、搜索、文字、视频、虚拟人和元宇宙、语音等方向,以提供相关应用API的方式向企业端客户提供服务。三、AIGC应用场景:内容生成降本增效,商业化空间可期AIGC应用于传媒互联网领域,ChatGPT有望对搜索领域带来变革,同时,通过AI实现内容生产、创意实现,与游戏、音乐、图片、营销等领域结合,都有可观的潜在商业化空间。(一)微软将ChatGPT和全线业务进行融合微软作为OpenAI最大投资方,将ChatGPT与自身全线业务融合,在办公、搜索等领域尝试探索新的模式。我们整理了微软的主要业务模块,微软的产品兼顾向企业端的服务,以及个人用户服务。1、生产力和业务流程相关业务。该业务模块包含(1)Officecommercial,产品包括Office,Exchange,SharePoint,MicrosoftTeams,Office365SecurityandCompliance,以及SkypeforBusiness等应用。其收入主要来自于企业支付的基于云服务的软件接入订阅费或本地安装软件的许可费。微软Office365是基于云的订阅服务,企业可以通过付费订阅在线使用Word、Excel、PowerPoint、Outlook等产品。企业用户也可以在本地安装Office软件,即Officeon-premises,购买许可证使用。(2)OfficeConsumer,即面向个人和家庭用户提供的订阅服务,产品包含Word、Excel、PowerPoint、Outlook。Microsoft365Consumer还包括Skype、OneDrive、Teams等产品的接入服务。(3)Linkedin,是微软于2016年收购的社交网络,除了拥有专注于建立人脉关系的社交平台,Linkedin还垂直于向企业客户提供招聘解决方案、营销等解决方案的落地。Linkedin的收入来源包括广告变现、付费会员服务、人才招聘服务和销售解决方案服务。(4)Dynamicbusinesssolutions是微软开发的基于云计算的商业软件解决方案,包括ERP(企业资源计划)、CRM(客户关系管理)、CustomerInsights(客户洞察)等系列智能应用程序。2、智能云。该业务模块包括两大块,(1)服务器和云业务,旗下包括Azure云计算平台,提供包括虚拟机、存储、数据分析、人工智能等模块的服务能力。企业可以通过Azure构建、部署和管理应用和解决方案。SQLServer是微软开发的关系型数据库管理系统,可以在本地或云上部署,适配多类型操作系统和编程语言。还包括WindowsSerer和SystemCentor等服务器操作系统、系统管理套件。以及为开发人员提供服务的GitHub,开发团队利用GitHub可以高效的协作和开发软件产品。(2)企业咨询等服务。微软的咨询服务团队,可以为企业客户提供战略制定、业务梳理、培训及软件/硬件部署的配套服务,皆在帮助企业实现数字化转型和业务创新。3、更多个人计算业务。该模块包括(1)Windows,包括向OEM在生产时预装在计算机上的Windows操作系统向微软支付的许可费,以及Windows商业产品的批量授权,通常来自于企业批量采购设备时支付的许可费。(2)设备,包括Surface和电脑配件等硬件设备的销售。(3)游戏业务,Xbox硬件和内容服务。(4)搜索广告,来足浴Bing和微软平台的广告收入。从收入结构来看,微软三块业务的占比较为均衡,近期智能云业务的收入占比和增速相较于其他两块略显优势。整体来看,2021年全年微软收入达到1681亿美元,同比增长18%。生产力和业务流程相关业务2021年收入达到539亿美元,同比增长16%,占总收入的比例达到32%。2021年智能云业务收入达601亿美元,同比增长24%,占比达到36%。更多个人计算业务在2021年的总收入为541亿美元,同比增长12%,占收入比为32%。整体来看三大块各占近1/3的收入贡献,而增速均较为稳健,智能云业务增长更快。按细分业务来看,服务器和云业务、办公软件产品和云业务的收入贡献度最高,从业务增速来看,游戏业务和Linkedin以及服务器和云业务的增速快于其他业务线。服务器和云业务、办公软件产品和云业务2021年收入贡献分别为31%和24%,是前两大收入贡献的细分业务。从增速来看,收入贡献为9%的游戏业务增长最快,21年同比增速达到33%,其次服务器和云业务以及收入贡献占比为6%的Linkedin业务收入增速都在27%,仅次于游戏业务。而相对更传统的Windows、Devices、企业服务业务增速都较为缓慢,同比增速在4%。搜索+聊天机器人是对C端用户感知最明显的使用场景。ChatGPT的语言模型可以优化Bing对用户检索信息的理解能力,Bing的用户搜索需求和搜索行为也可以强化ChatGPT的语言理解模型。从目前的全球各搜索引擎访问量来看,Google占据绝对优势。根据Similarweb的访问量统计,2022年11月-23年1月期间,谷歌网站的总访问量达到2598亿,以绝对优势领先于其他搜索引擎;同一期间Bing的访问量为35亿,duckduckgo为26亿。而从设备分布来看,Google的流量移动端占比最高,达到59%;其他引擎的PC流量占比高于移动端。根据2023年1月每天的搜索查询数量来看,美国地区微软系站点的搜索量有明显提升。根据statista数据显示,23年1月每天的搜索引擎搜索量来看,微软站点有明显的提升趋势,较月初每天100万次,提升至月末的每天500多万次。因新的功能,Bing在移动端的下载排名攀升。从美国ios应用市场的免费榜单来看,Bing因加入了ChatGPT的对话功能测试,引发了用户下载使用,Bing在应用商店的排名从过去的工具榜排名150+,到总榜的前100,持续占领效率类应用的榜首。虽然绝对下载量未超越Google,但也吸引了大量的新增用户。(二)百度基于文心大模型推出产业级搜索系统“文心百中”国内厂商看,百度深度布局从大模型到应用产品的产业链全景,布局搜索、图片生成等重要应用场景。“产业级”和“知识增强”构筑文心大模型两大特性,坚定“降低应用门槛”的发展路线。文心大模型全景图涵盖文心大模型、工具与平台、产品与社区三个部分。文心大模型层由基础大模型、任务大模型、行业大模型的三级体系构成,能够广泛应用于各行各业,满足不同应用场景的需求。工具与平台层包括大模型开发套件、文心API和内置文心大模型能力的EasyDL和BML开发平台,有效降低应用门槛。产品与社区层包括AI艺术与辅助创作平台“文心一格”、产业级搜索系统“文心百中”和创意探索社区旸谷,增加用户对AI大模型技术的体验空间。行业大模型推进文心大模型在产业应用中更深入的落地。文心·行业大模型是在通用数据训练的文心大模型基础上,结合行业特有的大数据和知识,采用行业相关的创新算法设计而成的。行业大模型的设计进一步提升文心大模型在行业应用中的适配性,可以更好地应对行业领域的需求。目前百度与国网、浦发、航天、人民网、哈尔滨、电影频道、深燃、吉利、泰康、上海辞书出版社等均有行业大模型落地,助力行业的智能化转型升级。以电影领域为例,文心和电影频道联合发布的智感超清大模型,深度结合百度的AI技术能力和电影频道长期积累的视频修复数据,通过对超分辨率、去噪、去模糊、去压缩等多任务的联合预训练、亿级参数量的学习,同时实现对多种损坏情况的修复,并通过画质提升、边缘锐化等方式增强视频的清晰度,全方位提升视频修复效率和观感体验的效果。搜索场景上,百度文心推出大模型驱动的产业级搜索系统“文心百中”。文心百中由百度搜索与文心大模型联合研制,可以对文本信息、富文本信息、结构化信息、视频信息进行精准语义搜索,覆盖知识搜索、合同搜索、人才库搜索、电商搜索、音乐搜索、长视频搜索等多个搜索场景。极简、强大、高效是文心百中的三个主要特点,文心大模型目前可以替代过去大量的传统搜索策略,策略极简驱动架构极简,从而架构的研发和运营维护成本可以降低到一个新的量级,同时产品设计也做到了极简化,仅需三步即可在线完成搜索引擎的构建;文心百中的语义理解能力非常强大,几乎可以做到在搜索时不再需要担心语义问题;强大的模型能力和极简的产品设计促使百中拥有从零开始建设搜索系统的能力,使得搜索系统的定制开发和实现上线的周期或者人力成本能够压缩90%以上。“文心百中”即将上线“知识对话”功能。通过搜索找到问题知识点的答案,需针对有关知识内容进行统一建模。文心百中可以直接对多源异构数据进行建模,实现针对各种知识内容的精准语义搜索。这个功能还可以应用于智能问答、问答辅助等场景。百度类ChatGPT应用“文心一言”将于3月正式推出。2月13日,百度宣布将于3月正式推出基于文心大模型技术的生成式对话产品文心一言(ERNIEBot)。据电商报介绍,“文心一言”一些相关功能目前已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等。2月17日,百度智能云在2023AI+工业互联网高峰论坛上宣布“文心一言”将通过百度智能云对外提供服务,为产业带来AI普惠。论坛上,百度集团执行副总裁、百度智能云事业群总裁沈抖表示,文心一言的能力将通过百度智能云率先在内容和信息相关的行业和场景落地。相关行业如媒体、文娱、企业软件等,相关场景如智能客服、员工培训、巡检日报、知识萃取等,都将率先使用文心一言的服务。信息的高效流转和交互,也会进一步带来行业生产、经营效率的提升。据百度公众号,目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的近300家头部企业宣布加入百度“文心一言”生态。Baidu坚守国内搜索市场行业龙头。2021年1月国内在线搜索月活跃用户已经达到5.41亿,相较2018年1月提升1.12亿。从中国主要搜索引擎的市场份额看,Baidu位居前列,截至2023年1月市占率65.2%,Sogou和Bing次之,市占率分别为12.7%、11.5%。(三)内容社区/在线阅读:变革内容创作生态&增厚数据价值ChatGPT生成的文本内容已经呈现出可以媲美人类的优异表现,在内容社区、在线阅读等领域有望产生直接助力。具体来说,ChatGPT可以根据用户的个性化要求生成文本(包括但不限于小说/作文/论文/诗歌/新闻/营销文案/教材/演讲稿)、对文本进行修改润色、续写内容等。根据《纽约时报》的报道,在北密歇根大学哲学教授AntonyAumann的世界宗教课堂上,由ChatGPT撰写的课程论文获得了全班最高评价。网上也有多位职业教育老师测评了由ChatGPT生成的雅思作文,评分普遍在6分到7.5分
(满分9分)。大厂在文本生成领域的主要产品除了ChatGPT(OpenAI)、Bard(谷歌)、文心一言(百度)外,22年4月腾讯AILab推出智能写作助手“文涌Effidit”,定位在辅助写作者提升效率,提供智能纠错、文本补全、文本润色、文本扩写、词语/句子推荐与生成等功能,目前尚未提供长文本的创作生成。阿里达摩院先后于21年4月发布270亿参数的大语言模型PLUG、于22年9月发布通义大模型M6-OFA,目前正在研发基于通义大模型的类ChatGPT产品,兼具文本生成和图片生成能力。字节跳动在2016年6月上线了新闻写作机器人Xiaomingbot。国内市场还涌现了彩云小梦、澜舟科技等AI生成文本类应用。但是由于这些语言模型的参数量及训练量偏小,一般只提供内容续写、文本润色等辅助性写作功能,且其生成文本经常出现上下文不连贯、逻辑前后矛盾等情况,与ChatGPT的性能存在较大差距。现阶段ChatGPT生成的文本依然存在明显缺点,例如我们向ChatGPT提问2022年全国新高考I卷的作文题目,ChatGPT撰写的作文大篇幅引用题干、表述多次重复。一方面AIGC技术已然掀起全球内容创作生态的革命,预期将在不远的未来显著提升内容生产效率;但另一方面我们判断,基于机器学习底层技术的局限性,AI最终难以替代创新性、感性、思辨性的优质内容创作。(1)大语言模型(LLM)根据训练数据生成文本。由于数据集的局限性,对应生成的文本可能缺乏特定领域常识、存在偏见、没有实时信息等。例如ChatGPT训练所用的中文数据集较少,因此ChatGPT对中文的理解相对不足、响应能力较弱;同时ChatGPT训练所用的数据更新至2021年9月,因此ChatGPT并不知道“Bar
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保山学院《中级会计实务》2022-2023学年第一学期期末试卷
- 二零二四年度股权转让合同详细描述
- 管理沟通训练培训
- 要约金合同范本
- 油漆签约合同范本
- 工程建设标准合同范本
- 2024年度汽车座套广告位租赁合同书(马来西亚繁体中文版)2篇
- 服装中介合同范本
- 就业合同三篇
- 2024版LED健身中心照明租赁合同
- 旅游岗位招聘笔试题与参考答案(某大型国企)2025年
- 2024年江苏省扬州市中考语文试卷
- 第三届全国大学生未来农业律师大赛试题
- 2024年居家养老服务协议
- 纪检干部业务培训
- 网络信息安全科普
- 个人合作装修合同模板
- 一例胸壁输液港输液期间导管堵塞的个案报告课件
- 2024年份IDC数据中心租赁协议
- 2023年国考税务系统招聘考试真题
- GB/T 18916.15-2024工业用水定额第15部分:白酒
评论
0/150
提交评论