2023Web3时代的生产力工具AIGC_第1页
2023Web3时代的生产力工具AIGC_第2页
2023Web3时代的生产力工具AIGC_第3页
2023Web3时代的生产力工具AIGC_第4页
2023Web3时代的生产力工具AIGC_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Web3时代的生产力工具AIGC2023P.PAGEP.PAGE22022:AIGC崛起之年 3AIGC是什么? 5AIGC发展简史 6技术 6自然语言处理技术NLP 6AIGC生成模型 9当我们开始用AIGC——商业模式的探索 14AIGC的未来发展趋势 18面临的挑战 19未来的发展方向 20投资策略:AIGC的软硬件与数据集 20风险提示 21图表目录图表1:红框为网站头条文章位置,为AI创作 3图表2:官网展示应用场景 4图表3:AI生成的乔布斯访谈博客 4图表4:《幻觉东京》AI重制版 5图表5:内容生成的四阶段 5图表6:AIGC发展历程 6图表7:自然语言理解三大发展阶段 7图表8:自然语言生成6步骤 7图表9:微软ApacheSpark功能 8图表10:Transformer与其他神经网络英德翻译质量对比 9图表11:Transformer与其他神经网络英法翻译质量对比 9图表12:Transformer模型结构 9图表13:GAN的两个组成 10图表14:GAN架构 10图表15:DALL-E2可以根据文字描述生成图片 11图表16:扩散模型训练原理 12图表17:扩散模型与其他模型比较 12图表18:正态分布函数叠加 13图表19:DALL-E2工作过程举例 13图表20:Jasper的应用场景 14图表21:通过AIGC撰写的AIGC报告 15图表22:通过AIGC生成的图片 15图表23:MidJourney用户案例 16图表24:Phenaki2分钟视频生成案例 17图表25:Delysium中的虚拟人玩家 18图表26:GitHubCopilot 18图表27:AIGC生成的图片在细节上效果较差 19图表28:AIGC投资标的 211.2022:AIGC崛起之年VCAIAI923AIAIGC(AI-GeneratedContent202210StabilityAI1.01达10亿美元,跻身独角兽行列,由Coatue、LightspeedPartners和O'ShaughnessyVenturesLLCStabilityAIStableDiffusionStableDiffusionAIAIGCAI配AI图表1:红框为网站头条文章位置,为AI创作资料来源:巴比特官网,国盛证券研究所除了绘画以外,文字、音频、视频均可通过AI来生成。JasperAIInstagram2021700004000202220221113日P.PAGEP.PAGE10图表2:官网展示应用场景资料来源:Jasper,国盛证券研究所3:AI

Podcast.aiAI的语JoeRogan资料来源:Podcast.ai官网,国盛证券研究所AI1603AIAIGC基于AIGC图表4:《幻觉东京》AI重制版资料来源:公开资料,国盛证券研究所NLP(NaturalLanguageProcessing)(DiffusionAdversarialNetwork)GANAIGC是什么?AIGC1.02.0PGCUGCInstagramB的内容来自于UGC图表5:内容生成的四阶段资料来源:A16Z,国盛证券研究所AIGCAIAIGC发展简史AIGC的发展可以大致分为以下三个阶段:2050年代—90AIGC902110106:AIGC

近年来,AIGC的发展迅速,从原来作为边缘侧服务于企业、机构的角色变为了现在段

1950年,图灵提出著名的“图灵测试”,给出判断机器是否具有”智能“的实验方法1957年,第一支由计算机创作的弦乐四重奏《依利亚克组曲》完成1966年,世界第一款可人机对话的机器人Eliza问世80年代中期,IBM创造语音控制打字机段2007年,世界第一部完全由人工智能创作的小说《1theroad》问世2012年,微软展示全自动同传系统段2014年,IanJGoodfellow提出生成对抗网络GAN2017年,微软“小冰”推出世界首部100%由人工智能创作的诗集《阳光失了玻璃窗》2018年,英伟达发布StyleGan模型可自动生成高质量图片2018年,人工智能生成画作在佳士得以43.25万美成交,成为首个出售的人工智能艺术品2019年,DeepMind发布DVD-GAN模型用以生成连续视频2021年,OpenAI推出DALL-E,主要应用于文本与图像交互生成内容资料来源:《AIGC白皮书》,国盛证券研究所技术随着NLP(NaturalLanguageProcessing,自然语言处理)技术和扩散模型(DiffusionModel)的发展,AI不再仅作为内容创造的辅助工具,创造生成内容成为了可能。自然语言处理技术NLP自然语言处理最早可以追溯到1950年,图灵发表论文“计算机器与智能”,提出“图灵测试”的概念作为判断智能的条件。这一测试包含了自动语意翻译和自然语言生成。自然语言处理技术可以分为两个核心任务:自然语言理解NLU计算机在理解上有很多难点,所以NLU3786

自然语言生成GNLG到现在的高级NLG内容确定文本结构内容确定文本结构句子聚合语法化参考表达式生成语言实现子。参考表达式生成需要识别出内容的领域,然后使用该领域(而不是其他领域)的词汇。NLG最终传达的信息要多。NLP主要被应用在四个方面:youtubenetflix图表9:微软ApacheSpark功能资料来源:微软官网,国盛证券研究所商业上,NLP主要被应用在一下领域:文字处理工作,如:名称实体辨识(NER)、分类、摘要和关联撷取。AI(RNN)NLP年由Google(LSTM)RNNGPTCommonCrawl图表10:Transformer与其神网络英翻译量对比 图表11:Transformer与其神网络英翻译量对比资料来:GoogleResearch,盛证券究所 资料来:GoogleResearch,盛证券究所NLPRNN不必像RNN图表12:Transformer模型结构资料来源:GoogleResearch,国盛证券研究所AIGC生成模型近年来,AIGC的快速发展归功于生成算法领域的技术积累,其中包含了:生成对抗网络(DiffusionModel)AIGC生成对抗网络GAN(GenerativeAdversarialNetworks)2014J.Goodfellow图表13:GAN的两个组成资料来源:EasyAi,国盛证券研究所GAN图表14:GAN架构资料来源:公开资料,国盛证券研究所其优点在于:缺点:(ModeCollapse)GANs扩散模型DiffusionModel扩散模型是一种新型的生成模型,可生成各种高分辨率图像。在OpenAI,NvidiaGoogle图表15:DALL-E2可以根据文字描述生成图片资料来源:OpenAI官网,国盛证券研究所扩散模型的生成逻辑相比其他的模型更接近人的思维模式,也是为什么近期AIGC拥有了开放性的创造力。本质上,扩散模型的工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过反转这个噪声过程来学习恢复数据。训练后,我们可以通过简单地将随机采样的噪声传递给学习的去噪过程来生成数据。(latentvariable)q(𝑥𝑡|𝑥𝑡−1)𝑥1……𝑥𝑡𝑥0𝑥0𝑥𝑡𝑝𝜃(𝑥𝑡−1|𝑥𝑡)图表16:扩散模型训练原理资料来源:AssemblyAI,国盛证券研究所相比于其他模型,扩散模型的优势在于生成的图像质量更高,且无需通过对抗性训练,这使得其训练的效率有所提升。同时,扩散模型还具有可扩展性和并行性。图表17:扩散模型与其他模型比较资料来源:Github”whatarediffusionmodels?”,国盛证券研究所高斯噪声是一种概率密度函数符合正态分布的函数,当AIGC运用扩散模型来生成内容的时候,是通过在一副纯白的画布(随机白噪声)上逐步去噪来生成最终的目标画作。即用户给出的文本描述形容词,来从一个模糊的概念逐步具象。我们可以简化为多个正态分布函数的叠加,模型选择其中重叠的区间输出,这也是一个逐步缩小范围的过程。这与人类的思维模式很类似。AIAI在柯基身上。图表18:正态分布函数叠加资料来源:Wikipedia,国盛证券研究所简述完原理以后,我们可以通过目前非常先进的AI图像生成应用DALL-E2来举例阐述具体的工作过程:(Prior)OpenAI的Clip4-AIGC图表19:DALL-E2工作过程举例资料来源:AssemblyAI,国盛证券研究所除了上述提到的自然语言处理技术和AIGC生成算法模型以外,超级计算机和算力这些硬件作为基础设施也是不可或缺的。在机器学习的过程中,需要通过大量的训练来实现更准确的结果,这样的计算量普通的电脑是无法完成的,目前主要由英伟达A100构建的计算集群完成,而国内外的初创企业也会通过云实现。AIGC——商业模式的探索AIGCAIGCAIGC服务SaaS文字创作20:Jasper

AIGCJasper1.25亿美15Jasper2021AIAIJasperJasperJasper7Airbnb、Ibm202140009000资料来源:Jasper,国盛证券研究所AIGCAIGCJasper很快就生成了一篇AIGCAIGCJasperAPP图表21:通过AIGC撰写的AIGC报告资料来源:Jasper,国盛证券研究所图像创作22AIGC

MidJourneyNLP()AIAIGC创资料来源:MidJourneyBot和无界版图,国盛证券研究所近期,OpenAI已经与全球最大的版权图片供应商之一的Shutterstock达成深度合作,Shutterstock将开始出售利用OpenAI的DALL-E生成的图片,并禁止销售非DALL-E生成的图片,完成深度独家绑定。AIGC图表23:MidJourney用户案例资料来源:MidJourney,国盛证券研究所视频创作Google推出了AIDEMOImagen基ImagenVideoPhenakiAIGC24:Phenaki2音频剪辑AIGC游戏开发AIGCAIGC来创建场景和NPCAIGCDelysium202220221113日图表25:Delysium中的虚拟人玩家资料来源:Delysium,国盛证券研究所代码生成GitHubCopilot是一个GitHub和OpenAIAI或者正在编辑的代码上下文为开发者提供代码建议。官方介绍其已经接受了来自GitHub图表26:GitHubCopilot资料来源:GitHub,国盛证券研究所AIGC的未来发展趋势AIGC是PGC、UGC之后,全新的内容生产方式。不仅能提升内容生产的效率以满足我们飞速增长的内容需求,也能够丰富内容的多样性。在2022年百度世界大会上,李彦宏提到了:“AIGC将走过三个发展阶段:第一个阶段是“助手阶段”,AIGC用来辅助AIGCAI面临的挑战下图是笔者通过AIGC生成的一副“美女与布偶猫”的图片,从这一张图片我们可以发现有两个问题:AIGC图表27:AIGC生成的图片在细节上效果较差资料来源:MidJourney,国盛证券研究所那么造成以上的这些问题和差距的原因在哪里呢?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论