版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一张图看懂ChatGPT算力产业链图谱:ChatGPT运行所需“训练+推理”场景,带动AI服务器需求,进而推动算力芯片需求增长。一张图看懂ChatGPT算力产业链:芯片→AI服务器→“训练+推理”2数据来源:中国信通院,通信产业报,OpenAI官网,机器之心,CSDN上游-算力基础软硬件设施中游-算力网络与平台下游-应用领域运营商境外大陆Verizon 中国移动Xfinity 中国联通中国电信芯片/器件GPU境外大陆英伟达 海光信息AMD 景嘉微龙芯中科CPU境外大陆英特尔 龙芯中科高通 中国长城AMD 海光信息FGPA境外大陆英特尔
安路科技复旦微电紫光国微AI芯片境外大陆英伟达 澜起科技谷歌 寒武纪存储境外大陆美光科技
长江存储西部数据
长鑫存储三星电子
兆易创新SK海力士
北京君正数据中心服务器境外大陆戴尔 浪潮信息HPE
中科曙光神州数码拓维信息交换机境外大陆英特尔 紫光股份博通 星网锐捷中兴通讯光模块境外大陆思科 天孚通信瞻博网络 新易盛中际旭创光迅科技温控路由器境外大陆境外大陆艾默生
英维克依米康佳力图高澜股份Juniper
Network 华为Adtran 中兴通讯光子计算境外大陆图灵量子纵慧芯光曦智科技鲲游光电量子计算数据库境外大陆境外大陆IBM
本源量子图灵量子波色量子谷歌 腾讯亚马逊 阿里巴巴华为计算机视觉境外大陆Open
AI 华为Meta 商汤科技微软 百度谷歌 字节跳动ChipletEDA/IP境外大陆Synopsys
华大九天Cadence
概伦电子ARM 广立微CEVA 芯原股份材料境外大陆拓自达 兴森科技鹏鼎 华正新材欣兴电子方邦股份深南电路设备境外大陆泰瑞达 长传科技应用材料
北方华创华峰测控新益昌封测境外大陆日月光
通富微电长电科技利扬芯片甬矽电子模型算法ChatGPT运行训练数据算力AI训练计算需求预计每3.5个月翻一番Transformer技术模型迭代算力需求增加AI服务器需求增加CPU加速芯片芯片需求增加GPUFPGAASICIDC服务境外大陆Equinix
万国数据DigitalRealty
奥飞数据宝信软件数据港边缘计算境外大陆亚马逊AWS
华为云微软Azure
亚信科技谷歌GCP
浪潮软件中兴通讯AI计算境外大陆微软 百度谷歌
科大讯飞云从科技商汤科技网络设备境外大陆诺基亚 华为三星 中兴通讯爱立信 中国信科光传输境外大陆康宁
长飞光纤中天科技烽火通信调度编排境外大陆亚马逊 华为微软 新华三中兴通讯亚信科技算力安全境外大陆Fortinet腾讯安全Trend
Micro
绿盟科技360安全自然语言处理境外大陆Open
AI 百度谷歌 腾讯微软 华为Meta 奇点智源多模态境外大陆谷歌 阿里巴巴微软 腾讯DeepMind 百度华为Chiplet未来AI芯片的升级路径推动推动推动注:图中相关公司分为境外(含港澳台)和大陆地区3目录
CONTENTS引言:人工智能时代的“iPhone时刻”,ChatGPT颠覆传统写作方式0102ChatGPT的爆火出圈:上线仅2个月达成1亿月活跃用户量,成为迄今用户增速最快消费级应用ChatGPT的定义科普:基于GPT-3.5模型的聊天机器人,核心技术为人类反馈的强化学习,模型参数量或达1750亿ChatGPT的能力版图:号称人工智能时代的“iPhone时刻”,甚至能通过谷歌编程面试拿下18万美元L3工程师offerChatGPT究竟能否代替人类工作:基于半导体行业为主题,使用ChatGPT进行研报写作的尝试多维度分析:对比人工写作,ChatGPT的主要优势和局限在哪里?人工报告
VSChatGPT报告:文本写作质量孰优孰劣?要素1:定义描述对象:若需写作一篇阅读量破1万的热点文章,选题能否交由ChatGPT自己完成?要素2:把握描述特征:8种分析角度+一级颗粒度,ChatGPT是否有能力全面地掌握选题的特征广度和深度?要素3:选择语言体系:“卖方分析师or技术工程师or学者”
,ChatGPT会主动选择不同写作语言偏好和目标受众?要素4:运用写作方法:“可信度/情绪性/创新性/可读性”
4类写作方法,ChatGPT能否悉数掌握?其背后的原理是什么?要素5:运用写作顺序:“时间顺序/空间顺序/逻辑顺序”三种顺序,ChatGPT能否悉数运用得当?要素6:运用写作结构:“总分式/递进式/并列式”三种行文结构,ChatGPT是否有能力自主运用和切换?要素7:文章辅助信息:全文字数18922字,GPT-3.5最大输出长度4000
tokens,ChatGPT能达到的文章篇幅上限是多少?人工报告
VSChatGPT报告:写作投入成本孰高孰低?要素8:时间成本投入:与人工相比可节约超2/3的研报写作时间,为何ChatGPT的用时能节省如此多?要素9:使用成本投入:OpenAI开放ChatGPT模型API,相比GPT-3.5成本降低90%,使用门槛和成本或大大降低?要素10:能量成本投入:仅日常运营所需耗电量即超1万千瓦时,ChatGPT的能量消耗为何比人脑大这么多?03ChatGPT的未来展望:多模态AIGC应用将成新趋势,带动AI算力需求增长ChatGPT的未来应用场景:3大升级路径,释放自动化研报写作的潜力全球E级超算时代,ChatGPT引爆算力需求,30年全球超算规模将达0.2ZFlops投资建议:
ChatGPT模型带来预训练+日常运营+Finetune需求场景,算力需求持续释放或将带动算力基础设施产业迎来增长新周期。相关标的:算力芯片厂商,包括景嘉微、寒武纪、海光信息、龙芯中科、中国长城等,以及服务器厂商,包括浪潮信息、中科曙光等。投资评级:强于大市(首次)4一、引言:人工智能时代的“iPhone时刻”
,ChatGPT颠覆传统写作方式ChatGPT的爆火出圈:上线仅2个月达成1亿月活跃用户量,成为迄今用户增速最快消费级应用。ChatGPT的定义:基于GPT-3.5模型的聊天机器人,核心技术为人类反馈的强化学习,模型参数量或达1750亿。ChatGPT的能力版图:号称人工智能时代的“iPhone时刻”,甚至能通过谷歌编程面试拿下18万美元L3工程师offer。ChatGPT究竟能否代替人类工作:基于半导体行业为主题,使用ChatGPT进行研报写作的尝试。引言:人工智能时代的“iPhone时刻”,ChatGPT颠覆传统写作方式5SimilarWeb,OpenAI官网,Yahoo
Finance,UBS,CSDN,PCmag,Christian
Terwiesch《WouldChat
GPT3
Get
a
Wharton
MBA?
》,IT之家,长城证券研究院新一轮人工智能浪潮翻涌而至,ChatGPT爆火出圈,上线仅2个月达成1亿月活跃用户量,成为迄今用户增速最快消费级应用。2022年12月1日,OpenAI发布了自然语言生成式模型ChatGPT,开放测试5天内注册人数即超过百万人。在ChatGPT
推出仅两个月后月活跃用户已达
1亿,成为迄今增长最快的消费应用。据SensorTower数据,TikTok
在全球推出之后耗时约
9
个月才增加到
1
亿用户,而Instagram
则花了两年半时间。据SimilarWeb
数据,2023
年
1
月以来ChatGPT官网日访问量持续攀升,截至2023年2月17日,ChatGPT官网月访问量达8.89亿次。ChatGPT的定义:基于GPT-3.5模型的对话聊天机器人,核心技术在于人类反馈的强化学习,其模型参数量或可达1750亿。ChatGPT是一种基于GPT-3.5(GereratePre-Training,生成式预训练模型)的对话聊天机器人,由于引进了RLHF(ReinforcementLearning
withHuman
Feedback,基于人类反馈的强化学习)使得AI模型的产出和人类的常识、认知、需求、价值观保持一致。
据OpenAI官网,GPT-3模型最大训练参数达
1750
亿,考虑是GPT-3微调优化后版本,ChatGPT参数量或与之相当。ChatGPT的能力版图:被称为“人工智能时代的‘iPhone时刻’”,ChatGPT甚至直接通过谷歌编程面试拿下18万美元L3工程师offer。
通过学习大量现成文本和对话集合,ChatGPT可实现连续对话回答问题,还具备生成代码、撰写文章、文本摘要等能力,甚至能轻松通过一些对人类难度较高的专业级测试:据外媒PCMag报道,ChatGPT已能通过谷歌L3软件工程师的入职面试并拿下18万美元offer;据沃顿商学院教授Christian
Terwiesch发表论文,ChatGPT已能通过沃顿MBA核心课程期末考试;ChatGPT已通过的还有明尼苏达大学四门课程的研究生考试、美国职业医师资格考试等等。对此,业界形容ChatGPT的诞生意味着人工智能迎来革命性转折点,是人工智能时代的“iPhone时刻”
。一时间,关于ChatGPT或将取代搜索引擎,进而取代不少人类从事的工作的说法甚嚣尘上。ChatGPT究竟能否替代人类工作:基于半导体行业为主题,我们作了一次使用ChatGPT生成内容进行研报写作的使用体验尝试。对此,我们与ChatGPT进行了一系列对话作为测试。以“半导体行业”为主题,我们对ChatGPT进行了一系列的提问,从提纲至细节内容,均通过ChatGPT问答生成内容最终整理形成报告,并选取了某行业研究报告作为本次分析中的人工研报案例与ChatGPT写作研报进行对比。图:ChatGPT:迄今用户增速最快消费级应用图:ChatGPT模型训练三步走:监督微调SFT→奖励模型RM训练→PPO强化学习图:截至2023/2/17,ChatGPT
官网月访问8.89亿次6二、多维度分析:对比人工写作,ChatGPT的优势和局限在哪里?2048610选择语言体系运用写作方法运用写作顺序运用写作结构文章辅助信息时间成本节省使用成本节省能量成本节省 把握描述特征10
大维度分析雷达图:
人工写作
VS
CHATGPT写作人工写作 ChatGPT写作定义描述对象12写作投入成本文本写作质量数据来源:长城证券研究院人工报告
VS
ChatGPT报告:文本写作质量孰优孰劣?7要素1:定义描述对象:若需写作一篇阅读量破1万的热点文章,选题能否交由ChatGPT自己完成?相比人工写作,ChatGPT使用特点:优点:ChatGPT可给出当下5个可参考的热点选题范围,可以利用ChatGPT的生成能力来探索前沿话题和新闻,以此来提高文章的关注度。缺点:ChatGPT本身不具备直接选定主题的能力,需要人工参与和决策。ChatGPT官网,某行业研究报告,长城证券研究院要素2:把握描述特征:8种分析角度+一级颗粒度,ChatGPT是否有能力全面地掌握选题的特征广度和深度?要素3:选择语言体系:“卖方分析师or技术工程师or学者”
,ChatGPT会主动选择不同写作语言偏好和目标受众?相比人工写作,ChatGPT使用特点:优点:ChatGPT能总结出市场规模、竞争格局、下游终端应用、技术发展、市场挑战等8个角度进行分析(人工研报11个角度),同样具备较好的广度。缺点:同一特征分析,ChatGPT仅给到一级颗粒度(人工研报可给到二级)深度。相比人工写作,ChatGPT使用特点:优点:ChatGPT可以根据用户的需求生成3-4种明显不同类型、不同风格的研报内容,提供定制个性化的输出选项,增强了研报的多样性和针对性。缺点:ChatGPT默认给出的目标受众群体有4大类,因此需要提问者在prompt里有加充分限定词对其引导,比如目标受众、提问者身份等。对于同一提问,ChatGPT会随机回答一个选题,本身不具备选择选题的能力ChatGPT可以给出参考热点选题范围都是市场规模特征,ChatGPT仅给到一级颗粒度(总市场规模),而人工研报可给到二级颗粒度(分产品类别市场规模)对于分析特征角度,ChatGPT可以给出8个点,人工给出11个点(特征颗粒度掌握广度:人工VS
ChatGPT)(特征颗粒度掌握深度:人工VS
ChatGPT
)同一问题指令中,加入限定词“卖方”后,ChatGPT回答定义的目标读者群体和默认语言体系更准确当分别以不同身份者提问,得到的ChatGPT回答提纲表现出不同的偏好侧重人工报告
VS
ChatGPT报告:文本写作质量孰优孰劣?8要素4:运用写作方法:“可信度/情绪性/创新性/可读性”
4类写作方法,ChatGPT能否悉数掌握?其背后的原理是什么?1、增加可信度:ChatGPT能快速拓宽信息认知范围,但数据准确性需人工验证举案例 数据引用2、增加情绪性:ChatGPT能模拟人类写作,但文字情绪性较弱,不如人工写作的感染力强人工写作 ChatGPT写作人工写作 ChatGPT写作ChatGPT官网,WSTS,SIA,前瞻产业研究院,微词云,某行业研究报告,长城证券研究院12120 17chatGPT研报(全文共18118字)1个2个3个及以上282015050人工研报1个2个3个及以上
0(全文共48334字)(引用数据时间跨度范围)2016ChatGPT人工研报
1977人工研报时间颗粒可细分至月度,ChatGPT时间颗粒度只给出年份19711981199120012011
2021人工找到实时更新的数据,ChatGPT的数据只更新到2021年9月(引用数据时间最细颗粒度)4、增加可读性:ChatGPT不具备绘制信息图表的能力,但可引用第三方工具功能画图表 作比较\分类别优点:ChatGPT可拓宽个人的信息点认知局限,平均每1万字可列举27个案例(人工研报23个),常见案例数量为2个/观点(人工研报1个/观点)。ChatGPT可利用数据库内全部信息容量,生成相关案例及引用来源,快速提供人工未知的角度和思考点,提供更丰富例证参考。缺点:例证可靠性及时效性不足,ChatGPT错误率高达83%(人工研报0%),后续需再作人工验证。
1)ChatGPT对海量信息未经过权威可信度和更新时间权重分辨,会胡乱编造出以假乱真的答案和信息来源。2)ChatGPT无法联网实时更新(目前仅更新至2021年9月)。ChatGPT能够引用已知的其他人的预测结果,但无法自己独立给出假设和预测人工写作通常会给出假设预期,比如上市公司的PE估值(文本情感倾向分析)(文本情感倾向分析)优点:
ChatGPT能基于数据库给出2-3个他人现有预测结果和结论,给提问者提供思路。缺点:
ChatGPT不能依据现有数据自己作假设测算(没有计算功能),比如像人工写作研报时对上市公司的PE估值进行假设测算。
ChatGPT不能“从0到1”地创造出新观点、知识或结论,并为之定义新的概念。优点:ChatGPT动词使用词频达0.19,高于人工研报,能生成更多样性表达。经文本分析统计,ChatGPT的名词词频0.37,动词词频0.19,人工研报的名词词频0.41,动词词频0.16。缺点:相比人工,ChatGPT的文字情绪性较弱,文本情感倾向达89%(人工研报96%)。(文本使用形容词词云) (文本使用成语词云) (文本使用形容词词云) (文本使用成语词云)3、增加创新性:ChatGPT没有数据模型不具备归纳推新的能力,目前仅可组合现有的结论优点:ChatGPT可为图表展示提供一些思路,还可通过引用第三方工具功能生成图片或表格,并通过分类别的描述、对指定对象的比较分析,增加文字可读性。缺点:ChatGPT不能直接绘制数据信息的图表,为纯文本内容(人工研报共计133张图+3张表)。(引用数据来源及信息准确性统计)人工写作研报 ChatGPT写作研报信息来源
错误率
信息来源
错误率43个 0 23个 83(列举案例数量分布/观点) •(人工研报全文共计133张图+3张表格,ChatGPT纯文本)ChatGPT不具备绘制图表能力文本案例1.“根据中国半导体行业协会
(CSIA)
的数据,2019
年中国半导体行业价值1836
亿美元①,占中国GDP
的很大一部分②。该行业近年来稳步增长,2015
年至2019
年的复合年增长率
(CAGR)为
9.2%③。”——ChatGPT生成报告错误①:根据SIA数据,2019年中国半导体销售额达1500+亿美元,根据WSTS数据,2019年中国半导体行业销售额达1441亿美元;
错误②:根据WSTS数据,2015-2019年中国半导体行业销售额年复合增速为9.95%;错误③:根据前瞻产业研究院数据,2019年中国芯片市场规模占GDP的比重为0.76%。(ChatGPT生成文本验证)人工报告
VS
ChatGPT报告:文本写作质量孰优孰劣?9要素5:运用写作顺序:“时间顺序/空间顺序/逻辑顺序”三种顺序,ChatGPT能否悉数运用得当?相比人工写作,ChatGPT使用特点:优点:与人工相比,ChatGPT同样可以运用常见的3种写作顺序,研报写作中可以包含逻辑顺序、时间顺序、空间顺序的内容描述。要素6:运用写作结构:“总分式/递进式/并列式”三种行文结构,ChatGPT是否有能力自主运用和切换?要素7:文章辅助信息:全文字数18922字,GPT-3.5最大输出长度4000
tokens,ChatGPT能达到的文章篇幅上限是多少?相比人工写作,ChatGPT使用特点:优点:ChatGPT常用的是总分式、并列式这2种结构(人工研报:3种结构),其中总分总结构在其自动生成回答时是最常用的表达方式,ChatGPT这种高度结构化使回答更加清晰、易懂,能够更好地被人理解。缺点:ChatGPT在递进式结构上的运用不足,相比人工写作,其逻辑深度较弱。相比人工写作,ChatGPT使用特点:优点:ChatGPT可指定回答长度以避免冗长,报告平均句长36.7(人工研报为44.4)。缺点:输出长篇文章相对有难度,ChatGPT研报字数18922字(人工研报字数48334字)。目前GPT-3.5-turbo最大输出长度已能提高到4096
tokens(约3072个单词),
ChatGPT
可在达到此限制后继续运行,但需人工添加提示使其继续写作。ChatGPT官网,某行业研究报告,长城证券研究院(总分式结构√)(时间顺序√) (逻辑顺序√) (空间顺序√)ChatGPT写作人工写作ChatGPT写作人工写作人工写作ChatGPT写作(总分总结构√)(递进式结构√)(并列式结构√)人工写作研报 ChatGPT写作研报(并列式结构√)人工写作研报ChatGPT写作研报总字数总段落数总句数总字数总段落数总句数48334363108918922147516平均每段
平均句长中的句数总词数平均每段
平均句长中的句数总词数3.044.4100883.536.75241ChatGPT输出字数有限制(人工研报字数统计:48334字)(ChatGPT研报字数统计:18922字)图:ChatGPT网站经常出现超负载、响应卡顿情况,并且会限制1小时内提问次数人工报告
VS
ChatGPT报告:写作投入成本孰高孰低?图:ChatGPT网站停机时间最短几十分钟,最长14个小时10要素8:时间成本投入:与人工相比可节约超2/3的研报写作时间,为何ChatGPT的用时能节省如此多?优点:ChatGPT每1万字篇幅耗时28h(人工研报耗时86h/每1万字篇幅),可节省超2/3的研报写作时间成本。由于ChatGPT直接将模型库中知识积累整合,省去资料收集研究步骤;且不存在工作疲劳问题,无需人工休息时间,可大幅减少写作用时。缺点:ChatGPT的使用会引入额外时间成本(在线卡顿加载时间、中英文翻译时间等),导致最短几十分钟、最长14小时的额外时间消耗。图:研报写作流程图:ChatGPT写作和人工写作研报所需的研究准备-初稿写作-修订纠错-额外投入的总时间成本(小时/每1万字篇幅)分别为28h和86hChatGPT官网,OpenAI官网,OpenAI官方Twitter账号,CSDN,新智元,长城证券研究院研究准备阶段搜集整理资料、数据时间初稿写作阶段研报初稿撰写时间修订纠错阶段修改订正、润色时间额外时间消耗额外投入时间人工写作ChatGPT写作用时:20-30h需要人工汇总资料来源、数据图表信息、公告等用时:0hChatGPT无需提前人工搜集整理资料和数据,故此项不耗时人工写作ChatGPT写作用时:20-40h需要人工梳理报告提纲、提取、整合数据图表信息、绘制图表、组织文字写作等,形成初稿用时:4.5h
(2.5h+2h)只需提问ChatGPT自动生成报告提纲及文字内容,并在相关分析中填入数据例证,用时2.5h需人工整理问答,梳理形成初稿,用时2h人工写作ChatGPT写作用时:10h需要检查人工因素导致的错别字/数和格式误差,对文章结构、文字进一步优化用时:12hChatGPT给出的所有数据和引用来源均需要人工进一步验证纠错,由于ChatGPT错误率高(达83%),此项用时较长人工写作ChatGPT写作用时:16-26h需考虑人工休息时间(根据DeskTime研究,最有效率的员工通常连续工作52分钟后休息17分钟)用时:4.5-18h在线人数过多ChatGPT网站会超负载卡顿,停机时间最短几十分钟,最长14小时。此外需考虑ChatGPT生成回答响应的时间、英文问答翻译时间、人工休息时间(4h)优点:1)官方开放ChatGPT模型API,使用门槛降低。OpenAI开放基于ChatGPT同款GPT-3.5-turbo模型的ChatGPT
API,第三方开发者可将其直接集成到自己的应用或者服务产品中。
2)ChatGPT
API相比GPT-3.5成本降低90%。官方定价是$0.002/每1000tokens,1000个token大约相当于750个单词。等于每输出100万个单词,价格才2.7美金(约18元人民币),相比现有的GPT-3.5模型成本降低了90%。要素9:使用成本投入:OpenAI开放ChatGPT模型API,相比GPT-3.5成本降低90%,使用门槛和成本或大大降低?在线学习平台Quizlet发布Q-Chat。Instacart
计划今年推出AskInstacart2023年3月2日,OpenAI发布ChatGPT
API,定价$0.002/每1000
tokens。月活7.5亿的社交平台Snapchat推出My
AI。跨境电商平台Shopify创建智能导购。人工报告
VS
ChatGPT报告:写作投入成本孰高孰低?11要素10:能量成本投入:仅日常运营所需耗电量即超1万千瓦时,ChatGPT的能量消耗为何比人脑大这么多?优点:ChatGPT单月访问量达8.89亿次,考虑训练和运行模型的所需能量可分散到许多用途和用户身上,某些情况下比每个用户执行相同计算更节能,实现成本分摊。缺点:ChatGPT日常运营单月所需算力成本7034.7
Pflop/s-day,若以全球第一的超算Frontier计算需用时6.38天。写作每1万字篇幅研报,与人脑耗能(5.11
kW·h
)比,服务器运作耗电量(13506.53
kW·h
)大得多,能量投入成本高。此外,还需考虑ChatGPT模型预训练(3640
PFlop/s-day)和Finetune(1350
Pflop/s-day)带来的能量消耗。OpenAI《Language
Models
are
Few-Shot
Learners》,Swaminathan《Why
Does
the
Brain
Need
So
Much
Power?》,Fortune,SimilarWeb,TOP500榜单,浪潮官网,IDC,36氪,英伟达官网,长城证券研究院图:人工和ChatGPT写作每1万字篇幅研报需能量成本
5
kW·h
和超1万kW·h人工写作ChatGPT写作• 所需人力成本:折算耗电量(kW·h
)——5.11
kW·h• 一般认为,大脑消耗的能量占人体每天消耗的卡路里的20%。而正常人日均消耗卡路里2000大卡(Kcal),那么大脑一天消耗的能量是:• 2000Kcal×
20%=400Kcal=1,673,600J=1673.6kJ• 若转换为千瓦·时(kW·h
)数:由于1
KW·h
=3600000
J,则大脑一天耗能为0.46
KW·h• 根据写作所需时间成本(需要86小时/1万字篇幅,按每日工作8h计约11天),可估算完成一篇1万字篇幅的研报消耗能量为:• 0.46KW·h×
11=5.11kW·h• 所需算力成本:折算耗电量(kW·h
)——8,806.11
kW·h• 训练模型所需算力:据OpenAI团队2020年发表论文《Language
Models
are
Few-Shot
Learners》,训练一次13亿参数的GPT-3
XL模型需要的全部算力约为27.5PFlop/s-day;ChatGPT训练所用的模型是基于13亿参数的GPT-3.5模型微调而来,参数量与GPT-3
XL模型接近,预计训练所需算力约27.5PFlop/s-day,接近以1万亿次每秒的速度进行计算,需要耗时27.5天。• 日常运营所需算力:据SimilarWeb数据,2023年1月ChatGPT官网总访问量为6.16亿次,平均每天有超过1300万名独立访问者使用ChatGPT(即总计4.03亿名独立访问者)。据Fortune杂志,每次用户与ChatGPT互动产生的算力云服务成本约0.01美元。基于此,我们测算得2023年1月OpenAI为ChatGPT支付的运营算力成本约616万美元。据OpenAI团队论文《Language
Models
are
Few-Shot
Learners》,训练一次1746亿参数的GPT-3模型需要3640
PFlop/s-day的算力;据Lambda,其对应算力成本超过460万美元。假设单位算力成本固定,测算得ChatGPT单月运营所需算力约4874.4PFlop/s-day。我们以浪潮信息目前算力最强的服务器产品之一—浪潮NF5688M6为例。NF5688M6是浪潮为超大规模数据中心研发的NVLink
AI服务器,支持2颗Intel最新的Ice
Lake
CPU和8颗NVIDIA最新的NVSwitch全互联A800GPU,单机可提供5PFlops的AI计算性能,则单台NF5688M6计算需要974.88天。根据其单台电源功率为3000W=3kW,则ChatGPT单月运营需要耗电量为:3
kW×(947.88×24)h
=
68,247.36
kW·h• 根据写作所需时间成本(需要28小时/1万字篇幅,研报消耗能量为:
68,247.36
kW·h
÷
31×4=
8,80虑到ChatGPT模型可分散给多个用户同时使用,按每日工作8h计约4天),可估算完成一篇1万字篇幅的6.11
kW·h
(此为ChatGPT
4天日常运营所需算力,考因此实际该能耗成本可进行进一步分摊)人工写作研报所需人力成本:折算耗电量(kW·h)——5.11
kW·h假设条件:大脑消耗的能量占人体每天消耗的卡路里的20%正常人日均消耗卡路里2000大卡(Kcal)人工写作所需时间成本(需要86小时/1万字篇幅,按每日工作8h计约11天)大脑一天消耗能量(kJ):1673.6kJ转换为千瓦·时(kW·h
)数:0.46
KW·h估计完成一篇1万字篇幅的研报消耗能量(kW·h)为:5.11
kW·hChatGPT写作研报所需算力成本:折算耗电量(kW·h)——13506.53
kW·h
(仅考虑日常运营成本)假设条件:据SimilarWeb数据,2023/1/17至2023/2/17近一个月ChatGPT官网总访问量为8.89亿次。据Fortune杂志,每次用户与ChatGPT互动产生的算力云服务成本约0.01美元。可得ChatGPT单月运营所需算力成本为889万美元。已知训练一次1746亿参数的GPT-3模型需要3640
PFlop/s-day的算力,其对应算力成本超过460万美元,假设单位算力成本固定以浪潮目前算力最强的服务器产品之一NF5688M6为例,服务器单机可提供5PFlops的AI计算性能,单台电源功率3000
WChatGPT写作所需时间成本(需要28小时/1万字篇幅,按每日工作8h计约4天)ChatGPT单月运营所需算力(PFlop/s-day):7034.7
PFlop/s-day使用TOP500榜单中全球第一的超算Frontier以1.102EFlop/s计算所需天数(天)6.38天使用单台NF5688M6服务器进行计算所需天数(天):1406.93天ChatGPT单月运营需要耗电量(kW·h
):101298.96
kW·h估算平均完成一篇1万字篇幅的研报消耗能量(kW·h为:13506.53
kW·h
(可多名用户分摊)图:除日常运营成本外,测算ChatGPT模型的预训练算力需求约为3640
PFlop/s-day预训练模型算力需求测算模型训练总计算量(PF·日)训练总计算量(Flops)模型参数量(百万)训练词数(十亿)单个词语消耗的总计算次数计算反向传播后的算力消耗倍数正向计算时每个词消耗浮点计算次数BERT-Base1.891.64E+20109250632BERT-Large6.165.33E+20355250632RoBERTa-Base17.361.50E+211252,000632RoBERTa-Large49.314.26E+213552,000632GPT-3
Small2.602.25E+20125300632GPT-3
Medium7.426.41E+20356300632GPT-3
Large15.831.37E+21760300632GPT-3
XL27.502.38E+211,320300632GPT-32.
7B55.214.77E+212,650300632GPT-36.
7B138.751.20E+226,660300632GPT-3
13B267.712.31E+2212,850300632GPT-3
175B3637.503.14E+23174,600300632假设1:ChatGPT使用的数据集与GPT-3
175B模型相同假设2:ChatGPT使用FP32数据格式完成训练ChatGPT预训练GPU需求测算3000亿训练词的数据集构成GPU数量训练总计算量(Flops)GPU算力(TFlops/s)计算用时数据集词数(十亿)训练轮数权重占比18653803.14E+2319.5(A100
FP32)1天网络爬虫4100.4460%77231个月WebText2192.922%38612个月Books1121.98%25743个月Books2550.438%使用全球TOP1超算Fronier以1.102EFlop/s计算所需天数为3.3天维基百科33.43%t图:除日常运营成本外,测算ChatGPT模型Finetune算力需求为1350.4
PFlop/s-dayChatGPT写作研报假设条件:据IDC
预计,2022年中国人工智能服务器负载中,推理和训练的比例分别为
58.5%、41.5%。假设ChatGPT
对推理和训练的算力需求分布与之保持一致已知预训练一次1746亿参数的GPT-3模型需要3640
PFlop/s-day的算力,且ChatGPT单月运营所需算力为7034.7
PFlop/s-day考虑到AI
大模型预训练主要通过巨量数据喂养完成,模型底层架构变化频率不高,故我们假设每月最多进行一次预训练人类反馈机制下,模型需要不断获得人类指导以实现参数调优,以月为单位可能多次进行ChatGPT单月Finetune所需算力(PFlop/s-day):1350.4
PFlop/s-day使用TOP500榜单中全球第一的超算Frontier以1.102
EFlop/s计算所需天数(天)1.23天ChatGPT单月Finetune所需算力成本(万美元):170.65万美元使用单台NF5688M6服务器进行计算所需天数(天):270.08天ChatGPT单月运营需要耗电量(kW·h
):19445.62
kW·h估算平均完成一篇1万字篇幅的研报消耗能量(kW·h
)为:2592.75
kW·h
(可多名用户分摊)12三、ChatGPT的未来展望:多模态AIGC应用将成新趋势,带动AI算力需求增长探索ChatGPT的未来应用:3大升级路径,释放自动化研报写作的潜力全球E级超算时代,ChatGPT引爆算力需求,30年全球超算规模将达0.2ZFlops投资建议:ChatGPT
带动大模型训练热潮,AI
服务器需求有望放量探索ChatGPT的未来应用:3大升级路径,释放自动化研报写作的潜力13数据来源:微软Bing官网,量子位,Apptopia,OpenAI官网,Twitter,Alan
D.
Thompson《The
ChatGPT
Prompt
Book》图:微软Bing+ChatGPT浏览器界面,整合搜索功能ChatGPT+搜索引擎,实现全面+整合ChatGPT加上搜索引擎或能解决其目前的知识融合、事实校验问题。近日,微软已宣布正式将ChatGPT引入必应,发布基于ChatGPT的Bing搜索和基于
AI的
Edge浏览器功能。据Apptopia数据统计,新必应上线后短短两天,其在苹果iOS端的排名从原来的第142位上升到了第4位,当天下载量直接破10万。ChatGPT+其他AIGC,实现图文并茂在AIGC应用中,可以探索ChatGPT与其他功能AIGC的组合,能否更好的结合创造出一些复合模型或者全新的文本生成模型出来,比如结合OpenAI旗下的DALL-E2。来自斯坦福大学计算机科学系的博士生EricZelikman
就利用ChatGPT生成故事以及插图描述,再由DALLE-2生成绘画制作出了一本绘本。图:用Open
AI旗下DALL-E2+ChatGPT制作出绘本ChatGPT+prompt库,实现高效工具通过多次、多角度地提问,和ChatGPT打配合,获得好的指令(prompt)库。未来ChatGPT大规模被应用后,“针对某个问题的多角度提问”成为一个很重要的技能点。AlanD.Thompson在《TheChatGPTPromptBook》中提到27种ChatGPT的功能指令,其中包含可通过修改prompt获得ChatGPT绘制的表格等。图:ChatGPT的prompt库,深度挖掘ChatGPT功能全球E级超算时代,ChatGPT引爆算力需求,30年全球超算规模将达0.2ZFlops14微软投资10亿美金打造OpenAI超算平台,性能位居全球前五,ChatGPT的模型训练和产品运营将带来更大的算力需求。2020年5月,微软投资10亿美金与OpenAI独家合作打造了Azure
Al超篡平台亮相,性能位居全球前五,拥有超过28.5万个CPU核心、1万个GPU、每GPU拥有400Gbps网络带宽的超级计算机,主要用于大规模分布式Al模型训练。未来随着ChatGPT的日常运营和模型训练需求增多,将进一步带来更大的算力需求。超算产业步伐不断加快,超算性能近乎保持着指数级的增长速度,预计2030年全球超算算力规模将达0.2ZFlops,全球E级计算时代已至。AI时代算力需求发展远超摩尔定律,根据中国信息通信研究院测算,2021年全球超算算力规模(换算为FP32(单精度浮点数))为14EFlops,预测到2030年全球超算算力将达到0.2ZFlops,平均年增速超过34%。2022年11月TOP500榜单发布的数据显示,全球排名前10的超级计算机当中,有5个来自美国,有2个来自中国其余3个来自芬兰、日本和意大利。美国橡树岭国家实验室(ORNL)的超级计算机Frontier以1.102
EFlop/s(每秒百亿亿次超级计算机)的性能位列榜首,超越日本的Fugaku,成为全球首个公开确认的百亿亿次超级计算机,全球超级计算机正式进入E级计算时代。需求多元化加速算力升级,超算设备厂商纷纷加快产业化步伐,整机方面,联想以32%的占比成为超算制造商龙头,芯片方面,超算CPU以英特尔和AMD为主。整机方面,TOP500榜单中,联想是上榜数量最多的超算制造商,占比32.2%,HPE、浪潮、Atos、曙光分别位列2到5位,占比分别为19.2%、10%、9.4%和7.2%。芯片方面,超算CPU以英特尔和AMD为主,TOP500榜单上占比超过96%(英特尔388台,AMD93台)。此外异构计算芯片应用越来越多,TOP500榜单上共有168台超级计算机使用了加速器/协同处理器技术,其中英伟达和AMD芯片占比超96%(英伟达154
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全新2025年度活动纪录片拍摄与制作合同3篇
- 2024综合岗位劳动协议模板版B版
- 2024年版城市出租车租赁协议样式版B版
- 2025年消防安全管理咨询及标准制定合同2篇
- 2024-2025学年高中历史第七单元复杂多样的当代世界第24课两极对峙格局的形成学案含解析岳麓版必修1
- 2024-2025学年高中语文课时分层作业4归去来兮辞并序含解析新人教版必修5
- 二零二四年度时尚传媒广告投放及制作合同
- 2025年度道路照明灯具批发合同范本3篇
- 2025年酒店客房销售渠道建设与维护合同3篇
- 2025年度绿色生态农业种植承包合同范本3篇
- 2024年桂林中考物理试卷
- DL∕T 5362-2018 水工沥青混凝土试验规程
- (正式版)JC∕T 60023-2024 石膏条板应用技术规程
- DL-T5054-2016火力发电厂汽水管道设计规范
- (权变)领导行为理论
- 2024届上海市浦东新区高三二模英语卷
- 家用电器可靠性与寿命预测研究
- 中考语文二轮复习:诗歌鉴赏系列之边塞军旅诗(知识点+方法+习题)
- 2024年智慧工地相关知识考试试题及答案
- 五年级上册脱式计算练习300题及答案
- 健康产业园策划方案
评论
0/150
提交评论