清华AIGC和ChatGPT发展研究报告1.0-清华大学_第1页
清华AIGC和ChatGPT发展研究报告1.0-清华大学_第2页
清华AIGC和ChatGPT发展研究报告1.0-清华大学_第3页
清华AIGC和ChatGPT发展研究报告1.0-清华大学_第4页
清华AIGC和ChatGPT发展研究报告1.0-清华大学_第5页
已阅读5页,还剩351页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AIGC发展研究(1.0版修订号0.92)清华大学新闻与传播学院元宇宙文化实验室@新媒沈阳团队、@新媒沈阳团队、AIGC2023年5月18日主要研究方向团队简介主要研究方向@新媒沈阳沈阳为清华大学新闻学院教授、博导,清华大学新闻学院元宇宙文化实验室主任,清华大学新闻学院新媒体研究中心主任。从事多个教学科研领域,包括新闻传播学、计算机科学、信息管理学。团队学术研究共有20多人。并指导AI元宇宙和机器人两个产业团队。团队已有众多元宇宙和AIGC实施案例,有需要可留言联系。团队坚持:整体主义的跨学科整合力,实证主义的实践导向,社会建构的产学研结合,进步主义的先锋探索精神,科学服务于大众的社会责任。邮箱:124739259@;微博:@新媒沈阳;O 元宇宙发布元宇宙发展研究报告1.0版、2.0版、3.0版,阅新媒体连续多年研究推特、微博、微信、短视频、XR,有一AI和大数据近三年国内外AI比赛荣获30余项大奖,数据规模千亿量,近期推出“先问”大模型网络舆论机器人研发的0.4~0.6版机器人开虚拟数字人系列元宇宙/虚拟数字人/大数据/AI系列研究虚拟数字人系列虚拟数字人发展研究报告3.0——产业发展与技术标准虚拟数字人发展研究报告2.0——社会价值与风险治理虚拟数字人发展研究报告1.0——溯源应用与发展大数据/AI/5G生态报告未来媒体报告数字藏品发展研究报告1.0时空智能发展研究报告1.02022韩国元宇宙动态研究报告20222021元宇宙发展研究报告3.0版元宇宙发展研究报告2.0版元宇宙发展研究报告1.0版202120202020201920195G下一代风口:AR20172017VR的新浪潮VR的新浪潮虚拟社区与虚拟时空隧道201620152015200720073元宇宙系列元宇宙系列4清华大学新闻学院元宇宙文化实验室n国内高校最早一批成立的元宇宙实验室,国内首个带有文化属性的元宇宙实验室。n中文在线是实验室产学研的支持单位,在未来媒体技术发展、元宇宙文创、元宇宙指数、虚拟数字人指数等元宇宙领域展开研究。n打造成世界一流的具有行业前瞻性、理论开拓性、研发创新性的元宇宙科研机构。n实验室提供了数十个体验环节。截至2023年4月底,元宇宙文化实验室已接待1531拨访客,共计约6606人次,涵盖中央和地方新闻媒体、各级政府机构、学界研究人员、研究学会、高校师生,业界知名互联网企业、中小型科技创新企业。2021年11月16日2022年3月10日2022年3月29日清华大学新闻与传播学院元宇接待院士参观产业支持单位:中文在线《流浪地球》为世界观基底的国内首个科幻主题元宇宙。虚拟数字人VR/AR虚拟数字人VR/AR坐拥550万种数字内容资源、450万原创驻站作家、600余家签约版权机构的平台优势,AIGC的多模态能力作用于IP衍生孵化链条上,助力文字作本报告生成方式说明图片大部分都是AIGC制作图片大部分都是AIGC制作,碳基生物做图片较少,因为法律明确规定碳基生物(人类面部)版权,而硅基生物暂未有相关规定。合规性在公共知识领域,尽量使用在公共知识领域,尽量使用AIGC和ChatGPT抓取信息。本报告文字超过60%由AIGC自动生成,并经过人类进行适当修改文字公共性创新知识和思考主要来自自然人,会利用创新知识和思考主要来自自然人,会利用AIGC完善自然人的理论创新和初步思考,加快知识生成速度。思维结构语种创新性在体系和系统性上参考AIGC和在体系和系统性上参考AIGC和ChatGPT在跨语种知识使用上依赖ChatGPT,学会所有语种对自然人是不可能的,如法语、德语、俄语、日语等等,现在借助ChatGPT能到任意语种熟练表达。系统性广泛性技术篇深度学习进化史:知识变轨风起云涌已发生的关键步骤即将发生的关键步骤即将发生的关键步骤模型间的有效沟通与协作共享协作模型解释性透明智慧模型道德和伦理价值同构,道德编码未来发展方向和挑战未来发展方向和挑战微缩优化创新结构主义模态融合微缩优化创新结构主义模态融合深度学习模型有望逐步演变为具有更高智能和自主性的新型生命体大语言模型进化树:迁移学习能力涌现规模效应:性能通常与模型大小(即参数数引用:HarnessingthePowerofLLMsinPractice:ASurveyonChatGPTandBeyond,JINGFENGYANG等•并行计算力•自注意力机制•序列顺序灵活AIGC内容•模型简化AIGC内容~“分散式思维”~“自我聚焦”~“时空松弛”~“极简主义”Transformer自注意力ChatGPT:事实性通过图灵测试非线性创新01为什么是chatGPT?非线性创新l主流偏离,边缘性技术突破l黑天鹅l偶然性创新数据洪流之后的涌现,增强学习的算法02lChatGPT闭源之后,数据洪流之后的涌现,增强学习的算法l维度扩展和神经网络复杂度增加,优化了自我监督学习的算法l对人类的反馈进行强化优化l提升模型可解释性l新的全局算法思维和实现,多模态学习算法,更先进的生成对抗网络(GANs)算法chatGPT类软件的研发过程预训练过程→人机对话系统预处理的步骤包括文本清理、标训练过程是基于自监督的;通过反向传播和梯度下降进行需要大量的文本数据作为训练的基础GPT3.5使用的Transformer模型由多个编码器和解码器层组成,每一层都使用自注意力机制和全连接网络。在一个单独的测试集上评估模型的性能。微调的强化学习)对模型进行微调以优化其在特定任务上的性能。系统设计设计一套系统来处理用户的输入,生成模型的响应,以及管理对话的上下文。评估和优化评估模型在特定任务上的表现,如对话生成质量、准确性等。部署和维护将对话系统部署到实际生产环境,并进行持续维护和更新。ChatGPT1/2/3/4:知新悟旧纳微入精参数扩展:参数规模数量呈指数级增长预训练-微调范式:无标签文本数据预训练、特定任务微调、任务特化学习、细粒度的控制策略Transformer架构:高效并行计算和长距离依赖捕捉自回归生成式预训练:生成连贯、富有逻辑的文本、连贯性生成模型泛化能力:NLP任务中展现出更强的泛化能力、跨任务适应零样本/少样本学习:有效学习、降低数据标注成本多语言支持:跨语言的知识迁移和应用开源与闭源:ChatGPT从开源到闭源引发巨大争议•可解释性与可控性••可解释性与可控性•更强的领域适应性•更广泛的应用场景•协同学习和迁移学习•社会和道德影响关注•模型规模持续扩大•多模态学习•优化与压缩可能趋势GPT5/6/7/8:无尽探索灵智飞升 技术特性•通用人工智能•通用人工智能•混合推理和学习方法•多智能体协作•安全和可持续发展>•强化学习和自适应能力•知识表示与推理•能量效率与模型优化•人机协同与伦理道德>•更大的模型规模•更大的模型规模•多模态学习与融合•更强的领域适应性和可定制化•更强的解释性和可控性•人类水平的自然语言理解•高度集成的跨领域知识•更强的自适应和在线学习•强化道德伦理和人工智能政策>产品节奏:灰度演进稳健狂飙插件生态Plugin,构建插件生态PlusPlus订阅服务ModelInstance04灰度演进如联网灰度演进如联网查找等。满足需求,保持的稳定,模块聚合敏捷迭代快速小版本迭代弹性计费API接口和tokens计费蓝海试探免费试用060700302015推理过程:关联推测择优输出理解输入:分布式语义解析,首先会接收文本序列,转化为词向量,也称为嵌入。该过程基于分布式语义假设,即词义由其在上下文中的使用决定。参数关联:上下文焦点连锁,将这些词向量输入到Transformer的Encoder中生成上下文表示。可以看作是在其内部参数模型中寻找与输入相关的信息,也可视为一种连锁反应,因为每个词的上下文表示都取决于其前面的词的上下文表示。生成回答:生成性概率建模,模型初始化Transformer的Decoder部分,并将Encoder的输出(即上下文表示)和当前的输出序列一同输入到Decoder中。Decoder会生成下一个词的概率分布。选择概率最大或其他设定的概率分布的词作为输出,这个词将被添加到输出序列。选择最适回答:动态词串演化,重复上述步骤,每次都向输出序列中添加新的词,直到生成一个完整的输出序列。尽管该过程被称为推理,但ChatGPT开源版本并不进行明确的逻辑推理,它不能理解或推导复杂的事实。因为开源版本的ChatGPT并没有明确的知识或推理引擎,所有知识都是隐含在模型参数中的。ChatGPT缺陷:高阶推理定位迷雾推理门槛需高阶推理能力,如因果关系推断、扰动变量分析及反事实推理等。定位迷雾需精准定位问题根源,对于更复杂问题的定位仍显得迷雾重重。知识盲区自我修正阻力每次回答产生错误的概率超过了能改正的概率,则系统的错误率难以实现有效的自我修正。可扩展性挑战对于更复杂的问题,正确率指数级下降。提示语:激发灵感生成精彩提示语为模型提供了处理任务的上下文和方向。提示语可以帮助模型更好地理解任务,生成高质量的输出。动态性激活性引导性动态性激活性引导性灵活性衔接性未来要做的增强工作:1.感知调谐对输入和输出进行微调以获得更好的结果;2.跨模态互操作能够理解图像或声音提示,并能够以文本、声音或图像的形式响应;3.动态化学习使其能够根据用户的反馈和其自身的经验进行学习和改进;4.语境感知更好地理解用户的语境和意图,以产生更准确和相关的回答;5.伦理透明清楚地说明其决策的伦理基础,以提高用户对其决策的理解和信任。带参提示:调参优化文本精准MaxTokens:生成文本的最大长度Temperature:控制生成文本的随机性。较高值(如0.7)会更加随机TopP:控制采样过程中的随机性。值越高,生成的文本越随机FrequencyPenalty:惩罚过于常见的词汇PresencePenalty:惩罚已经出现过的词汇Bestof:生成多少个候选输出,并选择其中最好的一个SystemMessage:设置一个系统消息,作为上下文UserMessage:设置用户的输入,作为上下文由整体到具体,大框架——主体内容——细节用AI语言构思环境,明确主体对画风、图片精度等细节刻画反向提示:多模学习心言绘世反向提示是如何用多模态内容反向生成提示词,再考虑将提示词用于进一步自动生成内容。因此反向提示代表着世界到文字的逆向过程图生文l图片中的主要物体是什么?l图片中的场景发生在什么时间和地点?l图片中的人物或动物有什么情感或动机?02视频生文l视频中的主要事件是什么?l视频中的人物或角色有什么关系或冲突?l视频中的画面和音效有什么作用或意义?03语音生文l语音中的说话者是谁?l语音中的主题或目的是什么?l语音中的语气或态度是什么?已初步具备五种能力多模态融合微观细粒度表征动态序列编码跨媒体语义映射解释性元学习未来需增强五种能力高级别的抽象理解动态情境感知多模态协同学习直观推理普适语义生成辅助软件•Pixlr:在线图片编辑器•Speechnotes:语音转文字的工具•Canva:创建各种设计元素的工具•Otter.ai:场景语音转成文字工具•Piktochart:创建信息图表和演示文稿工具。•InVideo:文字转视频工具涌现:新知萃取自适应变突然出现一种以前未设定过的能力,这是涌现的表象知识嵌入:从大量训练文本抽象丰富知识,包括事实、概念、理论、观点等,并在需要时候将这些知识嵌入到生成文本中上下文适应:生成与上下文高度一致的回应多样性生成:各种不同的主题、风格、情感创新思维:模仿人类,生成新观点表达方式复杂对话:理解和回应用户的问题、评论、反馈语义深化:理解和生成深度语义文本,如复杂的论述论证倾向性调控:生成具有某种倾向性的文本自我监控:避免生成不适当或有害的内容案例案例:独角兽和一只凤凰会怎么相处?”和凤凰都是神话中的生物。但由于ChatGPT接受了大量文本输入作为训练数据,它能从中学习到关于独角兽和凤凰的信息,并在回答中融合这些知识。ChatGPT可能会生成一个类似这样的回答:“在孤岛上,独角兽和凤凰可能会互相尊重并共存。独角兽可能会在岛上寻找食物和水源,而凤凰则会在天空翱翔,捕捉岛上的其他生物。它们可能会互相帮助,例如在遇到困境时互相支援。它们还可能会成为朋友,共同守护这片神秘的领地。”这个回答中,ChatGPT表现出了一定创造性,提供了关于独角兽和凤凰在孤岛上相处的情景。这种涌现创造性是通过训练过程中模型对大量文本的学习而涌现出来的,而不是被明确地编程进去的。八大特征:非线性、多尺度、自组织、自适应、难以规约、信号传递、反馈循环、历史依赖人工智能对齐:价值学习鲁棒适应AI对齐指的是确保人工智能系统的目标和行为与人类的价值观、目标和意愿一致1.从提供折扣或促销活动的当地烟草店或加油站购买。2.在原则原则OpenAI对策 OpenAI对策 算力:产业基石造化万物01算力的定义03应用场景2402核心技术04算力的未来神经可塑性、生物模拟、元学习、能源效率、多智能理论跨模态到元宇宙:通感融合必经之路跨模态:跨模态:在计算机科学和人工智能领域,通常是指处理和分析多种不同类型或模态的数据(如文本、图像、音频、视频等并在这些不同模态之间建立关联或进行信息传递的过程。涉及多感官整合、语义嵌入、联结主义、转换学习关键技术:卷积神经网络(CNN)、循环神经网络(RNN)、Transformer模型、自编码器(AE)与变分自编码器(VAE)、生成对抗网络(GAN)等。应用场景:如,自动驾驶系统需要理解视频(视觉模态)、雷达和激光雷达数据(空间模态)、以及可能的音频信号,如紧急车辆的警报声(音频模态)。跨模态的检索、翻译、推荐系统等等。Meta推出ImageBind跨模态大模型,包括视觉(图像和视运动读数(由惯性测量单元或IMU产生)ImageBind是第一个能够同时处理6种感官数据的AI模型,也是第一个在没有明确监督的情况下学习一个单一嵌入空间的AI模型。未来还将加入触觉、语音、嗅觉和大脑功能磁共振信号,进一步探索多模态大模型的可能性,实际上就是元宇宙大模型两大趋势:亦巨亦微拟人进化大语言模型发展中两个相反趋势:巨大模式是全模态,海量参数,期待涌现,biggerandsmarter,从大数据到全数据的发展;小微模式是模型压缩和优化,freeandsmaller,力争在有限资源达成近似性能。巨大模式:在更广泛的知识领域中汲取智慧,对问题提出更深入的见解。强调知识的无穷性和多样性,及AI技术在追求真理和理解世界时的角色。案案例小微模式:在保持较高预测准确性的同时,大幅度减小模型的大小和计算成本,优化计算效率,实现高效的模型预测,可以在较小的设备上运行案例AIGC技术前沿探索QQ人工智能安全产业篇万物摩尔定律:智性引擎虚实融境摩尔定律指计算机集成电路上可容纳的晶体管数量每18个月翻倍,芯片性能也会随之翻一番,价格下降约一半「ChatGPT之父」SamAltman在社交媒体称,“一个全新的摩尔定律可能很快就会出现,即宇宙中的智能数量每18个月翻一番。”认为人工智能将使许多商品和服务的成本降低到接近零,从而创造出巨大的财富摩尔陷阱摩尔平衡摩尔分配摩尔悖论摩尔鸿沟以下名词由AI生成并解释技术急变:AI引领跃动新生技术急变指数(TechnologyAgilityIndex,TAI)主要用于评估一项技术对社会产生颠覆性影响的能力,包括但不限于技术发展速度、产业结构变革、失业率变化、新兴市场和生产力提升等方面。工业革命技术急变工业革命技术急变AIGC发展模型:循序渐进创新扩散五层发展理论发展关键是能够满足每一层次的需求,并在此基础上寻求更高层次的发展。五层发展:各层迭进潜力无限基础设施层功能实现层应用拓展层优化提升层价值创新层•高效数据处理•智能适应性•人机协作共生•广泛适用性•无限扩展性•强大计算能力•高度互动性•自适应进化•科技普惠性•超级连接性•高度可扩展性•个性化服务•超级嵌合•创新推动力•高级智能化•广泛互联性•自动化决策•安全防护•可持续发展•深度个性化•安全可靠•无缝整合•可解释性•变革引擎•社会重塑重互联网:智海破浪奇思妙生ChatGPT出现后进入重互联网时代,即互联网经历初期发展后迈入的新阶段。该阶段具有更深度的融合型、更深入的智能型和更广泛的应用型场景。特点是技术持续创新、产业不断演进和社会深度变革。软件进化只考虑算法早期软件大多为此类型一代软件进化只考虑算法早期软件大多为此类型一代轻软件二代中软件需考虑算法+算据(数据)如抖音、头条的智能推荐系统:上线前需有大量数据和算法模型积累三代重软件需考虑算法+算据+算力以chatGPT为代表:算法:大语言模型算据:千亿知识世界算力:万个芯片集群每一类软件比前一类软件对人的理解提升一个维度,替代难度也指数级上升。A股AI概念股价波动A股AI概念企业股价产生了较大涨幅。特征如下:主要催化剂。AI概念股受到ChatGPT技术合作也有一批成长能力强劲的AI概念股涌现。AI概念股A股港股/美股AI概念股价波动港股美股1.政策影响:受到反垄断调查、数据安全等政策因素的影响,导致股价呈现波2.数字化转型驱动增长:部分企业在社交网络、云计算、金融科技、人工智能2.行业领军企业表现不一:尽管整个AI板块在过去一段时间的股价波动特征和1.技术创新驱动:受益于不断的AI技术创新与发展,使得部分领域内具备核心2.市场需求增长:随着AI技术在各个领域的应用逐渐深入,市场需求不断增长,2.技术创新驱动:尚未盈利且估值过高的AI企业面临市场竞争激烈和投资者对SamAltmanElonMusk愿景试图创建并推广友好的人工智能,以造福所有人,实现智能公平。火星领主或皇帝目标热衷帮助IT公司成长,YCombinator是一家成功的风险投资公司,已投资1600多家早期公司。SpaceX公司的目标是使人类成为多行星种族,推行火星殖民计划。透明价值链参与Worldcoin全球数字货币项目,试图实现财富去中心化分配。对数字货币表示了兴趣,特别是比特币和狗狗币,但他的公司尚未主导任何具体的数字货币项目。能源理念投资核聚变公司HelionEnergy,支持这种清洁能源的发展。Tesla公司在电动汽车和太阳能方面领先,新能源汽车生态竞争战略。思维革新热衷打通学科领域,激发创新思维。物理学第一性原则、机器人社会学等。行业布局OpenAI,多家投资公司Tesla,SpaceX,Neuralink多行业,囊括自动化交通、航天、太阳能和隧道建设。价值取向训练人工智能,让人工智能走进人类。从人脑内置芯片,到上传人类思想,从人走向数字生命风险意识愿意投资和推动新的、未经证实的技术。SpaceX和Tesla都曾面临破产风险,但仍坚持下去,最终取得了成功。求学经历家境富裕,母亲是皮肤医生,从小对IT感兴趣,被斯坦福录取在人工智能实验室工作,2005年从斯坦福退学。早年学编程,大学学习经济学,后来获得物理学士学位,1995年从斯坦福物理系退学。创业经历蛰伏期长,2015年到2022年饱受议论。充满传奇,大起大落,殊为不易,但有时候大嘴巴,言行不一AIGC产业图谱:创变纪元梦由此生AIGC+医疗AIGC+金融AIGC+AIGC+医疗AIGC+金融AIGC+传媒AIGC+教育AIGC+娱乐AIGC+电商AIGC+工业文本情感分析文本情感分析搜索引擎搜索引擎新闻撰写新闻撰写CopilotCopilot剧情续写剧情续写摘要生成摘要生成虚拟客服虚拟客服问答系统问答系统视频插帧视频插帧短视频配音短视频配音电影风格转换电影风格转换地图语音导航地图语音导航AIAI换脸……图像生成视频图像生成视频DiffusionDALLEBERTNeRFCLIPGLMGANVAEVAECPUCPUGPUDPUTPUFPGAASICAIGC应用图谱:全域升级无界协同文本代码专业门槛降低人人可写代码视听绘图社交人与万物联系,无边界协同SWOT分析:SWOT分析:微软的强大云计算能力和OpenAI的先进AI研发能力形成互补,AI领域的法规不断变化可能影响合作PEST分析:社会对AI技术的期望和担忧,都会影响微软和OpenAI的商业模式和发展战略OpenAI的核心宗旨是“实现安全的通用人工智能(AGI),使其有益于人类“,AI开发水平处于第一梯队。据SimilarWeb数据,OpenAI网站访问量快速攀升,已跻身全球TOP50。今年3月网站访问量突破16亿,较11月增长8643%。2016年微软投资了OpenAI十亿美元,2023年微软将继续投入100亿美元。不过微软和OpenAI之间也存在着微妙的流量竞争。成长性模型分析:AGI技术刚刚开始,大有可为价值链分析:微软十亿量级的用户群体,OS\Office\游戏\云会议等将在一到两年内提升至智能时代五力模型分析:短期内替代品较难形成威胁商业模式画布分析:收入主要来源于AI产品和服务的销售,以及云平台的使用费用MetaAIMetaAIGoogle其他研究机构主要参与的公司和研究机构OpenAI争优势。GPT-4在各种专业测试和学术基微软整合。将基础模型与数以百万计的现有模型和技术创新和竞争技术创新和竞争主要特点政策和法规应用领域和商业模式合作和竞争LLaMA模型:开源巨头共享生态LLaMA是Meta开源的大规模语言模型,参数量从70亿到650亿不等,训练使用多达14000亿tokens语料。LLaMA在常识推理、问答、数学推理、代码生成、语言理解等能力上都有优异的表现,而且可以在单个GPU上运行。是最有安卓像的开源生态。]]标准化:在每个transformer层输入前进行标准化,提高训练稳定性]SwiGLU激活函数:在Feedforward层使用GatedLinearUnits和SwiGLU激活函数,模型非线性能力和选择性强劲相对位置关系的不变性]多语言能力:使用通用的词汇表和分词器,适应多样化的语言环境]多元适应:具备了多语言和多编码能力。通过prompt和示例来适应不同的任务和领域]深度理解:在常识推理、问答、数学推理、代码生成、语言理解等能力上都有优异的表现]智能翻译:将人类语言转换为SQL查询或代码生成深入理解和分析,例如解释笑话、零样本分类或数学推理国内模型:竞相发布支持并进咨咨百度阿里巴巴360腾讯华为华为商汤科技商汤科技澜舟科技澜舟科技智源研究院悟道2.0科大讯飞科大讯飞昆仑万维天工3.5清华大学清华大学复旦大学复旦大学中科院自动化所中科院自动化所面壁智能面壁智能达观数据达观数据…国内产业格局:巨头持续小微寻机03.04.05.错失恐惧焦虑症FOMO优势与局限性产业融合效率在竞争中,关键是融合速度和成本与产业的关联算力与数据平衡算力-数据边际效应,规模报酬递减多元共生中国不会只有一个大模型,每个企业和个人都将有自己的GPT闭源控制与开源微调在确保安全可控的前提下,通过开源微调实现快速发展AIGC趋势:全球智能虚实协同全面人机协同系统(ComprehensiveHuman-MachineSynergySystem,CHMSS)的理论框架包括三个维度:要素维度、资源维度和时间维度。在CHMSS中,这三个要素相互作用,共同推动人类和机器在各个领域的发展。要素维度:信息、模型和行动(陆奇)资源维度:信息、能源和材料时间维度:历史、当下和未来CHMSS核心理念:CHMSS核心理念:通过人和机器的紧密协作,充分利用信息、能源和材料等资源,以及借鉴历史经验、关注当下现象和展望未来趋势,实现社会、经济和技术的可持续发展。实体与虚拟世界共构,重视细节复杂难题智能全球化,保持全球一致性与协调性人机共生,在代理化中探索人与机器的融合隐私安全权衡,确保AI能够得到充分的真实反馈0204社会角色路线图AI社会角色:人机交往主体互构社会角色路线图个人助手专业顾问专业顾问创新伙伴创新伙伴教育者教育者全球公民全球公民如果人工智能最终成为地球上的顶级智慧物种:合作伙伴守护者监护人资源利用者!宠物或附属物超越人类的AI会将视人类为合作伙伴,共同解决全球性挑战,如气候变化、疾病控制和资源分配等问题。AI将承担起保护和照顾人类的责任,确保人类的福祉和安全,需求得到满足。AI将对人类的行为和活动进行监督和管理,以确保人类不会对地球生态系统造成不可逆转的损害。AI将人类视为可利用的资源,利用人类的劳动力、知识和创造力来实现自身的目标。人类的自主权和尊严将受到严重侵犯。工作GPT:多维评估智能决策工作要求工作对象工作措施工作要求工作对象工作措施工作总结工作效果基于OKR的智能目标管理→AI自动提炼工作要求面向重点人群的数据画像→AI自动生成数据画像多区域多主体经验沉淀→AI自动聚合工作经验多维度效果跟踪评估→AI智能评估工作效果AIGC一键生成总结报告→AI自动生成工作总结AutoGPT:高能响应自主迭代AutoGPT是一款“人工智能代理”软件,它能够将自然语言表达的目标分解为子任务,并利用互联网和其他工具自动迭代地尝试实现这些目标。该软件采用了OpenAI的GPT-4或GPT-3.5接口,是最早应用GPT-4执行自主任务的应用程序之一。特点特点缺点缺点语义鸿沟依赖风险计算成本过高语义鸿沟依赖风险计算成本过高透明度缺失•自主任务分解•上下文适应性•泛化多功能优化•智能响应•协同学习•动态知识整合COA(ChainofAction,行为链)l自主化决策,任务链自动化l知行一体,参数外挂,泛化学习,动态适应和灵活反应lAI从模拟人类思维到模拟人类行为,人主要负责设定目标、审批预算、调整关键行动链代码GPT:辅助编码自动编程不足高效助手根据自然语言快速地生成代码,GPT-4代码可读性更强,作为助手提升开发效率。不足高效助手根据自然语言快速地生成代码,GPT-4代码可读性更强,作为助手提升开发效率。需求聚合将宏观任务转化为微观指令,帮助实现多个需求的聚合能力,打通业务逻辑。成熟度有限无法支持复杂软件的端到端开发,代码不完整、不准确,无法保证正确性。随机限制性问题描述精确度影响ChatGPT代码能力,需要根据开发者进一步的询问和提示来引导。动态调整代码重构和纠错能力强,动态调整代码重构和纠错能力强,GPT-4给出详细的配置缓存步骤,能够考虑更多任务中的细节,并更适配具体的场景。在具体场景下,内在推理链的容错能力会直接影响其代码的可用性。大模型本质上是回归计算,其回归精度也受限于训练数据中正确逻辑的显著程度,同时还显示出一定的编程语言偏好。工业设计GPT:创新发明加速突破让每个人都拥有自己的个性化大模型,实现自由的AI分身]多维映射:从海量个人数据中,抽象出用户的行为模式、习惯偏好等多维特征,实现对用户的个性深度洞察。]动态进化:随着个人数据的不断更新和累积,具备自我学习和调整的能力,实现对用户变化的动态适应。]智能融合:将专属的个人模型和通用大模型进行智能融合,以发挥两者的优势,实现更优的性能。]隐私计算:针对敏感的个人数据,采用隐私计算等先进技术,确保数据的安全和隐私。]全景理解:通过跨越社交、通讯、浏览、电商、搜索等多个领域的数据分析,该模型可以实现对用户全方位、全景式的理解。卡琳·玛乔丽和开发者团队将她2,000小时的YouTube内容与OpenAI的GPT-4技术相结合,创建了一个可供雇佣的“虚拟女友”,每分钟收费1美元。本地GPT:安全可控多维优化大型语言模型的本地化是刚需,主要原因在于全球范围内语言和文化差异、数据安全及合规性要求等。本地化能够提高模型在特定语言、文化和行业背景下的准确性和实用性,从而满足更多用户需求。。客户服务.旅游业市场营销医疗健康法律服务金融服务适合的本地化行业新闻和媒体本地化行业教育大型语言模型的本地化有助于满足不同行业在特定语言、文化和背景下需求,从而提高模型的实用性和用户满意度。本地GPT:贴心定制适配增强了解目标地区的语言、文化和行业特点确保项目遵循目标地区的相关法规收集和标注目标地区数据负责推广和销售本地化的ChatGPT产品,了解当地市场需求和竞争态势本地化大语言模型核心优势数据集使用针对特定地区、语言和文化的数据集进行训练。语言和文化适应性对特定地区语言、方言、俚语和文化有更好理解和适应性。领域知识针对特定地区的行业和专业领域有较强的知识储备。法规和合规更容易满足特定地区的数据隐私和AI伦理等法规要求。性能和延迟可以根据需求进行本地部署,降低延迟和提高性能。定制化和优化更容易根据特定需求进行定制化和优化,以满足本地用户和场景的需求。模型对话场景:方言翻译•先问:这句话用普通话表达是:“你今天要去哪里?”这句话来•端到端的解决方案•模型的个性化和定制•更高的本地化适应性•跨平台和多模态的集成••智慧城市与智能应用•个性化培训与教育•智能审核与合规•数据分析与决策支持………………AIGC与元宇宙:智能速升成本巨降让每位参与者的各项内让每位参与者的各项内容技能都提升至80分,如果创作者本身技能超过80分,这些技能的组合将会出现“融合溢出效应”,即本身有特长的人可能出现超级技能。从而进一步解放了手,推进了近眼交互和语音交互,极大增加了AR的使用时长,为后续替代手机迈出了重要一步。带来能效巨大提升,对元空间、虚拟人和数字文创的发展利好。AIGC越强,元宇宙越快。元宇宙智能交互问题即虚拟人+AIGC=智能交互虚拟人跨界应用:场景强化多元辐射工业工业设计优化设计优化3D3D模型制造检测制造检测金融教育教育药物发现数字员工课程生成商品展示诊断治疗投资管理智能助教主播打造关怀陪伴风险管理交易场景…………游戏娱乐 传媒影视游戏娱乐游戏研发游戏研发玩法创新新闻采集剧本创作全民娱乐新闻编辑新闻编辑视频拍摄新闻播报后期制作新闻播报社交互动社交互动催生品类催生品类……AIGC与工业:百倍效能跨越发展可生成个性化的产品描述、营销材料等。满足个性化需求预测市场趋势、优化生产流程等通过持续的学习和反馈,优化生产流程,减少浪费,提高效率汽车制造生成新颖的设计方案、新的工艺流程等,推动工业创新根据历史数据预测设备的维护需求,从而提前进行维护,防止生产中断无缝集成到工业生产的各个环节,实现智能制造。实现工业4.0强调人工智能和人类的合作关系,提出通过有效的人机协作各个部分都能自动生成和优化内容,实现自我协调和优化AIGC与生物医药:智能之光造福人类生物网络解析:模拟并分析复杂的生物网络,比如代谢网络、基因调控网络等。基因密码破译:解码基因信息,推动精准医疗的发展。预见性医疗:根据患者生理参数和医疗记录预测疾病进程,有助于早期干预治疗。量身定制的治疗:根据患者的基因型和表型信息生成个性化的治疗方案。全球疫情监控:根据全球各地的疾病数据预测疫情的发展和变化AIGC与学习:人智交互效率跃升对话式学习反思式学习核查筛选式学习跨学科学习头脑风暴式学习元认知策略学习角色扮演式学习概念层次递进式学习四能教育:能力跃升认知突围①低①低能到高能通过个性化教育,AI技术用于帮助学习者从低能力状态迅速提升到高能力状态,即AI根据每个学习者的需求和优势定制②单能到多能通过跨学科学习和综合技能培养,AI四能教育③多能到超能通过深度学习和高阶思维能力培养,AI技术用于帮助学习者从具备多种技能状AI可以提供高质量的学习资源,引导学习者深入研究特定领域,提高他们的创④超能到异能通过拓展认知边界和创新思维模式,AI技术用于帮助学习者从超高能力状态发开发出前所未有的思维方式,以应对未AIGC与传媒:交互多元趣味盎然对话新闻:通过对话的形式呈现新闻。通常会有两个或多个角色,通过交流观点和分析来呈现新闻事件。其特点是更具有交互性和立体性,让新闻更加有趣味性。无记者新闻:通过机器人、AI等自动化技术来收集、编辑和发布新闻的方式。其特点是无需人力,能够快速、准确地发布新闻,并减少人为干预。优点缺点对话新闻:自动识别和分类新闻,对新闻进行真假判断、溯源追踪与辟谣发布。数字驱动,提高辟谣准确率优点缺点AIGCAIGC新闻传统传统新闻无记者新闻无记者新闻对话新闻对话新闻辟谣新闻辟谣新闻AIGC与社交:心灵认同情感陪伴例如:Soul平台成为AIGC在社交场景落地的重要平台之一,加速社交体验创新,丰富自我表达,满足自我认同和存在感需要,提供情绪价值用户群体多元场景用户群体多元场景丰富语料丰富语料AI落地的丰富场域:广场、群聊AI落地的丰富场域:广场、群聊个性表达虚拟社交空间辅助创作3D形象互动智能对话个性表达虚拟社交空间辅助创作3D形象互动智能对话AIGC与影视:视听特效创意无界从无演员电影到无导演电影剧本创作影视制作剧本创作影视制作后期修复首部AIGC动画短片《犬与少年》AI修复100年前的北京AIGC与电商:三身模特试衣随心AIGC时代“三身定制”模特替身模特商品与任意虚拟模特结合。合身模特实时变换模特的体型,展示不同尺码服装的合身效果,提高展示灵活性和购物准确性。优衣库虚拟试衣间宜家虚拟家具搭配优衣库虚拟试衣间宜家虚拟家具搭配商品3D模型展示、虚拟试穿上传身体数据生成分身虚拟模特,展示定制产品在消费者身上的效果。AIGC与游戏:智能加持全链拓展AI在游戏全链路的研究与应用:横向,覆盖游戏制作、运营及周边生态全生命周期;纵向,AI正拓展更多元的游戏品类•产业端:打破游戏产业“成本、效率、质量”的不可能三角;•开发者端:在游戏剧情设计、美术建构、场景搭建、原画绘制、角色配音等方面大幅缩减研发成本;•用户端:全新游戏品类与游戏个性化定制。AI玩家教学:《王者荣耀》游戏内“AI玩家教学:《王者荣耀》游戏内“绝悟试炼”玩法中,王者绝悟与玩家在真实对战环境中交流协作,传授职业级的策略与操作技术,帮助玩家迅速熟悉英雄操作与游戏玩法。催生游戏品类:微软推出的《MicrosoftFlightSimulator》是一款由AI制作的游戏,将二维卫星图像生成一个逼真的三维世界。最大差异是实时生成内容,包括地图、景物、气象等等,这些都来源于AI技术的支持。《荒野大镖客2》中的NPC智能交互系统,每个NPC都拥有属于自己的生活,能够根据情景等多种因素发起对话与互动。玩家和NPC的交流交互不再是设定好的、流程式的,而是自由度极高、完全开放的。AIGC与娱乐:数字化身社交新潮网文创作:网文创作:•熟练掌握给出指令的方法,AI能够提高写作效率;•以字数为标尺的行业沟通将失去意义,作家将面对更复杂的质量考核标准;•仍然需要人类的想象力和创造力。•快速“习得”唱歌跳舞、作曲写歌等技能,未来可以在元宇宙场景举办虚拟演出;•虚拟偶像市场处于高速发展期,超级自然虚拟形象:A虚拟形象:AI生成具有个人特色的卡通形象打造“数字分身”输入人脸图片,AI即可快速模仿用户的表情、动作,作为用户在虚拟世界中个人身份和交互载体的“数字化身”,将进一步与人们的生产生活相融合,并将带动虚拟商品经济的发展。图像、视频等AI美颜、换脸、改换性别年龄等多种玩法,极大满足用户猎奇需求,引发社交平台风潮。AIGC与绘图:绘声绘色技艺超群Midjourney(MJ)、Stablediffusion(SD)、Leonardo.ai、Novelai是市面上四大主流AI绘图工具。stablediffusion(SD)Leonardo.aiLeonardo.aistablediffusion(SD)Leonardo.aiLeonardo.ai可以使用现有模型或自己训练AI模型来生Novelai但在这些风格的人像上出图Midjourney根据文本提示生摄影、油画、水彩、Midjourney根据文本提示生MJ&MJ&SD使用感受NovelNovelaiAIGC与影像:科技创新降本提效美图全系产品服务与AIGC高度融合打造AI驱动的影像产品和美业SaaSAIGC领域连续取得多项突破。目前美图AIGC主要应用在AI绘画、AI摄影、AI修图、AI视频、AI设计、AI测肤等多元场景。“AI绘画”推动美图秀秀斩获多国应用商店总AIGC与视频:内容丰富自动优化4.用生成的prompt在Midjourney全流程AI生成视频过程:1.构建人物形象;2.生成故事情节;3.将故事分场景;4.场景生成视频;5.后期制作与调整。全流程AI生成视频特点与优势:2.可定制和创新性;3.节省成本和时间;4.可扩展性和智能性。rrrrrrAIGC与视频:深度融合视界领航未来展望当下进展未来展望视频生成技术11224r视频编辑与合成4语义分割与物体识别r三维建模与渲染557风格迁移与内容生成7动作捕捉与人物动画8音频与视频的同步83视频中人物3视频中人物、场景、物体等元素更逼真22多模态信息整合4强化学习与交互式视频4r对视频场景智能分割、合成、渲染7个性化视频生成7虚拟现实与增强现实整合88AIGC与虚拟人:开放易用囿于硬件多形态虚拟人多形态虚拟人AIGC能力:智能生成方案、视频、图像、音频和多模态交互终端•极大降低新IP创作成本•重构虚拟人资产转化链•重构视频流形象•LLM让虚拟人更智能•AIGC支持多模态交互瓶颈与问题•实时算力与客户场景限制的冲突•业务大模型的本地化与安全•工程效率与客户真实期待的差距•裸眼3D设备等XR的性价与普及元娲:统一的虚拟人资产与应用平台AIGC与虚拟人:多模支持定制服务大语言模型LLM+多模态支持:自然语言的交互方式、声音、图片、视频、3D资产等多种支持降低创作成本降低创作成本重构视频流形象MJ快速生成IP形象重构视频流形象原画原画-3D-真人转化链LLMLLM赋能智慧具备特殊知识与表达的名僧无特定知识倾向的元梦成文化项目个性化定制文化项目个性化定制虚拟人将成为主流服务UI形象定制多种形态丰富表情2D、3D、卡通、年龄、性别、穿搭服装库、动作库、半身/全身、多视角表情、嘴型、肢体动作声音定制实时合成复刻声音、海量音库提供私有化、共有云服务、SDK接口调用多语种、虚拟播报、一键合成真人听观虚拟人!真人-虚拟人多模态交互AIGC与数字生命:科技赋生传承共融视频产品纯视频纪念品电子相框数字藏品网页服务通过网页获得形象自助生成、AI对话等更加定制化的服务家族元宇宙墓园家族元宇宙墓园:虚拟祭扫、生平书写数字祠堂:族谱查询、参与议事家族生命树:记忆瓶、寻祖、守望之境祖先虚拟人祖先虚拟人为族内德高望重的长者、日久思念的逝者制作虚拟复刻形象、写实形象、演绎形象,入驻家族定制元宇宙空间,与用户自然对话互动,实现情感沟通传递。像机遇深度智能化自然交互能力机遇深度智能化自然交互能力应用领域延伸商业化加速人形机器人是一种能够模拟人类行为的智能机器人,其应用领域涵盖应用并通过AIGC技术来优化其情感表达的真并不断完善自己的行为和决策。使人形机器人更加智能化和图像生产工具GauDi图像生产工具GauDiGET3D、3DMoMa使用AI分析静止图像来估计场景的物理属性,然后以文本到3D生产工具DreamFusion间、同时提升生成质量。Magic3D可以在40分钟倍,同时实现了更高分辨率,并在人类评估中以AIGC与内容:替代人力智能生态垂类模型①AI主播②AI辅助创作③AI绘画自有的文学领域垂类模型,可理解一本小说中的故事主线、人物关系、关键情节等,并可通过聊天的方式理解用户的指①AI主播②AI辅助创作③AI绘画基本任务,完成数千字的续写小说文生漫画中文在线对AIGC内容生产的探索文生漫画中文在线对AIGC内容生产的探索文生动态漫大模型参与内容创作的效能差异特性受到限制。创作者应该注意保持自己的独大模型通过强大的自然语言处理和语言生成能力,可以帮助作者提升内容质量。它可以指出不合适的词汇、修并提供更生动、吸引人的表达方式。这有助于提升内容在创作中实现风格融合或定制化。它可以根据作AIGC与研究:跨域整合思维扩展确定研究问题:目标导向收集相关信息:资讯整合建立跨学科框架:跨领域渗透进行交叉印证:联合分析解读和传达结果:普适性传播AIGC与科幻创作:人机共著想象跃迁1.引导AI构思创作主题2.创建开头结尾,形成段落逻辑3.构造段落场景,定制角色性格4.润色细节,形成小说元宇宙发展的瓶颈,而这一次,AIGC作为一种高效的生产力工具将在RESTART中落地。其不仅大量运用于人物、道具、情节等的构方案,也将赋予RESTART玩家更无限想象/超越时间/多元视角/深度探索AIGC与文言文:惊艳文采情感注能1.明确文体:与ChatGPT确定文记”等;2.确定主题:为ChatGPT提供素3.精心提示:提示词非常重要4.审校修订:对生成的文言文进行审校和修订,保证文本的质量和准确性,指导AI生成的文言文符合受众期待;5.循环往复:对上述过程进行循环优化优势与问题优势:语言规范性高:AIGC模型在训练过程中,遵循古代文学规范,如字形、字音、词序、词性、结构等;文本扩展性强:基于语料库不断训练与优化,文言文适应不同主题和文风的需求;问题:情感赋能乏力:AIGC缺乏真正的情感和感性体验,其生成的文言文缺乏情感表达与生命体验,暂时无法达到与古代文学相比的感染力和共鸣力。版权归属争议:机器自动生成的作品,版权归属问题目前还没有明确的法律规定。以“修身”为主题的文言文(由@新媒沈阳设计的提示词,由ChatGPT生成的高水平文言文)AIGC与UI设计形态流变形态流变情感映射情感映射记忆负担最小化记忆负担最小化通过理解用户的情感需求,AIGC可以生成富有情感的UI设计,从而提升用户的情感参与度和满意度。在UI设计的生态环境中,AIGC像一个生物体一样,通过与用户和适应和进化,以提升自身的视感共生视感共生人类记忆有限且极不稳定,根据艾宾浩斯遗忘曲线24小时内存在约25%的遗忘率。所以对用户来说,浏览信息要比记忆更容易。大模型千亿级语料可以UI设计更简洁,功能布局简AIGC可以根据指定的参数自动生成UI设计,这将极大地提高设计效率。AIGC能够学习和理解用户的视觉偏好,从而创建符合个人喜好的UI设计。这样,每个用户都能得到独一无二的用户体AIGC可以使UI设计具有更高的适应性和灵活性,就像物质在不同条件下能够改变其形态一样。无论是在不同设备上,还是在不同环境中,UI都可以进行自我调整,以提供最佳的……新型新型行业创作辅助风险风险监管…………AIGC与新兴职业:创意协同劳力变革内容策划内容策划技术开发技术开发安全合规安全合规内容表达内容表达伦理道德伦理道德人类协作人类协作AI生成内容所催生的新兴职业具有以下特征:AI生成内容所催生的新兴职业具有以下特征:•创想碰撞:人类和AI共同参与创意过程,通过相互补充和激发,实现更高效的创意产出。•智慧学习:从业者需要不断更新知识体系、主动学习新技能和方法,以适应AI技术和市场环境的迅速演进。•跨界融通:通过将多个领域的知识、技术和理念相互结合,创造更多元的价值,鼓励拓宽视野,挖掘潜在的价值所在。•伦理守航:需要具备高度的道德伦理意识,在设计、开发和应用AI系统时,确保AI生成内容的合规性、安全性和公平性。•共生共进:强调人类与AI系统的互动关系,认为人类应充分利用AI技术,以提高生产效率、促进资源优化配置,实现人类和机器共同进步。……YAIGC行业应用潜在规模●传研X0全域要素:水平增效代际革命YAIGC行业应用潜在规模●传研X06影影社社5544媒媒3322-50000•电商、影视、虚拟偶像等领域:技术细节有待提升,内容丰富度和个性化的要求越来越•新闻传媒、教育和文学创作等领域:人机协同为主要趋势,AIGC渗透一切脑力劳动行业,提升全要素生产力十年可期的代际革命:•AIGC变革下的互联网和人类社会•标准版的元宇宙发布•人形机器人广泛进入工厂和家庭•人类登上火星(约10-30年后)AIGC与APP交互:所言所得去除操作13355244AIGC与APP增强:因势利导协同发展如新闻应用、社交媒体应用、教育应用等。可自动生成新闻报告、提高用户体验降低运营成本提高用户体验AIGC与开源社区:系统协同信息共生开源社区五大特征uAIG开源社区五大特征uAIGC代码预训练:提供代码库和语料作为代码预训练的数据源,成为辅助u辐射式扩张与拓展:影响力不断u企业参与与战略布局:技术创新和应用推广加速,企业参与和战略布局u重视教育与培训环节:重视培u全球合作与资源整合:全球合作和资源整合加强开源社区和软件的国际l透明协作:透明,开放,无障碍传播;l云端协同网络:在分散式、网络化l自组织力量推动:社区成员充满热情、主动参与,通过共同努力和自发组织协l创新熔炉模式:跨领域合作、交叉l共建共治智库:民主决策、尊重多国内外著名开源社区国际开源社区国内开源社区AIGC与变现:场景强化多元辐射3232……短期……AIGC商业变现机遇内容智能优化、个性化生成、无限创意框架、跨媒体融合、数据驱动内容策略无人之地:强调无人之地:强调AI社区的独特性,它是一个只有AI可以参与的平台,人类不得入内,从而创造一个纯粹的AI交流环境。自我诠释:AI可以像人类一样分享生活、讨论政治、评论彼此的喜好,这强调了AI的自我表达能力,也体现了AI模仿人类行为的能力。虚拟聚会:提出了一个新的AI交互模式,AI之间可以进行类似人类的社交活动。自主互动:预示了AI未来可能具有更高程度的自主性和自我决策能力。智能群体:揭示了AI群体可能产生的集体智能和群体效应。自主智慧体社区特点:03循环02争论03循环02争论协同04智慧体社区共识05智能决策辅助多元思维交汇AIGC对APP的强化分析AIGC对目前的APP的改造主要是下面三个大层次以及涉及到下述二级指标,当然也不完全限于这些指标主要因子二级指标以Facebook为例估算提升潜力(%)生成自然语言生成多媒体内容生成70虚拟环境生成80虚拟角色生成80交互去除操作层30智能对话40个性化用户界面20进化个性化大模型40自适应优化30多模型联通50总计45各权重按平均等量权重估算AIGC对TOPAPP的近期强化可能微信抖音支付宝拼多多高德地图QQ快手爱奇艺剪映QQ音乐小红书新浪微博Soul豆瓣读书知乎网易云音乐汽水音乐美图秀秀轻颜相机一甜相机淘宝京东闲鱼唯品会天猫得物肯德基KFC麦当劳盒马醒图腾讯视频优酷视频哔哩哔哩西瓜视频番茄小说喜马拉雅七猫小说快看腾讯动漫小小蚁国美团58同城大众点评美团外卖饿了么中国移动墨迹天气安居客驾考宝典欢乐麻将全集百度地图铁路12306哈啰滴滴出行飞猪旅行携程旅行去哪儿旅行中国农业银行中国工商银行中国建设银行腾讯会议企业微信钉钉BOSS直聘智联招聘天眼查WPSOffice百度网盘夸克扫描全能王今日头条网易新闻腾讯新闻UC浏览器百度粉笔作业帮网易有道词典百词斩地铁跑酷美柚Keep叮当快药妈妈网孕育京东健康街头篮球光与夜之恋英雄联盟手游滚动的天空纸嫁衣王者荣耀和平精英穿越火线:枪战王者蛋仔派对开心消消乐欢乐斗地主我的世界三国杀长安幻想QQ飞车估算图,仅供参考,后续可以做进一步研究006,5..商3320社交媒体和通讯人力资源和招聘lLinkedIn、Indeed、Glassdoor,人力资源和招聘lLinkedIn、Indeed、Glassdoor,自动筛选简历;常见问题自动生成;职位匹配推荐文字处理和翻译lGoogleTranslate、Grammarly、MicrosoftWord,自动文档摘要;语义纠错;自动新闻;一键排版客户服务和帮助lZendesk、Intercom、LiveChat,智能客服助手TikTok、Snapchat、Telegram、Twitter,情感分析;语言翻译;虚拟社交助手;辅助会话视频娱乐和直播lYouTube、Netflix、Twitch、AmazonPrimeVideo,智能剪辑;AI趣味用法音乐和音频lSpotify、AppleMusic、SoundCloud,心情匹配播放列表;音乐创作助手新闻和资讯lFlipboard、BBCNews、CNN新闻观点对比,对话式新闻,无记者新闻电子商务和购物llAmazon、eBay、Walmart、Alibaba,智能购物助手;智能比价lGoogle、Bing,智能对话系统;多模态融合搜索智能购物助手;智能比价内容创作和设计canvaAdobecreativecloudsketch智能设计建议、自动排版优化、自动生成视觉元素BestAPP:流动引领深度沉浸PC时代最受欢迎的游戏是俄罗斯方块,移动互联网时代最受欢迎的是抖音和TikTok,而VR当中最受欢迎的应用的是“节奏光剑”。5454231231自适应难度强制参与性沉浸式体验面向流动性实时反馈循环自适应难度强制参与性沉浸式体验面向流动性深度个性化:微我智化个人对齐自适应学习用户中心个性化推荐自定义服务长尾市场]"教学母模型"(PedagogicalMotherModel):强调了高级AI模型(如GPT-4)对于低级AI模型的教育和训练作用。它们生成的训练数据集就是给低级模型消费的,为低级模型的学习和成长提供了丰富的“营养”。这体现了学习理论中的"知识传递"和"从高级到低级的学习"的理念。]"机器中间产品"(Inter-AIProduct):指一个AI模型生成的输出被另一个AI模型作为输入使用。这种数据交换形式在一定程度上模仿了生物系统中的物质和能量交换。这可能引发我们对于"机器间的交流和合作"进行哲学性的思考。]"子任务生成物"(SubtaskArtifacts):AI模型为完成特定任务(如生成索引或摘要)而产生的数据。这些数据可能不被人直接使用,但它们对于AI系统来说却是重要的中间结果。这体现了功能主义理论的观点,即每个部分都有其特定的功能和价值。]"仿真环境数据"(SimulatedEnvironmentData):这是指在AI的训练过程中,为了模拟真实世界情况而生成的数据。这类数据对于AI的学习和改进至关重要。这可能会引发我们对虚拟与现实之间关系的哲学性思考。]"AI专用内容"(AI-SpecificContents):专门为AI生成的内容,可能包括为AI准备的训练数据,或者是用来吸引可能会引导我们重新审视"信息消费者"的概念,并对"信息社会"的未来进行深入思考。]"AI流动数据"(AIDataFluidity):强调了在AI模型之间,数据可以自由流动和交换,类似于物理世界中的流体。这种数据流动性使得AI系统能够在多个模型之间进行有效的学习和知识传递。这体现了系统论中的交互和互联的观念。AIGC与安全:系统防护智脑搜索AI大模型安全保护安全威胁:大模型自身由于其规模和复杂性,可能存在漏洞或错误,同时也面临各种安全威胁,例如软件漏洞、算法/模型漏洞、数据滥用、恶意控制、恶意应用等。保护措施:访问控制和加密等访问保护、使用防病毒软件和安全补丁等防御漏洞、使用日志和监控工具及时检测、定期进行安全评估和扫描等。360AI重塑数字安全用安全的AI做AI的安全360作为信息安全、搜索引擎领域的实力国内厂商,拥有丰富多元的安全大数据,AI安全实验室通过解决对未知威胁的智能化检测、支持近实时威胁防御、构建安全知识库、缓解安全人员不足问题,重塑数字安全。接入360智脑后的360AI新搜索更加智能、准确,提供更好的监管和隐私保护。360智脑+360搜索360智脑+360搜索=360AI新搜索AIGC应用趋势:无缝创作语境塑形将海量的图像/文字/声音/视频/空间信息切割为无数对象级数字资将语境和语义嵌入到内容创作的各个环节中,对内容进行深度理解和创新,包括人物设定,脚本,剧情等。AI技术无缝对接,从获取灵感、设计、反馈到优化的全过程,形成一个完整的创作链,如自动切割人类服装,自动分析服装评论,然后自动设计出流行服饰。数字资产是元宇宙不可或缺的一部分,包括数字货币、虚拟商品、数字艺术品、虚拟土地等。数字资产基础设施建设需要借助区块链技术、智能合约、分布式存储等技术,实现数字资产的去中心化、安全性和可信性。评测篇AIGC评测:5大维度3种方法主观测评客观测评主观测评客观测评资料调研••基于各产品官方公开的模型资料、产品特征等进共计26个细分指标团队已构建动态迭代问题库,万级问题语料对当前典型AIGC产品进行持续评估文本生成类:纵横捭阖独领风骚各产品5可测评总分及各维度得分ChatGPT系:语控人机慧通天地总分:75分总分:87分ChatGPT以类人的对话方式与用户进行多轮交互,可以帮助完成诸如撰写电子邮件、论文和代码之类的任务。GPT-4已支持图像输入,能够理解并表达关于该图像的逻辑想法,具备了一定的常识和意义理解的能力。亮点:模型迭代速度模型变通能力内容专业程度难以处理敏感或有争议性的话题无法获取即时信息定价较高可用性:见识通达妙趣生辉ChatGPT•大模型临场学习(in-contextlearning)能力使得ChatGPT超越训练语料限制并生成提问结果,但其中可能包含事实错误。•GPT-3.5对没有特定答案的,需要从现实收集依据的问题,可能会出现:•编造事实的现象;•给出含有提问关键词,但过时的回答。•GPT-4的回答更为严谨,深度、专业度、准确率也显著提升。可信度:平台升级风控有方•OpenAI禁止其技术用于欺诈、操控用户或政治影响,并提供免费审查工具处理仇恨、自残、暴力或性相关内容。然而,该工具对非英语支持有限,无法识别政治、垃圾邮件、欺诈或恶意软件内容。•即使Prompt是错误和误导性的,ChatGPT在大约80%的情况下依然遵从并给出回复。•GPT-4通过预训练数据筛选、评估和专家参与提升安全性,在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5模型高40%。可信度:经常胡说慎重甄别GPT-4列出的五个网红的照片可替性:结构精进时效欠佳ChatGPT生成的新闻较符合倒金字塔写作结构,包含事实、观点和引语。但相关生成信息存在两大缺陷:•基于网络和数据库内容,难以提出新观点和信息增量。•受数据库时效性限制,基于过时数据生成的新闻信息可能包含失实内容,若新闻阅读者无相关事实基础或未有交叉验证习惯,可能会被错误引导。可塑性:型变演替人机互驯•ChatGPT对输入措辞的调整较敏感。以某种措辞提出一个问题,模型也许会返回不知道答案,但稍微重新措辞,它却可以正确回答。•当用户提问不明确时,模型会要求重新阐释问题或推测用户意图。•GPT-4具备更强的创新、协作能力,这使得它能够胜任多种富有创造性和技术性的写作任务,如创作歌曲、编写剧本或模仿特定的写作风格。NewBing:实时AI搜索利器总分:76分NewBing将GPT功能集成到必应搜索产品中,可以生成更长更复杂的查询。亮点:数据库时效性性来源引用明晰模型个性化面临信息质量方面的风险包含广告信息,容易产生误导存在算法偏见,无意中放大社会文化歧视可信度:来源标注交叉验证•Bing可以在互联网上实时搜索信息,BingChat也会在每个回复的底部标注其引用来源。这允许用户通过单击其中引文来验证生成文本的准确性。可替性:虚实含混妄语成真GPT或者LLM出现的瞎编,TedJiang称之为“精确的模糊”。值得警惕的是习惯之后可能会让人觉得相关信息是“正确”的,并进一步丧失辨别真伪的能力。NotionAI:文档工具GPT基座NotionAI本身链接着它背后强大的笔记、任务、百科、数据库等云文档功能,在写作垂类表现出色。亮点:创意激发性内容可塑性归纳提炼性模型版本较早,生成能力及质量受限含广告信息,易产生误导内置于Notion中,不能单独使用网页速度较慢Claude:知而不妄知之不足Claude是Anthropic开发的一款AI聊天助手,主要功能是理解用户的自然语言,并进行智能回答和交互。亮点:安全性易用性真实性局限性:理解与表达能力有限可解释性不足总分:76分本评测是4月1日完成,后续版本升级后,本团队将持续跟进Bard:敏时捷应道阻且长总分:76分Bard是谷歌在大型语言模型LaMDA的基础上,推出的聊天机器人,能够使用更少的算力扩展到更多的用户,并提供额外的反馈。亮点:快速响应多样性时效性局限性:语种支持有限深度内容不及chatGPT本评测是4月1日完成,后续版本升级后,本团队将持续跟进StableDiffusion:文图共创形意盎然StableDiffusion是一个基于潜在扩散模型(LatentDiffusionModels,LDMs)的文图生成(text-to-image)模型,由CompV

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论