计算机设备-国产Sora类视频生成大模型陆续推出_第1页
计算机设备-国产Sora类视频生成大模型陆续推出_第2页
计算机设备-国产Sora类视频生成大模型陆续推出_第3页
计算机设备-国产Sora类视频生成大模型陆续推出_第4页
计算机设备-国产Sora类视频生成大模型陆续推出_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/5/152023/6/152023/7/152023/8/152023/9/152023/10/152023/11/152023/12/152024/1/152024/2/152024/3/152024/4/15证券研究报告·行业动态国产Sora2023/5/152023/6/152023/7/152023/8/152023/9/152023/10/152023/11/152023/12/152024/1/152024/2/152024/3/152024/4/15证券研究报告·行业动态国产Sora类视频生成大模型陆续推出1.6月6日,极佳科技联合清华大学正式发布中国首个端侧可用的Sora级视频生成大模型“视界一粟YiSu”。采用融合LLM和扩散模型的自研架构,拥有模型原生的16秒超长时长,并可生成至1分钟以上。2.6月6日,微快手推出了文生视频大模型“可灵”(Kling是国内首个文生视频产品级应用,采用了类Sora的技术路线并结合多项自研创新技术,具备生成大幅度合理运动、模拟物理世界特性等特点,基于Dit架构打造,支持输出长达2分钟的视频。3.6月12日,美图发布会上,将奇想大模型(MiracleVision)升级到V5,采用美图自研DiT技术架构,涵盖图像大模型、视频大模型等,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提产业要闻【苹果推出AppleIntelligence,云端基于苹果芯片服务器】【上海交大发布PowerInfer-2推理框架,提速29倍】【美国芯片制造业迎来空前投资】【亿航智能EH216-S完成沙特首飞】持续关注:GPU:英伟达、超威半导体、海光信息等;FPGA:安路科技-U等;SoC:高通、全志科技等;计算机视觉:格灵深瞳-U等;自动驾驶:德赛西威、中科创达、均胜电子、光庭信息;智慧交通:千方科技、万集科技;AI+工业:中控技术、华大九天、广立微、概伦电子等。风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不响相关公司的正常生产和交付,公司出货不及预期。yufangboAC编号:S1440522030001发布日期:2024年06月17日市场表现20%0%-20%-40% 计算机上证指数相关研究报告厂商资本开支大幅增长,牵引算力设施政策出台,国产算力有望显著受益计算机设备一、行业变化 11.1极佳科技发布中国版Sora级视频生成大模型“视界一粟YiSu” 11.2快手推出文生视频大模型“可灵”(Kling) 21.3美图奇想大模型(MiracleVision)已升级到V5 4二、持续关注标的 5三、行情回顾 5四、产业要闻 9 六、风险提示 13计算机设备1一、行业变化1.1极佳科技发布中国版Sora级视频生成大模型“视界一粟YiSu”6月6日,在奇绩创坛路演日上,世界模型公司极佳科技联合清华大学自动化系正式发布中国首个超长时长、高性价比、端侧可用的Sora级视频生成大模型“视界一粟YiSu”。“视界一粟YiSu”拥有模型原生的16秒超长时长,并可生成至1分钟以上;同时还拥有超大运动、超强表现力、懂物理世界等众多优势;更重要的是,YiSu模型成本更低、速度更快、端侧可用;希望通过YiSu模型强大的性能和极致的性价比,更快实现长视频生成的大规模产品应用。技术路线方面,年初Sora的爆火,让DiT受到了业内极大的关注,很多公司和项目也开始复现DiT路线。极佳科技和清华大学研究人员在视频生成技术路线上有着深入的积累和独特的理解,在autoregressive、MaskedToken、DiT、UNet等不同路线方面均拥有丰富的经验。此前,团队提出WorldDreamer,是全球第一次以Transformer和LLM(MaskedToken路线)为中心的视频生成工作。“视界一粟YiSu”基于团队自研的视频生成大模型技术,并没有止步于DiT,而是融合LLM和扩散模型的自研架构,结合各种路线的优势,在多模态融合、训练效率、推理效率、模型效果等方面达到极致的优化,打造视频生成的最佳方案。资料来源:Microsoft,中信建投计算机设备2世界模型在数据生成、闭环仿真、端到端方案等方面都具有重要的价值。YiSu也展示了基于视频生成的同款架构,用于自动驾驶和机器人场景世界模型的效果。极佳科技在世界模型的技术和应用上都保持行业领先。2023年9月,极佳科技推出了全球首个真实世界驱动的自动驾驶世界模型DriveDreamer,早于Wayve的GAIA-1;2024年4月,极佳科技进一步更新了DriveDreamer-2,性能保持业内领先;2024年5月,极佳科技联合国内外多家单位推出了全球首篇通用世界模型综述,该综述通过260余篇文献,对世界模型在视频生成、自动驾驶、智能体、通用机器人等领域的研究和应用进行了详尽的分析和讨论;该综述还审视了当前世界模型的挑战和局限性,并展望了它们未来的发展方向。资料来源:Microsoft,中信建投1.2快手推出文生视频大模型“可灵”(Kling)6月6日,快手推出了文生视频大模型“可灵”(Kling),是国内首个文生视频产品级应用,直接开放测试,可灵大模型采用了类Sora的技术路线并结合多项自研创新技术,具备生成大幅度合理运动、模拟物理世界特性、支持自由输出视频宽高比等优势,基于DiffusionTransformer架构打造的文本视频语义理解能力,能较好的理解用户给出的指令,同时支持输出长达2分钟,且高达1080p30FPS的视频。依托快手在视频技术领域的多年积累,可灵大模型团队已经构建了完备的标签体系,包括从视频基础质量、美学、自然度等多个维度对视频数据质量进行刻画,并针对每一个维度设计多种定制化的标签特征,以此来精细化筛选训练数据或调整训练数据的分布。为了满足训练文生视频模型过程中成对的视频和文本描述需求,可灵大模型团队自研了视频描述模型,可以生成精确、详尽、结构化的视频描述,显著提升视频生成模型的文本指令响应能力。计算机设备3资料来源:Microsoft官网,中信建投在整体架构设计上,可灵采用了目前火热的DiffusionTransformer(DiT)。传统的扩散模型主要利用包含下采样和上采样块的卷积U-Net作为去噪网络骨干。但一些研究表明,U-Net架构对扩散模型的良好性能并非至关重要。通过采用更灵活的Transformer架构,扩散模型可以使用更多的训练数据和更大的模型参数。可灵之所以能够将用户的文本提示转化为具体的画面,包括那些真实世界中不会出现的虚构场景,就是基于对文本-视频语义的深刻理解和DiffusionTransformer架构的强大能力。在自研架构和ScalingLaw激发出的强大建模能力推动下,可灵能够很好地模拟真实世界的物理特性,生成符合物理规律的视频。基于团队自研的3DVAE网络,可灵大模型能够生成1080p分辨率的电影级视频。与此同时,为了保证画面中运动的呈现更加合理,可灵大模型采用3D时空联合注意力机制,更好地建模复杂时空运动,即可生成较大幅度运动的视频内容,同时能够符合运动规律。计算机设备4资料来源:Microsoft官网,中信建投1.3美图奇想大模型(MiracleVision)已升级到V56月12日,美图公司举办以“聊聊AI工作流”为主题的第三届美图影像节,宣布美图奇想大模型(MiracleVision)已升级到V5,采用美图自研DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更好的扩展性与更大的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。美图在实践过程中发现,用类似Sora的文生视频模型辅助内容创作,故事成片难,可控性较差。美图通过一个AI短片工作流解决了上述难题:在脚本、视觉风格、角色等前期设定完成后,AI自动生成分镜图并转为视频素材,通过智能剪辑、AI配乐、AI音效、自动字幕等功能串联素材并实现成片。这个能落地的AI视频产品,就是AI短片创作工具MOKI。与常规文生视频产品不同,MOKI深度理解视频创作者需求,实现内容和成本的双重可控,目前可以进行多种视频场景的AI短片创作。计算机设备5资料来源:Microsoft官网,中信建投二、持续关注标的GPU:英伟达、超威半导体、海光信息等;FPGA:安路科技-U等;SoC:高通、瑞芯微、晶晨股份、全志科技等;计算机视觉:格灵深瞳-U等;自动驾驶:德赛西威、中科创达、均胜电子、光庭信息;智慧交通:千方科技、万集科技;AI+工业:中控技术、华大九天、广立微、概伦电子等。三、行情回顾上期,人工智能指数(中证)指数上涨5.48%,本月份以来累计上涨4.88%。上期上证指数下滑0.61%,沪深300指数下滑0.91%。计算机设备91.39用友网络 1.39用友网络 0.65紫光股份0.56宝信软件图表6:中证人工智能指数、上证指数、沪深300资料来源:Wind,中信建投中证人工智能指数板块个股方面,涨幅前五个股分别为:富瀚微、寒武纪、晶晨股份、恒玄科技、奥普特;涨幅后五个股分别为:石头科技、广联达、千方科技、深信服、海康威视图表7:人工智能(中证)个股周涨幅前十名(*)图表8:人工智能(中证)个股周 13.2410.5010.4210.428.998.788.708.577.056.88资料来源:Wind,中信建投资料来源:Wind,中信建投计算机设备7图表9:重点公司股票涨跌详情(盈利预测均为Wind一致预测)码码今公司名称行业单位2021202220232021今元7元797.543.7297.6397.543.7297.63 元元))%%-头K-K-技头达-达%%计算机设备8 服务%觉格灵深瞳觉觉 1 1 1 1 K1... % 计算机设备9) 47.1% 概伦电子 资料来源:Wind,中信建投四、产业要闻【科大讯飞星火V4.0大模型将提供GPT-4o所不具备的多项能力】6月11日消息,科大讯飞董事长刘庆峰宣布,讯飞星火V4.0大模型将于6月27日发布,带来端到端智能语音技术及多项GPT-4o所不具备的能力,如一句话复刻、高噪音场景下的语音识别和多方言免切换,并计划在三季度推出端到端的语音技术建模方案。科大讯飞的超拟人合成技术在多语种方面领先国际,全双工技术将提供快速交互体验。V3.5Max版本在文本生成等方面已超越GPT-4Turbo0429的最新版本。科大讯飞的大模型时代核心战略包括软硬件赋能、行业市场开拓、新兴赛道发展及AI助手战略机遇,推进"讯飞超脑2030"计划,目标家庭陪伴机器人市场。(IT之家)【字节跳动火山方舟大模型平台开放给个人开发者并提供免费推理额度】6月12日消息,字节跳动火山引擎宣布,其大模型服务平台火山方舟正式向个人开发者开放。个人开发者现在可以体验并应用包括豆包大模型在内的多种大模型。火山方舟为个人用户提供50万tokens的免费推理额度,以及豆包通用模型pro和lite版本的流量额度。免费额度用完后,模型推理输入价格为0.0008元/千tokens。用户需在官网完成实名认证后,即可进入火山方舟控制台,查看并体验各类大模型,并通过控制台操作或API调用进行模型体验和比较。此外,开发者还可以上传数据集,对模型进行精调。(IT之家)【上海交大发布PowerInfer-2推理框架,提速29倍】6月12日消息,上海交大IPADS实验室推出PowerInfer-2.0,一款面向手机的大模型推理引擎,旨在解决移动设备上部署大模型的内存和算力挑战。PowerInfer-2.0显著提升了推理速度,使Mixtral47B模型在手机上达到11tokens/s,与开源推理框架llama.cpp相比,平均提速25倍,最高达29倍。为进一步优化PowerInfer-2.0的性能,上海交大团队还提出了TurboSparse技术,该技术的相关论文已在arxiv上公开,并在业界引起关注。PowerInfer-2.0的发布,不仅为移动设备上大模型的部署提供了新的解决方案,也为保护用户隐私提供了有力支持,有望推动AI大模型在移动设备上的广泛应用。(IT之家)计算机设备【美国芯片制造业迎来空前投资】6月13日消息,美国芯片制造业正经历前所未有的投资潮。得益于拜登政府的“芯片与科学法案”,预计到2024年,美国政府在该行业的建设资金投入将相当于过去28年的总和。这项法案于2022年通过,总投资额达2800亿美元,目标是提升美国在全球半导体产业中的竞争力。英特尔、三星、美光等芯片巨头获得数十亿美元资金支持,用于在美国新建芯片制造工厂。这不仅将极大提升美国的芯片产能,也预计将推动美国在2032年生产全球30%的领先制程芯片,超过政府设定的2030年达到20%的目标。然而,尽管资金充裕,包括英特尔俄亥俄州新工厂在内的多个新建项目仍面临建设延误,主要原因归咎于监管流程不畅,导致美国在全球芯片制造厂建设速度上落后。(IT之家)【苹果推出AppleIntelligence,云端基于苹果芯片服务器】6月12日消息,苹果在WWDC24上宣布了AppleIntelligence,为iPhone和Mac等设备带来革新的AI功能。官方详解显示,AppleIntelligence包含约30亿参数的本地模型,性能超越多个70亿参数的开源模型,以及运行在Apple芯片服务器上的云端模型。这些高性能生成模型针对用户日常任务优化,能够动态适应用户活动,进行文本编写、通知排序、图像创造,以及简化应用间交互。苹果强调,训练模型时不使用用户个人数据,并通过过滤器去除个人信息和低质量内容。在技术层面,AppleIntelligence使用grouped-query-attention技术,设备端模型词汇量为49K,云端模型则为100K,包括更多语言和技术标记。优化后的模型在iPhone15Pro上展现出快速响应和高生成速率。苹果计划在iOS18、iPadOS18和macOSSequoia的测试版中集成AppleIntelligence,并在秋季向公众开放测试。免费使用,但限于搭载A17Pro芯片或M系列芯片的设备。(IT之家)【西部数据预览业界最高密度2TbQLCNAND闪存】6月14日消息,西部数据在投资者活动上预览了其BICS8技术,推出2Tb容量QLCNAND闪存芯片,刷新了闪存行业密度记录。这款芯片针对数据中心和AI存储需求,预计能降低企业级固态硬盘成本,应对不断膨胀的数据存储需求。单芯片2Tb容量预示着未来可能实现128TB至256TB的企业级固态硬盘。西部数据总经理索德伯里展示了芯片实物,暗示产品即将发布。BICS8采用CBA技术,提升了读写性能和存储密度,降低了功耗,其存储密度领先竞品15~19%,在编程能耗方面也有13%的优势。(IT之家)【亿航智能EH216-S完成沙特首飞】6月14日消息,亿航智能的EH216-S无人驾驶电动垂直起降(eVTOL)航空器在沙特阿拉伯圣城麦加成功完成首次飞行,标志着空中出租车服务向前迈出重要一步。EH216-S是中国空域飞行。EH216-S可搭载两名乘客,飞行里程最长达30公里,最高速度130公里/小时,通过地面系统管理,实现多架航空器有序无人驾驶飞行。关键飞行部件采用全备份设计,确保安全性。今年2月,亿航智能宣布EH216-S在中国的官方指导价为239万元人民币/架,自2024年4月1日起执行。(快科技)【中远海特新专利“传感器固定装置”授权】6月14日消息,中远海特宣布获得一项名为“传感器固定装置”的实用新型专利授权。该专利的传感器固定装置由传感器固定板、双向角度调节器和磁吸固定底座组成,具备基础固定、双向角度微调和简易水平矫正功能。其设计允许传感器在两个方向上进行精确调整,并通过磁力吸附于金属表面,提供了多样化的固定方式和便捷的拆装过程。中远海特的这项专利不仅展示了公司在传感器固定技术领域的突破,也反映了其持续的研发投入。截至2024年,公司已新增13项专利授权,同比增长18.18%。根据2023年年报,中远海特在研发上的投资为9797.68万元,虽同比略减0.12%,但整体研发力计算机设备度未减,突显了公司对创新和研发能力的重视。这些专利的积累将为公司在激烈的市场竞争中提供强有力的技术支撑。(证券之星)五、重要公告年股权激励计划中部分已授予但未解锁的限制性股票的回金融开发投资控股集团有限公司及其下属公司、宁波海曙产业投资有限科技有限公司、杭州迦智科技有限公司以及关联方宁波甬水桥众舟投资事会和监事会会议上审议通过了放弃优先认购权的议案。此举将导致中创新中心的股权比例由44.3975%稀释至34.9褚健控制的企业,构成关联交易,但不构成重大资产重组。本次交易无),确了除权除息参考价格的计算方法,并指出流通股份变事全票赞成,无反对或弃权票。相关制度的制定符合《公司法》、《证券计算机设备易所相关规定,结合公司实际情况,以促进公公司经第二届董事会第六次会议和第二届监事会第四次会议审永久补充流动资

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论