空间计算行业市场分析_第1页
空间计算行业市场分析_第2页
空间计算行业市场分析_第3页
空间计算行业市场分析_第4页
空间计算行业市场分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

空间计算行业市场分析1.摘要交互硬件与计算平台彼此焦不离孟,空间计算极具颠覆性且必然到来,AppleVisionPro是一款里程碑式硬件,有望再次书写历史。本篇报告通过回顾交互硬件50年发展史,从人使用硬件的角度出发,至少能够得出两点特征或结论:1)人与硬件之间的交互是越来越自然的,越来越贴近人使用工具的自然习惯,智能手机的触控交互就比个人PC的键鼠交互更加自然;2)新的交互硬件总能生长出最适配的计算平台,且软硬一体化的趋势越来越强,基于智能手机的移动互联网生态就显然比基于电脑的互联网生态发展得更加繁荣。交互硬件与计算平台是相辅相成的,在可以预见的下一代交互硬件VR/AR/MR之上,也一定会适配全新的计算平台。我们认为,最有潜力接棒成为下一代计算平台的就是“空间计算平台”,将全面颠覆平面计算的范畴,帮助人实现虚拟与现实之间的连通与融合的计算过程。从平面到空间的计算升维,是用新的成体系技术,对老的技术体系进行“降维打击”。这种过渡的颠覆性,不论从技术、产业链、还是思维模式层面,都不能用过去的经验类比。所谓的垄断巨头也是时代所造就的,在上一轮的竞争当中取得绝对优势,但是往往也可能会在技术、商业思维等层面因循守旧,而被下一代的新兴力量“降维打击”。空间计算的技术和体验拐点已经到来,AppleVisionPro就是里程碑式产品。在PC时代与智能手机时代,苹果已经多次证明过其定义行业拐点的成功经验——1984年推出的Macintosh、2007年推出的iPhone,2023年发布的VisionPro有望再次书写历史。AppleVisionPro预测并描绘了一个全新的空间计算概念,且苹果有能力预测一代又一代的标杆式产品并有能力把这些预测变成行业的共识和现实。本篇报告亮点之处在于从定性与定量的双重视角定义空间计算以及比较空间计算的能力指标。定性视角下,我们按照“输入-计算-输出”的分析框架重新定义了空间计算的概念;定量视角下,我们以AppleVisionPro为基准构建了一套空间计算能力的量化评分体系。空间计算的定义是,在三维的基础之上,以人为本,连通及融合虚拟世界与现实世界的一个全新的计算范式。“在三维的基础之上”,是指空间计算的客体对象如果本身是三维的,不再需要从三维降维至二维的平面以方便计算和跟用户的交互,而是可以保持为立体的三维的,这是空间计算的基础。“以人为本”,是指空间计算的主体仍然是人,空间计算的目的是服务人与虚拟世界的交互。“连通与融合虚拟世界与现实世界”则描述了空间计算的过程与适用范畴。与平面计算概念相区分,平面计算只涉及人同虚拟世界基于2D界面的交互,但空间计算,是涉及人、虚拟世界,现实世界三方的交互,在输入、输出、计算三方面关键能力上空间计算与平面计算也存在显著差异。(1)输入-指令型的能力,主要体现在信息形态的差异。平面计算是以文字和图像为主,空间计算则包括文字、声音、图像、动作等多种形态。(2)输出-感受型的能力,主要体现维度数量的差异。平面计算是以二维视觉和听觉为主,空间计算则以三维视觉、带空间定位的三维听觉,或者称空间音频为主。(3)计算能力则最为关键,主要是在算力需求上差异巨大。跟平面计算相比,空间计算在计算的精度、广度、速度等方面有倍数级的提升,与平面计算显著拉开差距。定量视角下,我们首先横向比较了各主力VR设备的硬件参数,得出的结论是——各功能模块的硬件参数是可以提升的,目前制约空间计算的核心矛盾是算力。而有效解决这一矛盾,取决于两方面的努力。一方面,是原始算力的不断进步,这取决于上游芯片供应链上CPU+GPU核心参数的不断优化。另一方面,算法是对算力的使用效率优化,这取决于下游整机、软件等厂商在算法与软件层面的优化能力。其次,我们基于用户体验的视角,按照输入-输出的框架重新解构了AppleVisionPro的核心功能模块,包括输入的眼睛注视、头部及手势识别、语音输入、记录空间视频、Eyesight(现实互见),输出的超高清显示、空间视频、空间音频、Persona(数字人)。在现有的用户体验框架下按照各功能模块的重要性不同及实现难度分配权重,苹果各功能模块基准评分为10.0,对VR行业的核心厂商进行评分如下,加权后评分从高到低依次为Apple(10.0)、Pimax(5.9)、Meta(5.0)、Varjo(4.5)、Pico(4.4)、HTC(4.3)、DPVR(3.5)、YVR(3.5)、Valve(3.2)。同时,我们认为行业产品的产品力,不完全由厂商的能力边界所决定,同时也取决于厂商对未来的综合判断。在此我们可以大胆假设苹果在空间计算时代依旧定义了行业及产品的技术路径和发展方向,并引入Gartner的魔力象限(MagicQuadrant)理论对主流VR厂商进行一个简单的分析和归类。基于对产品力与规模两大维度的评分,Apple毫无疑问被划分入领导者(Leader)象限,Meta、Pico、Valve则被划分入挑战者(Challengers)象限,Pimax归属远见者(Visionaries)象限,Vajor、HTC、YVR、DPVR属于利基企业(NichePlayers)(指在某一细分领域占主导的企业)象限。各VR厂商基于自身资源禀赋积极布局划分势力范围,但苹果VisionPro入局后,对树立行业共识与改变竞争格局具有重要影响。行业内长期以来存在VST与OST两条路线之争。苹果这次推出的VisionPro,是采用了VR+VST的技术路线。VST模式才能从理论上真正保证优秀的用户体验,是实现MR的终极模式。该模式目前面临的挑战比如算力、体积和续航问题,都在随着技术的进步而逐步解决中,但是OST模式有其底层产品逻辑上的致命缺陷,无法支持通用MR的未来。有苹果带头与引领,相信VR+VST也必然将在相当长时间内代表通用MR产品的核心形态和技术路线。VisionPro问世之前,市面上的VR硬件参数虽然整体呈现优化、改善的趋势,但是部分参数距离良好的用户体验始终存在差距。VisionPro问世之后,将重新刷新用户对于良好的视觉沉浸感的认知,倒逼厂商改善光学与显示方案以提高分辨率。AppleVision在输入、输出方面的多项能力与配置,有望引领行业内产品跟进。比如空间视频、空间音频将成为普遍配置,与超高清显示一起,共同为用户提供沉浸式的视听体验。比如眼动追踪&面部追踪、手势识别将成为重点优化功能,人在虚拟世界当中的交互将变得更为自然。苹果的入局,有望将VR产业拉回做消费电子产品的逻辑,而此前产业主要由Meta等互联网公司主导,以出货量为优先,低价补贴强推,但一定程度上牺牲了用户体验。但是互联网平台业务和通用型硬件业务这两个商业模式本身就是互斥的。互联网业务,尤其是大社交业务平台,必然是赢者通吃的,目标是cover百分之百的人群。但是硬件天然是更分散的,因为同一个品牌、同一款产品不可能cover所有人的需求。而做消费电子产品的逻辑是,首先要把核心性能指标做到“良好”的水平,能够较好地满足用户的基本需求。这时候价格一定是偏高的,针对的是市场上对价格不敏感的earlyadopters形成一定的出货量,在商业上达成一定意义上的成功(至少是较高的毛利率)。AppleVisionPro很有希望成为一个行业拐点产品。在这个基础上,通过技术的迭代、供应链的完善,逐步降低成本,从而降低价格,从上往下逐次形成对不同层级的消费者的分段渗透,在这个过程中随着出货量的增加,供应链整体成本会进一步降低,形成良性循环,最后实现对大部分消费者的渗透。智能科技的产业版图,转化为技术层面的研究表达是大模型×MR眼镜/人形机器人×NFT。本篇报告聚焦于MR眼镜这一空间计算设备所开启的空间计算平台,其定性、定量的深度研究与对比。从投资角度,围绕8个景气上行方向,有三类个股——向8个方向积极去升级或迭代或革新的传媒或TMT个股、坐落于8个方向IPO新股、往8个方向全力转型的并购重组类个股。2.交互硬件VS计算平台:焦不离孟2.1.交互硬件50年发展史:垂直→通用,大型→小型过去50年,我们历经了多种交互硬件的迭代,从早期的垂直计算硬件——游戏主机,到通用计算硬件——个人电脑,再到目前的小型化硬件——掌机&智能手机,交互硬件进化史大致是遵循垂直计算硬件→通用计算硬件→小型化硬件这样的发展路径。2.1.1.垂直计算硬件——游戏主机相比我们所熟知的任天堂FC、索尼PS、微软Xbox,最早的游戏机要追溯到1972年的奥德赛,从第一款家用游戏主机至今,已经过去了50年。游戏机见证着人类科技史的进步,在不同发展阶段出现了划时代意义的产品,影响着如今包括电视、电脑、智能手机、VR/AR等在内的其他电子产品市场的发展。游戏本身就是一种结合了科技与文化的载体,高端技术为更具沉浸感与互动性的游戏提供了基础架构,而游戏也反过来推动新科技的探索与发展,以此形成正向循环:为了满足玩家更高的游戏娱乐需求,游戏及科技厂商持续投入研发,推出算力更高、性能更强的新硬件与技术,当新硬件与技术出现后,其所能应用的场景将远不止于游戏,将作为通用型的技术溢出至其他应用方向或场景。进入21世纪,彼时的微软已经通过控制计算机产业链上的操作系统,从而掌控了整个个人电脑产业,以Windows+Office的组合强势切入了办公场景。为了寻找新的盈利点,除了办公场景之外,微软一直也觊觎着客厅场景。此前微软本身也在做PC端的游戏,自1997年左右开始进军家庭主机市场,最初以合作的方式进行布局,计划为游戏硬件厂商开发软件与操作系统,但碰壁之后,微软决定推出自有的游戏主机。面对竞争已经较为激烈的家用游戏主机市场,不同于索尼的路径,微软进军游戏主机市场的方式主要靠投资,陆续收编其他硬件厂商的人才,收购多家游戏工作室。2001年11月15日,微软在美国正式发售了自有的游戏主机Xbox,首发获得了成功。Xbox的成功之处在于硬件性能高、具备XboxLive联网功能、性价比高,售价仅299美元(后于2002年降至199美元)。在这样的低价策略下,每卖出一台微软将亏损125美元,最终微软Xbox在全球的销量约2400万台,虽然远落后于索尼PS2(售出1.58亿台),但是却胜过任天堂NGC(售出2174万台)、世嘉DC(售出1045万台),在同世代的游戏主机中居于第二位。第一代Xbox总预计亏损50亿美元,微软以低价的策略强势入局主机游戏市场,给其他厂商带来了冲击,世嘉、NEC等多家公司退出了市场,最终只剩下以优质内容与创意见长的任天堂,以及资金实力雄厚的索尼。巨头入场,导致行业进入壁垒大幅提升。初代Xbox的成功重新燃起了欧美游戏开发商的热情,自此欧美游戏厂商开始崛起。同时微软乘胜追击,2005年11月22日,微软推出新一代具备代表性的游戏主机Xbox360,正式拉开了三大主机游戏厂商的竞争。由于Xbox360抢先PS3一年发售,售价仍为299美元,在PS3缺席的情况下,Xbox360在发售后的半年内售出约600万台,率先占据较大的欧美市场份额。2006年11月,索尼与任天堂各自发布新一代的游戏主机索尼PS3与任天堂Wii,随着新世代游戏主机发售,三足鼎立的竞争格局形成。三家的次世代游戏机各具优劣势,根据Statista统计,微软Xbox360、索尼PS3、任天堂Wii在全球的累计销售分别为8000万台、8000万台、1亿台。其中任天堂Wii的销量遥遥领先,源于其采取了错位竞争策略,虽然Wii的性能不及Xbox360与PS3,但Wii最大的优势与创新在于将体感装置引入了游戏主机,开辟了新的体验方式。Wii开发代号为“Revolution”,表示电子游戏的革命——体感游戏革命,发售第一年销量就达2000万台,迅速抢占了大量轻量玩家甚至是非玩家市场。随着三大厂商的新世代游戏主机的全面上市,游戏主机市场的竞争白热化,索尼、微软、任天堂三足鼎立的竞争格局形成直至今日。2.1.2.通用计算硬件——PC与智能手机马克思说过,一切工具都是人体的延伸,而电脑正是人脑的延伸。电脑的发明增强了人类的运算能力,使得人类从无尽的脑力活动中解放出来。最初的电脑是专供军方(例如计算炮弹轨迹)和尖端科技部门(例如人造卫星轨道计算)使用的,随着科技的发展,电脑逐渐进入了普通人的生活,极大的提高了人类的劳动力利用率。1977年:现象级产品AppleII问世,开启个人电脑革命1977年4月,苹果在旧金山的西海岸电脑展览会上举办了首次盛大的产品发布会,推出了AppleII电脑,这是全球首台真正意义上的个人电脑,支持280*192分辨率的视频输出,可显示16种色彩,并且拥有单声道声音输出架构,从此电脑可以发出声音。AppleII的最初定价为1298美元,后续又推出了多种改良型号,在接下来的16年中,各种型号的AppleII共售出了接近600万台。AppleII开启了个人电脑革命,在于其面向的是大众,而不仅仅是狂人与工程师,AppleII的上市与后来的普及深刻影响了后继的许多种微电脑。AppleII的成功之处主要在于配备了杀手级应用“VisiCalc”,打入消费级市场。相比其他电脑,AppleII真正开创了个人电脑产业,而AppleII的成功重要推进器是电子制表与个人财务程序VisiCalc,这是Excel的雏形。作为世界上第一款电子表格软件,VisiCalc最早于1977年问世,并于1979年与AppleII电脑拥绑销售,VisiCalc成为当时较为流行的个人计算机应用程序,也助力AppleII在商业、家庭与学校用户之间进行普及,VisiCalc在1979年被评为最佳软件。1984年:麦金塔(Macintosh)问世,图形化界面+鼠标降低用户使用门槛AppleII问世后,销量急剧上升,从1977年的2500台猛增到1981年的21万台,将苹果公司推向了一个新兴产业的顶峰。但AppleII与我们现在用的电脑有一个巨大的不同——没有鼠标,操作全部依靠命令行加键盘,即在键盘上输入一串字符,计算机就会在屏幕上显示相应的字符,通常是荧光绿色的字符衬上深色的背景。直到1983、1984年苹果Lisa、Mac的推出,带来了巨大的革新,带来了图形化操作界面与新外设硬件鼠标。AppleII之后,乔布斯继续探索下一代个人电脑,目标是打造一款操作简单、价格低廉、适合普通人使用的大众电脑。1979年,AppleII的潜在继任者有三种机型:(1)AppleIII——1980年5月,AppleIII上市,虽然AppleIII内存更大,屏幕可以一行显示更多字符,并且能区分大小写字母,但最终销量惨淡,主要源于相较前一代并没有根本性的革新。次年,苹果个人电脑业务的最大竞争对手IBM也推出了首款个人电脑,使用的是过时的命令行提示符,屏幕也只能显示字符,而不是图形界面的位图显示。(2)“丽萨(Lisa)”项目——全球首款同时采用图形用户界面(GUI)与鼠标的个人电脑,于1983年面市,但当时的苹果没有考虑到消费者对电脑消费的承受能力,昂贵的价格使得众多用户更愿意采购价格相对低廉的IBM电脑。AppleLisa于1986年8月正式退出历史舞台。(3)“安妮(Annie)”项目(后改名为Mac项目)——开发者为杰夫·拉斯金(JeffRaskin),致力于为大众制造一台拥有简单图形界面与简洁设计的廉价电脑。拉斯金也促成了乔布斯与苹果的同事们关注到一家优秀的研究中心——施乐,它是图形界面技术的先驱。苹果至今仍与其他科技型公司调性不同,有着特立独行的风格。苹果从创立之初,其基因就一直强调“软硬一体化”发展,乔布斯将这一基因深深的烙印在苹果公司文化之中。乔布斯认为一台电脑要真正做到优秀,其硬件与软件必须是紧密联系在一起的。如果一台电脑要兼容那些在其他电脑上也能运行的软件,它必定要牺牲一些功能。他认为最好的产品是“一体的”,是端到端的,软件是为硬件量身定做的,硬件也是为软件度身定制的。正因此,才使得麦金塔有别于微软(以及之后谷歌的安卓)所创造的操作系统环境,麦金塔上使用的操作系统只能在自己的硬件上运行。1995年:Windows95推出,高性能可以处理多媒体大约在1982年,当苹果开始着手研发麦金塔电脑时,乔布斯为比尔·盖茨展示了麦金塔计算机概念产品,以及图形界面的操作系统。乔布斯希望微软为麦金塔电脑编写BASIC程序,以及开发图形界面版本的应用软件,如全新的电子表格Excel、文字处理Word等应用程序。随后,微软组建了一个大型团队负责该项目。彼时,微软主要靠将传统的DOS操作系统授权给IBM并兼容电脑使用而赚取收入。与苹果坚持走封闭路线的商业模式不同,微软的策略是软件的开放、兼容与廉价。在与苹果的合约到期之后,微软也将软件售卖给了其他公司,1983年11月,盖茨宣布微软计划为IBM个人电脑开发Windows操作系统,Windows操作系统将采用图形界面,有窗口、图标与可以指向并点击的鼠标。由于与大厂IBM进行合作,微软DOS系统得到迅速推广,在此后的版本更迭中,微软始终保证了产品的兼容性,因此留住了大量的用户。微软于1985年发布Windows1.0操作系统,虽然该版本很不完善,更像是在DOS上面嵌套了一层UI,但是已经能够支持单窗口,Window2.0可以支持多窗口。1990年,微软终于推出了第一款真正意义上的图形化Windows操作系统——Windows3.0,凭借此前积累的众多用户,该系统一经推出就广受好评,得到了迅速推广。微软于1991年10月发布了Windows3.0的多语版本,为Windows在非英语母语国家的推广起到了重大作用。1994年,微软发布Windows3.2版本,这一版的Windows开始支持中文,对于中国人来说,这才是使用Windows的开端。微软从无到有开创了一种全新的商业模式,即靠销售软件获得收入。在盖茨开创靠销售操作系统获利的这套模式之前,整个计算机产业还没有形成明确的分工,当时软件的价值必须依托于硬件才能实现,鲜少有公司将单独售卖软件作为主要的商业模式。虽然最早的商业化图形操作系统的个人电脑产自于苹果,但将简单易用的个人电脑普及到千家万户的,却是微软。在推进计算机产业不断成熟、细化分工的进程中,微软起到了关键作用。Windows3.0的发布,也助力微软扭转了在个人电脑领域的劣势,奠定了其在PC操作系统的垄断地位。而相对应地,苹果在个人电脑的市场份额从这一年开始迅速下降。1995年8月24日,微软发布了Windows95,这是最具划时代意义的Windows系统。Windows95是一个混合的16位/32位Windows操作系统,其版本号为4.0,开发代号为Chicago。Windows95是微软之前独立的操作系统MS-DOS与MicrosoftWindows1.x、2.x、3.各系统的直接后续版本,同时特别捆绑了一个版本的DOS的视窗版本(MS-DOS7.0)。Windows95带来的影响极为深远,促进计算机的性能大幅提升,可以处理多媒体任务。一方面,从系统本身来看,Windows95最大的贡献之一在于图形用户接口较Windows3.2的大幅革新,带来了更强大、更稳定、更实用的桌面图形用户界面,用户能够更快速地打开各种应用程序、系统设置、文件夹目录。Windows95某些创新元素甚至一直沿用至今,如开始菜单、任务栏、USB、文件浏览器、IE浏览器等功能;另一方面,对微软自身而言,Windows95的发布结束了桌面操作系统间的竞争,在发行的一两年内,Windows95成为有史以来最成功的操作系统,1995-2000年微软市值开启第一轮的大幅上涨行情。1994年之后:互联网/移动互联网丰富应用场景互联网技术社会化启用阶段始于1994年。1994年,美国克林顿政府允许商业资本介入互联网建设与运营,互联网得以走出实验室进入面向社会的商用时期,开始向各行业渗透。这也是我国互联网发展的起步阶段。1994年4月,中关村地区教育与科研示范网络工程进入互联网,这标志着我国正式成为有互联网的国家。20世纪90年代是互联网大发展的时代,万维网诞生,诸多浏览器问世,谷歌、搜狐、新浪、腾讯、阿里巴巴等互联网公司成立。移动互联时代,智能移动设备的出现使得网络用户数量及上网时间大幅增长,获取、产生信息的端点数量与交互频率大幅增加,联网的空间与场景变化多样,并由此衍生出丰富多样的应用程序,渗透至日常生活的方方面面,产生的数据量也以几何级快速增长。2010年开始之后的十年,是移动互联网的黄金十年,移动互联网的红利期突出表现为鳞次栉比的应用创新:2011年的团购、2012年的自媒体、2013年的大数据、2014年的互联网金融、2015年的O2O、2016年的直播/新零售、2017年的共享经济、2018年的短视频/区块链、2019年的人工智能、2020年的社区团购。2007年之后:触控交互+应用商店成为智能手机兴亡关键2007年6月,第一代苹果手机iPhone在美国正式发售。同样在2007年,谷歌正式向外界发布Android系统,并与65家软件开发商、硬件制造商和电信运营商组建开放手持联盟,共同研发改良Android系统。苹果的触摸屏放弃使用电阻屏,而改用电容屏,这种屏具有多点触摸功能。而且由于电容屏比电阻屏的灵敏度要高很多,使得用虚拟键盘也可以快速打字,实体键盘不再是手机必不可少的东西。全触屏手机与应用商店的组合逐渐成为决定智能手机兴亡的关键。2008年,苹果发行第三代iPhone,AppleStore能够为第三方提供设计需要的标准和支持时,而安卓由于采用开源,并接受市场的改良,也受到开发者的亲睐。在此背景下,功能机逐渐被以苹果与安卓为代表的智能机取代。2013年,全球智能手机出货量正式超过功能机,成为手机市场主流。2.2.下一代计算平台——新的交互方式孕育出新的计算平台通过回顾交互硬件50年发展史,从人使用硬件的角度出发,至少能够得出两点特征或结论:1)人与硬件之间的交互是越来越自然的,越来越贴近人使用工具的自然习惯,智能手机的触控交互就比个人PC的键鼠交互更加自然;2)新的交互硬件总能生长出最适配的计算平台,且软硬一体化的趋势越来越强,基于智能手机的移动互联网生态就显然比基于电脑的互联网生态发展得更加繁荣。从产品层面而言,计算平台就是指电脑、手机、平板这些通用的、平台化的智能设备,它解决的是综合问题(多功能性、通用性),在平台之上有丰富多样的应用,一个好的平台能够催生出越来越多的应用,更多的应用也会反哺平台使之成为更大的平台(更多的应用带来更多的用户)。智能手机普及开之前,个人电脑最盛行的时期,最大的计算平台就是桌面机和笔记本,到智能手机时代,手机、平板等智能触控设备是当下最大的计算平台。交互硬件与计算平台是焦不离孟、相辅相成的,在可以预见的下一代交互硬件VR/AR/MR之上,也一定会适配全新的计算平台。我们认为,最有潜力接棒成为下一代计算平台的就是“空间计算平台”,将全面颠覆平面计算的范畴,帮助人实现虚拟与现实之间的连通与融合的计算过程。“空间计算”一词是由来自麻省理工学院媒体实验室的SimonGreenwold在2003年撰写的一篇论文中定义的。在文中Simon对于空间计算做出了如下定义:“空间计算是人机交互的一种形式,机器可以处理并操纵真实的对象及空间的相关信息。它是我们实现以下愿景的重要手段:让机器成为我们工作与娱乐中更加全面的伙伴。”他认为空间计算是人类与机器的交互,其中机器识别、定位并操纵空间内部真实的物体。理想情况下,这些真实物体和空间对用户具有优先意义。例如,允许用户创建虚拟形式并将其安装到其周围的实际空间中的系统就是空间计算。空间计算是一种允许用户将环境中的物体放入机器中进行数字化的系统。空间计算与3D建模和数字设计等相关领域的不同之处在于,它需要其处理的形式在空间内预先存在并具有现实世界的效价。在最高层次上,空间计算是机器、人、物体及其发生的环境之间的活动和交互的虚拟化,以实现和优化操作和交互。有别于传统的桌面计算和平面计算,空间计算并不局限于2维的实体屏幕的矩形框,而是可以自由地在我们周围的环境中流动。语音、视觉、手势等其他更为自然的输入方式将进一步丰富鼠标、键盘、触摸屏等传统交互模式,使人们能够以最符合人体自然生理特征的、适合自己当前场景与业务流程的方式进行接入和交互。空间计算概念应用的里程碑事件是苹果于2023年6月5日发布的VisionPro空间计算平台。我们认为AppleVisionPro的重要意义在于帮助整个VR/AR/MR产业达成了两大共识:第一,是MR将是通用XR产品的主流形态。MR的VR和AR能力可以兼顾且可以自由切换,核心技术构架则为VR+VST(VideoSeeThru)。第二,高素质高参数(如超高清显示、低时延、广视场角),将是XR设备厂商努力的重要方向。在一款XR硬件普及之前,它先需要成为一款大众都想要的硬件产品。以Meta&字节为代表的互联网公司做硬件的逻辑仍然是典型的互联网思维,而苹果正式入局之后,VR/AR/MR产业将回归到硬件公司做消费电子产品的路径与逻辑。AppleVisionPro正是当下的一款里程碑式硬件。如同Mac将我们带入了个人计算时代,iPhone将我们带入了移动计算时代,AppleVisionPro将带我们进入空间计算时代。3.定性视角下的空间计算平台定义3.1.如何定义空间计算?为什么需要空间计算?3.1.1.空间计算的定义与诞生背景如何定义空间计算?——在三维的基础之上,以人为本,连通及融合虚拟世界与现实世界的一个全新的计算范式。“在三维的基础之上”,是指空间计算的客体对象如果本身是三维的,不再需要从三维降维至二维的平面以方便计算和跟用户的交互,而是可以保持为立体的三维的,这是空间计算的基础。“以人为本”,是指空间计算的主体仍然是人,空间计算的目的是服务人与虚拟世界的交互。“连通与融合虚拟世界与现实世界”则描述了空间计算的过程与适用范畴。基于上述定义,人其实本身是一个非常高级的空间计算单元。人,作为一个计算单元,输入信号就是各种感官知觉体验感受,包括视觉、听觉、嗅觉、触觉、味觉等等,而人脑则是处理器,使用真正意义上的“神经网络”处理信息并作出决策,进而输出为各种人类活动,狩猎、社交、进食、游戏等等。人为什么称之为高级的空间计算单元?1)输入信号是多维的庞大的信号量;2)人脑是类似并行神经网络的处理器甚至是量子计算机而不是单线程;3)输出信号同样也是多维的具备一定不可预知性的。为什么需要空间计算?因为人希望突破时间与空间的双重限制。文明形态告别农业文明,历经工业文明,发展到当前这个阶段,人类已经不满足于空间位置的突破,更需要在时间上有突破。虚拟世界是可行解,借助AI、大数据、万物互联、虚拟化身、数字分身、人形机器人,人有望真正从时间的限制中解脱出来。人类对虚拟世界的依赖日益强烈。首先,当下的数字时代中,虚拟信息在效率、娱乐、便携性上拥有无可比拟的优势,阅读、使用、传递虚拟信息已经渗透入人类生活的方方面面,这些虚拟信息本身就可以归结到虚拟世界的大范畴。其次,人类对各种屏幕背后的虚拟世界已经不知不觉产生了很强的依赖,以中国网民数据为例,从深度上看,2022年月人均使用时长达177.3h,月人均使用次数达2633.0次;从广度上看,触网人群覆盖全年龄段与各线城市,包括年轻群体与银发人群,一线与低线城市。(QuestMobile)但与此同时,人类同虚拟世界的感受和反馈是存在诸多限制的。限制的来源是什么?人类一直是试图用跟真实世界一样的交互方式去探索虚拟世界。人跟真实世界的交互方式,是一种感受、思考、反馈的一个循环。人跟虚拟世界的交互方式其实也是很像的,是通过所谓的输入-输出-计算的方式来完成一个循环,这种方式只是有一个先后顺序的问题,但是其实跟真实世界是很接近的。区别在于输入、输出行为需要通过接入电子设备,计算需要通过处理器计算完成。我们将人与虚拟世界的交互方式(输入-输出-计算)与真实世界的交互方式(感受-反馈-思考)一一对应起来看,就能够发现人与虚拟世界的感受和反馈的受限,也因为有这些限制,人与虚拟世界之间的交互是不完整、不自然,因此其效率是低下的。那么,如何突破这种限制,或者说,什么样的虚拟世界才是最高效的呢?我们认为,虚实结合是虚拟世界最高效的存在形态。高效的虚拟世界应该具备两大条件,第一,信息在虚拟、现实与人脑之间,应当是无损流转的;第二,相对于与人的交互方式上来讲,虚实应当是基本相同的。人和虚拟世界高效交互方式的本质与核心在于,越贴近人与真实世界的交互方式,越能释放虚拟世界的潜力,就能更充分利用虚拟世界高效、便携、信息载量大的特点。这种高效的交互方式对计算方式提出了更高的要求,于是有了空间计算的概念。3.1.2.与平面计算的概念区别&支持空间计算的核心能力为了便于更直观地理解空间计算,我们从交互的角度将空间计算与平面计算的概念加以区分。平面计算,仅涉及人同虚拟世界的交互;而空间计算,涉及人、虚拟世界、现实世界三方的交互(其中没有人参与的虚实世界的直接交互,是一个更远期的目标)。平面计算与空间计算的最显著差异,其实是交互层面增加了一个维度。平面计算只涉及人同虚拟世界基于2D界面的交互,但空间计算,是涉及人、虚拟世界,现实世界三方的交互。值得注意的一点是,就算没有人的参与,虚拟世界跟现实世界的直接交互其实也是可以通过空间计算实现的,数字人加上机器人就是可能的实现路径之一,代替人在虚实之间存活。空间计算对应的整个架构相比平面计算都会发生改变。在平面计算机上,当我们要处理一个立体对象,会先把立体对象降维成平面,在平面处理完之后再合成立体对象。在这个过程中,大量的信息会丢失。未来,在空间计算机上,我们将不再需要这样一个降维的过程。3.2.新一代交互硬件——空间计算设备3.2.1.空间计算设备,强调以人为本基于空间计算的定义,就可以定义空间计算设备。空间计算设备就是以人为本,服务于空间计算过程的设备。简言之,帮助人完成连通及融合虚拟世界与现实世界的计算过程就是空间计算,帮助人完成真实世界跟空虚拟世界的交互设备就是空间计算设备。这里需要对有人场景与无人场景做一个区分,在有人场景当中,空间计算设备是一个辅助的概念,辅助人和虚拟世界、人和现实世界的交互,以及辅助虚实结合的过程。在无人场景中,空间计算打破空间、时间的限制,以数字人/虚拟人的身份直接在现实世界和虚拟世界中替代人类生活。目前,行业发展趋势还是以服务“有人场景”为主。围绕输入-输出-计算:输入指令功能是具象化同时支持人跟虚拟世界现实世界的指令操作。输出感受功能是具象化人对虚拟世界的体验,具象化中短期是通过感觉器官,远期可能是通过脑电信号。计算和处理就AI算法神经网络需要支持设备需要支持计算功能。空间计算设备的意义,最终还是以人为本,帮人解脱空间和时间的限制,无论是有人场景还是无人场景。空间计算设备,需要具备哪几个必要条件?首先,空间计算设备要具备空间计算单元及与其相匹配的算法。第二,空间计算设备要能够完成人-虚拟世界-现实世界的融合交互。第三,空间计算设备能处理多维的信号输入与输出。空间计算设备天然地需要服务于多维的空间计算架构,无论是输入信号还是输出信号都是多模态的。以VR为例,输入方式包括眼睛、手势、语音,相比PC、手机的键鼠、触屏要更加多样化、并行化。3.2.2.脑机接口是空间计算设备的远期形态脑机接口(Brain-ComputerInterface,BCI),是在人或动物脑(或者脑细胞的培养物)与计算机或其他电子设备之间建立的不依赖于常规大脑信息输出通路(外周神经和肌肉组织)的一种全新通讯和控制技术。“脑机接口”的定义=“脑”+机“+”接口”。即,在人或动物脑(或者脑细胞的培养物)与外部设备间创建的用于信息交换的连接通路。从长远的角度看,我们认为脑机接口是空间计算设备的远期形态,在操控上完全体现人脑意识操控虚拟现实操作的无缝无感的切换,完美符合空间计算设备的定义。人类通过感知能力感受环境并且传递给大脑,感知包括视觉、触觉、听觉、嗅觉和味觉等等。脑机接口通过电信号模拟,其实是可以完全替代人类的感觉器官的,因为不管怎么样都是以电信号的模式在传导。从计算机的处理功能角度,我们认为脑机接口是通过模拟、整合、增强的逻辑与人脑完全融合的。它先模拟人脑计算,再整合人脑提高整体的计算能力,在生物学意义上能够增强神经网络计算能力。3.2.3.AppleVisionPro是初级空间计算设备的典型代表苹果在WWDC发布会上开门见山地表达了VisionPro的定位是首款可佩戴的空间计算设备,以及产品划时代的意义——认为VisionPro会将用户带入空间计算的时代,其底层逻辑是空间计算平台。站在苹果的视角,个人计算时代的设备,例如PC和Mac,解放了个人的计算负担,使人能专注于创造;移动计算时代的设备,例如iPhone,iPad这样的手机和平板,以人为结点,有效链接了世界,使得信息传递更为方便快速;那么苹果所提出的空间计算,则是解构和再造了空间,使人能有机会进入到多维时空中。为了更好的服务于空间计算,AppleVisionPro集成了以下三种能力。立足当下来看,我们认为Applevisionpro是目前初级空间计算设备的一个典型代表。3.3.平面计算向空间计算过渡的颠覆性和必然性3.3.1.计算升维是一种时代颠覆,PC到手机的变迁无法与之类比升维,对于人类而言意义重大。人类是生存于四维时空的三维生物,可以理解三个空间维度和一个时间维度。人类与世界的交互方式,人类感知世界与处理信息的方式是三维的。人类的文明能够超越基因的沉淀而延续与传承,关键的是通过间接知识或间接经验代代相传。直接经验与间接经验,是知识结构的两个部分,直接经验是指由亲身参加或实地实践所获得的知识,间接经验是指从别人或书本那里学习得来的知识。人类通过感知与实践得来的直接知识,是三维+时间的完整体验,而其作为间接知识形成与传播时,受技术水平所限,多以文字、书本等一、二维为载体体现,在提升了传播效率的同时也牺牲了信息密度。文字是一维的,图片是二维的,视频是二维+时间,但无论哪一种载体,相比直接知识和经验都是一种降维。在降维的过程中,间接知识损失了许多必要信息,不再能复现完整的知识或体验。因此,升维的重要意义是显而易见的。以三维信息作为载体最接近人类的真实体验,相比二维信息显著提升了传播效率与传播精度,将间接知识传播过程中在形成与传播的过程中的损耗降至最低。接近人类的真实体验/符合人类的交互习惯到底有多重要呢?从宏大叙事的视角,有助于提升全人类文明的进步效率;从技术普及的视角,对推进技术平民化至关重要。一个最佳的例证就是计算机的发明与普及。计算机可以看做是人脑的延伸,将信息、知识、文化抽象化,并以计算机能够理解的语言和方式进行处理,成为人类重要的生产工具。但计算机的使用仍然是有门槛的,最早的计算机是服务于科研人员及军事领域的实验室产品,图形界面取代代码命令后,二维的图文相比一维的代码更易为用户理解,计算机也逐渐走入寻常百姓家。从一维到二维(仍然属于平面计算的范畴),计算机完成了普及的使命——一般的用户可以无障碍完成基础操作,经过训练的用户可以使用各种计算机软件完成更高阶操作,如制图、建模、开发等。从平面到空间的计算升维,是用新的成体系技术,对老的技术体系进行“降维打击”。空间计算是个三维计算的概念,平面计算是二维的,这种技术上的隔阂天然的就是一种“降维打击”。本身平面计算是建立在平面坐标系+时间上的(3个维度的信息),对比三维计算(三维坐标系+时间,其实是4维信息),在信息获取量、信息输出量、计算负担上,都是一整个数量级的差距。同时,围绕着信息获取的方式,输出的方式,计算的方式,平面计算已经形成了自己成体系的技术和产品,比如信息获取,就是靠现在的平面输入设备及技术(键盘鼠标麦克风,以及语音识别等等技术),输出方式就是靠屏幕、音箱等设备和技术,计算还是基于CPU+GPU的平面计算。但是空间计算的技术体系和产品是全新的,虽然有部分和老的技术体现有相似性,但是在技术上也需要迭代,更不必说可能会产生全新的输入、输出、计算(量子计算等)方式。这种老的技术体系向新的技术体系的进化,不一定只有过渡和继承,而有可能是完全的颠覆。这种颠覆性,就可以被看作是新技术体系向老技术体系的“降维打击”。3.3.2.空间计算的时代必将到来平面计算的技术和体验已然见顶。据发改委网站数据统计,2022年全球智能手机出货量为12.1亿台,同比下降11.3%,出货量前五家企业市场占有率总和为69.9%。其中,小米出货量为1.5亿台,同比下降19.8%,市场占有率为12.7%;OPPO出货量为1.0亿台,同比下降22.7%,市场占有率为8.6%;Vivo出货量为1.0亿台,同比下降22.8%,市场占有率为8.2%。可以说,智能手机的出货量已见颓势,而这背后其实是智能手机背后的平面计算所能提供的用户体验已经遇到了显而易见的发展瓶颈,需要空间计算带来破局机会。与此同时,空间计算的技术和体验拐点已经到来,AppleVisionPro就是标杆产品。在PC时代与智能手机时代,苹果已经多次证明过其定义行业拐点的成功经验——1984年推出的Macintosh、2007年推出的iPhone,2023年发布的VisionPro有望再次书写历史。这一轮空间计算浪潮之下,我们仍然看好苹果看准未来及塑造未来的能力。看准未来的能力,指的是苹果VisionPro预测并描绘了一个全新的空间计算概念,是具备跨时代属性的。塑造未来的能力,指的是苹果有能力预测一代又一代的标杆式产品并有能力把这些预测变成行业的共识和现实。苹果在个人计算和移动互联时代都曾推出过颠覆性的产品:在个人计算,也就是PC时代,苹果于1984年推出了Macintosh;而在移动互联时代,苹果在2007年推出的iPhone,更是颠覆了业内一众键盘手机。这次,苹果自然也期待VisionPro能成为其定义的空间计算时代的颠覆性产品。站在苹果的视角,个人计算时代的设备,例如PC和Mac,解放了个人的计算负担,使人能专注于创造;移动计算时代的设备,例如iPhone,iPad这样的手机和平板,以人为结点,有效链接了世界,使得信息传递更为方便快速;那么苹果所提出的空间计算,则是解构和再造了空间,使人能有机会进入到多维时空中。苹果推出VisionPro之后,硬件已经不是制约空间计算能力的主要因素。我们在下文3.2将PimaxCrystal、VarjoAero、MetaQuest3、HTCVivePro2、ValveIndex、Pico4Pro、DPVRE4、YVR2与AppleVisionPro进行参数比较。从纯硬件参数的角度比较,在涉及显示、光学、图像、追踪定位等方面,部分现有VR产品的硬件参数是可以等同甚至是可以优于AppleVisionPro的。基于以上对硬件参数的比较,我们进一步发现,目前,制约空间计算的核心矛盾不是硬件而是算力。VisonPro问世之前,VR长期以来是互联网公司的逻辑,Visionpro出来之后,就回归到硬件公司的逻辑。过去VR行业长期由Meta引领,而Meta做硬件是典型的互联网公司逻辑,重视用户数量的增长而牺牲一定程度的用户体验。而苹果VisionPro将引领行业重新回到硬件公司的逻辑,以用户体验为优先,更加关注硬件设计方面的核心能力。当设备的颠覆性(屏幕替代性)得到初步显现后,将引发产业链的跑步追赶,行业将进入高速增长时代。4.定量视角下的空间计算能力比较4.1.空间计算设备的产业链剖析&供应商整理4.1.1.光学模组:方案各有千秋,平衡轻薄与清晰度两大关键需求在空间计算设备结构中,光学模组作为连接显示屏和人眼的重要桥梁,是最为关键的组件之一,直接影响到最终的显示效果与使用体验。光学技术的发展缓慢,一直是VR/AR/MR快速扩张的瓶颈之一。当前的主流光学模组主要包括非球面透镜、菲涅尔透镜、Pancake三种方案,实际应用中厂商会在极致轻薄与极致清晰之间作一定取舍。非球面透镜通畅有着更清晰的成像质量、更高的放大率与更广的视野,但透镜的厚度与重量较大。Pancake折叠光路方案则在轻薄度上领先,通过多片光学镜片让光路多次折返,从而缩小整个光学模组总长,但不可避免地会产生“伪影”、损失光效,影响最终成像效果。前沿的超表面/超透镜方案有望平衡轻薄与清晰度两大需求。超表面透镜能利用纳米结构聚光进而达到避免色差出现的平面,且能形成特定的重复模式模拟折射光线的复杂曲率,使其没有传统透镜笨重,并能在减少畸变的情况下改善聚焦光线的能力。4.1.2.显示面板:技术持续演进,Micro-OLED预计成为中期行业主流早期VR头戴式设备大部分采用普通LCD,而后逐渐被OLED取代。2016年前后,OLED技术尝试用于VR设备中,并一度成为VR设备生产商的首选。2018年以后,Fast-LCD技术的出现让LCD逐渐成为主流选择。自2022年起,显示方案进一步迭代,AppleVisionPro使用硅基OLED显示方案,QuestPro使用MiniLED背光的FastLCD显示面板等。MicroLED有望成为远期最佳显示方案。MicroLED指在一个芯片上集成的高密度微小尺寸的LED阵列,如LED显示屏每一个像素可定址、单独驱动点亮,可看成是户外LED显示屏的微缩版,将像素点距离从毫米级降低至微米级。通过巨量转移技术,将微米等级的RGB三色MicroLED搬到基板上,形成各种尺寸的MicroLED显示器。MicroLED的芯片到了肉眼难以分辨的等级,可以直接将R、G、B三原色的芯片拼成一个像素点,变成“一个像素”的概念,不再需要滤光片和液晶层。MicroLED用到的自主发光器件,即LED半导体灯珠,是一个正负极性明确、体积形状固定的固体小颗粒灯珠,再通过“巨量转移”技术平面化集成大量的微小LED灯珠器件。“巨量转移”技术是MicroLED产业独有技术,难以从其它相关产业获得巨大的技术帮助。目前,MicroLED巨量转移技术依然处在实验室攻关阶段。4.1.3.背光技术:MiniLED背光LCD为超高清显示可行方案LED背光源由直流驱动,工作电流易控制光电转换效率接近100%,在相同的照明效果下比传统的光源节能80%以上。且使用寿命很长,基本都在传统背光源的10倍以上,甚至可以高达10万小时。LED是固态发光源,启动电压比较低,防震性好,色域宽广等等。另外LED还具有在线编程亮度可控、灵活多变的特点。LED背光主要有侧入式背光、直下式背光、MiniLED三种方案。4.1.4.摄像头:数量显著增加,VST、面追&眼追、空间定位各司其职摄像头可以看做是空间计算设备的“眼睛”,摄像头品质和功能是良好用户体验的关键。从每个设备上摄像头数量来看,2022年下半年上市的VR设备标配6颗以上的摄像头,旗舰产品至少8颗摄像头,且摄像头的数量仍有增加的趋势。AppleVisionPro配备了12颗摄像头,包括2组RGB主相机、4组下视角相机(2组近乎垂直向下,两组斜向下)、2组外侧视角相机、以及4组眼球追踪红外相机(头显内侧)。RGB摄像头:用于拍摄外部影像,和内部显示模组提供实时的立体视觉,提供一种透视的效果。让VR一体机拥有AR设备的能力,可以虚实结合,已经成为标配摄像头。VST图像的清晰程度取决于RGB摄像头的采样能力:1、RGB摄像头是现在VST显示画面清晰度的瓶颈;2、摄像头本身是带视场角的,所以需要用2颗RGB摄像头以降低边缘畸变;3、需要机器识别算法对RGB摄像头拍出来的画面进行调整优化已达到最佳显示效果。眼动追踪摄像头:眼动追踪研究的最关注的事件是确定人类或者动物看的地方。更准确说是通过仪器设备进行图像处理技术,定位瞳孔位置,获取坐标,并通过一定的算法,计算眼睛注视或者凝视的点。所有基于视频的眼动追踪的核心是一个或多个摄像头,它们可以拍摄一系列的眼睛图像,计算出受试者正在看屏幕的坐标位置,并将此信息传递回控制刺激信号的计算机。面部追踪摄像头:用于捕捉用者的面部表情甚至重建使用者的面部。这是为了以后元宇宙的交流更加自然,更加像现实中的体验。这个功能会用2颗微光红外眼球跟踪摄像头,1颗嘴部动作捕捉摄像头来实现。6DoF摄像头:用于感知环境,捕捉手柄和手部动作,实现最重要的人机交互方式。经过一个联合标定的过程建立一个SLAM地图,用来捕捉手柄和人手在这个SLAM地图中的运动情况。标定的算法与空间算法上的差异会导致用户使用中体验的差别,在VR世界中进行球类游戏和其他需要跟踪精准的手部动作的应用中会体现得比较突出。4.1.5.传感器:重要性凸显,dToFLiDAR有望成为标配方案传感器所占的比例越来越重,颠覆性的人机交互依赖于传感器的实现。普通的彩色相机拍摄到的图片能看到相机视角内的所有物体并记录下来,但是其所记录的数据不包含这些物体距离相机的距离。仅仅能通过图像的语义分析来判断哪些物体离我们比较远,哪些比较近,但是并没有确切的数据。而深度相机则恰恰解决了该问题,通过深度相机获取到的数据,我们能准确知道图像中每个点离摄像头距离,这样加上该点在2D图像中的(x,y)坐标,就能获取图像中每个点的三维空间坐标。通过三维坐标就能还原真实场景,实现场景建模等应用。AppleVisionPro配备了5个传感器,包括1个LiDAR、2颗深度相机、2组未知传感器(位于外壳上方中间区域)。深度传感器一般分为结构光、双目立体视觉、ToF三种技术路径,其中结构光与双目技术都是基于几何原理做间接深度估计,而ToF则是测量发射光和反射光之间的飞行时间并根据光速来直接估计深度。其中,ToF(time-of-flight,飞行时间)的概念是扎根于深度传感器的,指采用像素阵列来获取整个场景的高分辨率深度分布。而LiDAR主要应用于自动驾驶领域,是根据发射光和反射光之间的飞行时间来直接估计目标距离。也就是说,如果从测量原理来看,所有的LiDAR都是ToF。因此,ToFLiDAR通常指的是那些基于测量发射和反射光之间的飞行时间来获得高分辨率场景深度/目标距离分布的传感器。ToF方案又可进一步细分为dToF与iToF。dToF和iToF的原理区别主要在于发射和反射光的区别。dToF的原理比较直接,即直接发射一个光脉冲,之后测量反射光脉冲和发射光脉冲之间的时间间隔,就可以得到光的飞行时间。而iToF的原理则要复杂一些,在iToF中,发射的并非一个光脉冲,而是调制过的光。接收到的反射调制光和发射的调制光之间存在一个相位差,通过检测该相位差就能测量出飞行时间,从而估计出距离。从原理上来看,iToF的最大问题就在于最大测距距离和测距精度之间的矛盾。而dToF相较于iToF来说难度要大许多。dToF的难点在于要检测的光信号是一个脉冲信号,因此检测器对于光的敏感度比非常高。常见的dToF传感器实现是使用SPAD(single-photonavalanchediode,单光子雪崩二极管)。SPAD的工作区域位于二极管的击穿区附近,当单个光子进入SPAD后就会产生大量的电子-空穴对,从而SPAD能检测到非常微弱的光脉冲。从器件角度来看,SPAD的集成度要低于普通的CMOS光传感器,因此dToF传感器的2D分辨率较差。随着近几年深度传感器和LiDAR的发展,dToF也得到了长足的发展。从光传感器像素来看,dToF目前也可以使用CMOS工艺实现,并且已经可以实现不错的2D分辨率。随着ARVR等新应用的兴起,消费电子领域对于深度传感器的需求也在快速上升。消费电子领域传统上是iToF的天下,因为在消费电子领域的应用中对于ToF传感器的最大测距距离需求较低(数米之内),而对于2D分辨率和成本的需求则较高。然而,随着dToF技术,尤其是高集成度CMOSSPAD的发展,dToF正在从高端进入消费电子市场。4.2.空间计算设备的硬件参数比较我们选取了PimaxCrystal、VarjoAero、MetaQuest3、HTCVivePro2、ValveIndex、Pico4Pro、DPVRE4、YVR2与AppleVisionPro进行参数比较。从纯硬件参数的角度比较,在涉及显示、光学、图像、追踪定位等方面,现有VR产品的硬件参数是可以等同甚至是可以优于AppleVisionPro的。显示:预计AppleVisionPro可实现等效3400x3400单眼的清晰度,支持90Hz刷新率;而PimaxCrystal、VarjoAero、MetaQuest3也能够实现2880x2880、2880x2720、2064x2208单眼的清晰度,支持90-120Hz刷新率。光学:AppleVisionPro采用Pancake光学模组,支持自动瞳距调节,通过双摄像头实现Passthrough功能;其余空间计算设备在光学模组的选择上包含Pancake、非球面透镜、菲涅尔透镜三种,多数也都支持自动瞳距调节,有Passthrough功能。图像:AppleVisionPro目前的水平与垂直视场角未知,其余设备的水平视场角在95°-110°之间,垂直视场角在73°-104°之间。AppleVisionPro、PimaxCrystal、VarjoAero均支持动态注视点技术。追踪定位:多数设备采用6DoFInside-out追踪定位方案,支持眼部追踪、脸部追踪、手势识别等。4.3.以AppleVisionPro为标杆,量化评分各空间计算设备4.3.1.AppleVisionPro的再拆解(评价基准)在前文对空间计算设备的定义中,我们强调了空间计算设备是以人为本,服务于连通及融合虚拟世界与现实世界的计算过程的设备。空间计算设备的意义,最终还是以人为本,帮人去解脱空间与时间的双重限制。立足于用户视角,向虚拟世界、现实世界的输入、输出都是多维的双向的。输入完成指令功能,既支持人向虚拟世界的输入,路径包括眼睛注视、头部及手势识别、语音输入、记录空间视频,也支持人向现实世界的输入,路径为Eyesight(现实互见),戴上空间设备之后仍然需要与现实世界当中的人与物互动。输出完成感受功能,既支持虚拟世界向使用者的输出,路径包括超高清显示、空间视频、空间音频,也支持虚拟世界向其他用户的输出,Persona(数字人),同时也是人在虚拟世界的一种存在形态。4.3.2.空间计算设备重点功能分析(评分体系)核心功能模块为以苹果对于其空间计算设备的核心功能定义作为框架,包括输入的眼睛注视、头部及手势识别、语音输入、记录空间视频、Eyesight(现实互见),输出的超高清显示、空间视频、空间音频、Persona(数字人)。重要性/优先级排序:眼睛注视、头手识别、超高清显示为第一梯队,空间音频、空间视频为第二梯队,语音输入、视频记录、现实互见与数字人为锦上添花体验。在现有的用户体验框架下,我们认为眼睛注视、头手识别、超高清显示是能够显著提升用户体验的功能模块,在此基础上,辅以空间音频、空间视频体验,有助于加深用户在虚拟空间中的沉浸感,而语音输入、视频记录、现实互见和数字人体验,是在实现上述功能之后的锦上添花体验,重要性或优先级相对不高。评价基准为我们对算力的需求程度、算法的有效优化、整体的实现难度、其相应功能之于用户体验的重要性、以及现有行业解决方案的成熟度,进行“高-中-低”的主观评价。4.3.3.国内外厂商空间计算能力排序(具体评分)在算力不足的前提下,厂商的竞争力首先体现在整机整合、调校能力上,即如何用Costeffective的方式挖掘和利用上游厂商提供元器件的物理性能极限,决定了目前阶段整机厂商能Deliver产品的核心体验。苹果的整合和调通能力壁垒毋庸置疑,而Meta作为近几年将研发重心投向元宇宙的巨无霸企业,也理应具备相应能力,但其产品策略为“出货量优先、低价强推”,一定程度上为了尽快扩大用户基数而牺牲了用户体验。例如国内企业小派科技,就是并没有在“安全/保险”的建议边界内做平庸的产品,而是坚持自己对行业和用户体验的认知,利用现有相同的上游产品,去打造相对体验更好的产品,构筑了其行业上半场较高的技术壁垒。同时,我们也应该意识到,多数VR设备/硬件厂商,在语音输入、空间音视频、数字人方面的集成和积累不如苹果,但这些能力,大多不是硬件层面的问题,而存在于软件/算法层面。对于空间计算的核心公司来说,不同整机厂商在下游的应用开发者平台体验和App层面的用户体验也存在核心差异。目前在PCVR领域,无论是在游戏场景趋于成熟的Valve生态,和微软已经深耕多年的WindowsMixedReality生态,都是对纯硬件厂商较为友好的,能够支撑VR硬件的有效增长。而一体机领域诸如Apple、Meta这样较为封闭的生态,在逐步成熟后,也必然会出现替代的开放生态平台。基于上述观点,我们以AppleVisionPro的核心功能模块为基础,按其对用户的体验重要程度以及实现难度进行加权:眼睛注视权重24.9%、头手识别权重8.3%、语音输入权重2.8%、记录空间视频权重4.6%、Eyesight现实互见权重4.6%、超高清显示权重24.9%、空间视频权重13.8%、空间音频权重7.7%、Persona数字人权重8.3%。苹果各功能模块基准评分为10.0,对VR行业的核心厂商进行评分如下,加权后评分从高到低依次为Apple(10.0)、Pimax(5.9)、Meta(5.0)、Varjo(4.5)、Pico(4.4)、HTC(4.3)、DPVR(3.5)、YVR(3.5)、Valve(3.2)。对于以苹果核心功能为基础,权重是指我们认为现在的MR设备对用户体验影响相对最大的部分。5.阵营与主赛道分析:出货量优先VS性能优先5.1.AppleVisionPro发布对竞争格局的影响5.1.1.MR形态成为XR产品的主流形态MR的VR和AR能力可以兼顾且可以自由切换,核心技术构架则为VR+VST(VideoSeeThru)。展开来说,传统意义上的AR公司所采用的是OpticalSeeThrough,即OST方案,是指周围环境反射的可见光穿过镜片直接进入人眼成像,虚拟物体则直接显示在在半透明的近眼显示屏幕上,两者叠加形成虚实结合的效果。OST方案从理论上可以做的更轻便,更接近常见的眼镜,但其本质特点是较小的视场角内的虚拟物体直接叠加在更大的自然视野内的真实环境的物体之上,无法真正实现虚实“无缝”融合的效果。OST方案的另外一个致命缺陷是它只能适用于狭义的AR模式,无法支持VR模式,通用性不足,不能成为真正的MR产品。而VST模式则可以把周围环境的信息全面采集,经过处理后,和虚拟的物体实现无缝的结合,再统一展示在完整的视野中。这样在理论上才能保证虚实完美融合的可能性,同时保留了对真实环境进行加工和升级的可能性,也保证了在数字空间中再次传播的一致性,显然是更具通用性和可扩展性的一种模式。另外VST方案可以同时兼容VR和AR两种模式,显然更符合MR的产品理念。行业内长期以来存在这两条路线之争。苹果这次推出的VisionPro,是采用了VR+VST的技术路线。VST模式才能从理论上真正保证优秀的用户体验,是实现MR的终极模式。该模式目前面临的挑战比如算力、体积和续航问题,都在随着技术的进步而逐步解决中,但是OST模式有其底层产品逻辑上的致命缺陷,无法支持通用MR的未来。有苹果带头与引领,相信VR+VST也必然将在相当长时间内代表通用MR产品的核心形态和技术路线。5.1.2.AppleVisionPro树立性能与体验标杆VisionPro问世之前,市面上的VR硬件参数虽然整体呈现优化、改善的趋势,但是部分参数距离良好的用户体验始终存在差距,最典型的莫过于屏幕分辨率。主流VR设备的分辨率长期停留在4K以下,仅仅极少数VR设备如Pimax8KX、PimaxCrystal等分辨率达8K水平,视觉沉浸感严重不足;同时,显示不清晰也是造成用户“眩晕感”的重要原因之一。VisionPro问世之后,将重新刷新用户对于良好的视觉沉浸感的认知,倒逼厂商改善光学与显示方案以提高分辨率。视觉本身是一个“环绕”的球面概念,所谓的2K/4K/8K分辨率,其实可以看做是像素点平铺在了人眼的球面空间上。如果在单位角度上像素点较为密集,自然在平铺的角度上就会有所牺牲,即在相同的总分辨率下,“清晰”和“宽广”是矛盾的,这就反映了行业核心参数角分辨率PPD(PixelsperDegree)和视场角FOV(FieldofView)之间此消彼长的关系。反过来说,只有将屏幕的总像素数做的足够多,才能同时做到显示效果的“清晰”和“宽广”。小派和苹果的产品都做到了8K级别的水平像素总数,才能同时保证这两方面的体验。低于8K分辨率水平,比如占据目前行业出货量大部分的4K级别VR头显,确实是在低价格的基础上帮助用户用较低的成本体验VR的一些乐趣,一定程度上加快了VR在消费市场的渗透。但是对行业的不利影响则是,进一步强化了消费者群体对VR“还是不够清晰”的偏见。在视觉体验之外,AppleVision在输入、输出方面的多项能力与配置,有望引领行业内产品跟进。比如空间视频、空间音频将成为普遍配置,与超高清显示一起,共同为用户提供沉浸式的视听体验。比如眼动追踪&面部追踪、手势识别将成为重点优化功能,人在虚拟世界当中的交互将变得更为自然。比如现实互见与Persna数字人将迎来更多探索,进一步丰富虚拟与现实之间的社交生态……5.2.互联网公司“出货量优先”VS硬件公司“性能优先”苹果入局之后,整个VR市场暂时分成了两条不同的战线,分别对应通往终局的两条不同的路径。一条是苹果和小派为代表的“性能先行、价格渐降”路径,这条路径遵循硬件行业的基本商业逻辑和演进规律。另外一条则是Meta和字节主导的“出货量先行,低价强推”路径。虽然从终局思维的角度看,最后两条战线必将殊途同归。但是在很长一段时间内,这两条战线的将走出两条截然不同的道路。从出货量的角度看,目前第二条路径占据了绝大多数,但这条路径也面临相当大的挑战,最核心的问题是硬件性能局限。Meta和字节主导的“出货量先行,低价强推”是典型的做互联网平台的逻辑,互联网公司做自己的通用硬件品牌。但是互联网平台业务和通用型硬件业务这两个商业模式本身就是互斥的。核心的原因,就是作为一个通用平台这种互联网业务,尤其是大社交业务平台,必然是赢者通吃的,目标是cover百分之百的人群。但是硬件天然不是这样,它天然是更分散的,因为同一个品牌、同一款产品不可能cover所有人的需求。但是为什么以Meta为代表的互联网公司会决定自己来做自己的VR硬件呢?其中固然有“反抗”苹果在面向互联网应用运营商的强势地位这样的战术性因素,但更重要的是在战略层面,扎克伯格要在互联网从2D到3D(也就是空间互联网)这种代际转移的过程中,确保自己不会掉队实现,从而实现“安全”的跨越。“保证”在互联网进入3D时代之后,自己能够继续“维持”甚至“强化”其行业龙头地位。为达成这一战略目的,Meta采取了所谓“垂直封闭策略”,就是把硬件、软件、内容和用户等VR行业发展所必需的、本来应该多家公司分别经营的业务资源整合在同一个公司下面,主动催生整个行业的爆发,并在这个过程中,积累元宇宙时代大社交业务的种子用户群体。当种子用户群体的体量一旦跨越临界质量,便可以通过强大的网络效应,形成不可逾越的先发优势。到时,再把这个社交软件向其他硬件开放,形成跨硬件的大社交平台。这样就实现了通过“垂直封闭”的过渡性策略实现在最终“开放兼容”格局下的垄断地位。做消费电子产品的逻辑,首先要把核心性能指标做到“良好”的水平,能够较好地满足用户的基本需求。这时候价格一定是偏高的,针对的是市场上对价格不敏感的earlyadopters形成一定的出货量,在商业上达成一定意义上的成功(至少是较高的毛利率)。AppleVisionPro很有希望成为一个行业拐点产品。在这个基础上,通过技术的迭代、供应链的完善,逐步降低成本,从而降低价格,从上往下逐次形成对不同层级的消费者的分段渗透,在这个过程中随着出货量的增加,供应链整体成本会进一步降低,形成良性循环,最后实现对大部分消费者的渗透。大部分技术含量较高的耐用消费品(电子和汽车为典型代表)各自的发展都是经历了这样一个过程。这个演进的过程的节奏,在很大程度上是由相关底层技术进步的节奏和整个产业链的发展节奏决定的。作为整机厂商在这个过程中有可能发挥较大的作用,但是很难在本质上大幅影响这个演进过程的节奏。6.大模型×空间计算平台,预计24、25年爆款将频现6.1.大模型×空间计算平台:景气上行的诸多方向(6个)以大模型(ChatGPT)为代表的新一轮AI浪潮,正掀起新的产业革命。上一轮移动互联网浪潮本质上是实现网络渗透率提升的过程,头部大公司如腾讯、阿里、百度、滴滴、美团、字节跳动等,它们的投资价值通常需要用更大的用户数量及单用户价值来体现,所以这些大公司都体现为平台型公司,即覆盖及连接用户为核心壁垒。以大模型为代表的新一轮AI浪潮是在场景数字化程度较高的基础上掀起的智能化升级,大模型通过自然语言交互的方式重新定义了人与机器交互的方式。ChatGPT作为AIGC的一种产品形态,对话框的“聊天”功能只是表象,其背后是底层AI能力的改变,即主要是NLP(自然语言处理)的一大进步,它所呈现出来的自然语言交互能力,其本质是“下一代人工智能的操作系统”。此外,通过生成式AI提高了诸如文案生成、脚本创作等工作的效率,由于颠覆了内容生产方式,因而对现有的平台格局将形成巨大的冲击。其景气度及持续期取决于是否会迁移至新的计算平台上——再次升维的空间计算平台。新一轮AI浪潮已经对现实世界形成了巨大的影响,但如果仍在移动互联网框架内,那则只是对现有的产业进行升级与迭代,则是在存量空间中的零和博弈。我们认为以AppleVisionpro为代表的MR眼镜出现有望打开新的增量空间,一方面存在虚拟世界,在其上所有的场景都值得被建设一遍;另一方面虚拟与现实融合将产生更多交互关系,也将产生满足新交互范式的内容。大模型x空间计算平台,这一轮的创新周期是软硬结合向前走,带来乘数效应,不是简单的加法。人工智能、智能硬件(空间计算)、智能合约分别对应生产力、新空间(新平台)、生产关系,软硬结合相互促进、相互影响,是各类技术涌现以及众多企业接力赛的过程。人工智能:AI现在涌现的是AIGC,爆款产品形态是ChatGPT,它实际上是先进的生产力,代表的是软实力部分;智能硬件:开辟了新的空间入口,分布式垂直硬件改造了现实物理世界空间,相当于在现实物理世界叠加了一层智能维度;智能合约:可以实现自动化的合约执行,从而降低交易成本,提高交易效率,改善生产关系。实际上智能合约确实是面向未来搜索的,基于让人的创造力更加迸发的要素之一。6.2.大模型×空间计算平台:每个方向上可能出爆款的大致推演每一代新计算平台的发展,都伴随着技术与工具的升级,并带来各类创新的内容与应用。尤其是在移动互联网发展的最初几年,各类toC端的应用不断涌现,如淘宝、微信、视频平台、手游等,其中绝大多数的热门App或应用都是属于顺人性产品。在互联网产品设计的过程中,工程师会将人性的因素考虑进来。我们将产品分为两大类,顺人性产品与逆人性产品。顺人性,即顺应用户的需求,更方便、更快捷的满足人类基本的低层次欲望。顺人性产品往往利用人性中本能的欲望来打造产品,以迎合人性,比如欲望驱使下的贪嗔痴的需求,越低层的需求市场越大,比较典型的就是游戏、长短视频、打折优惠等这类产品。逆人性,即通过某些手段克制人类某些原始的欲望,如贪嗔痴,目的则是为了满足人类更高层次的需求。典型的逆人性产品主要集中在延迟满足需求强的行业,比如教育与健康类的产品;以及需要自律管理需求的行业,比如各类办公管理类的产品。移动互联网与智能手机率先对人们的“吃喝玩乐”领域进行了革新,尤其是在内容供给端,手游、长短视频的发展丰富了人们的精神娱乐,但这类“吃喝玩乐”的内容与应用多为顺人性产品,而移动互联网时代的逆人性产品则发展的非常缓慢。当下,我们正处于下一代计算平台的技术变革中,目前来看,这一轮AIGC的崭露头角,从AI绘画到ChatGPT,随着应用场景的扩容,人们对AIGC商业化潜力的关注度,逐步从偏C端的娱乐,拓宽至工业、金融、教育等B端领域。一定程度上,AI绘画其实是属于小B端的应用,ChatGPT也在论文写作、商业分析报告以及代码编写等领域展现出了非常的能力。AIGC与ChatGPT的本质是AI,AI作为新的生产力工具而存在,从这个角度看,AI对传媒产业的影响,将显著不同于移动互联网时代的顺人性产品跑得快的逻辑,我们预计AIGC将率先革命化的应用/场景可能是逆人性产品。上网时代,顺人性的爆款应用非常多,而上算时代,逆人性的应用会更加多,这背后的原因在于:1)AI将着重率先改造移动互联网未能解决的领域,存在增量;2)基于防御性目的,人们“主动”学习AIGC以提升自身生产力。这一轮AIGC、ChatGPT本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论