人形机器人产业发展研究报告(2024年)_第1页
人形机器人产业发展研究报告(2024年)_第2页
人形机器人产业发展研究报告(2024年)_第3页
人形机器人产业发展研究报告(2024年)_第4页
人形机器人产业发展研究报告(2024年)_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

集智专题报告人形机器人产业发展研究报告(2024年)中国信息通信研究院泰尔系统实验室2024年12月版权声明本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。人形机器人作为未来产业的重要赛道,是科技自立自强的标志型成果,是人工智能、机械工程、电子工程等领域融合创新的典范,也是实现新质生产力的最佳手段之一。人形机器人凭借其类人的感知交互能力、肢体结构和运动方式,能够快速融入为人类设计的各种环境,未来有望在简单重复劳动和危险场景中替代人类,在复杂技能场景中辅助人类,在商业和家庭场景中服务人类。可以预见,未来人形机器人的广泛应用将深刻改变社会形态和人们的生产生活方式,已成为全球科技领域的发展热点。业界普遍认为,人形机器人未来有望成为继个人电脑、智能手机、新能源汽车后的新终端,形成新的万亿级市场。本报告从人形机器人内涵出发,深入分析人形机器人核心技术及重点产品的发展现状和演进路径、产业布局的重点方向、应用需求和市场预期等。同时,聚焦生产制造、社会服务、特种作业等方向,梳理典型应用场景,明确不同场景对人形机器人的共性需求和差异化需求。最后,研究提出了对未来人形机器人产业发展的路径考虑,助力推动我国人形机器人高质量发展。 1 1 2 4 6 6 7 9(四)“小脑”加载人工智能技术,运动方式更加拟人 (五)“肢体”多技术融合发展,技术路线逐步收敛 2图2人形机器人的分类(按形态划分) 3图3人形机器人的分类(按功能划分) 4 6 7图6人形机器人三大执行机构 图10人形机器人商业化落地的三个阶段 1(一)人形机器人的内涵人形机器人指模仿人类外观和行为,具备较高智能化水平的机器人,与传统工业机器人、服务机器人相比,最大的特点是其与人类相似的“肢体”结构、运动方式和感知方式,并在人工智能大模型的赋能下,从体能、技能、智能三方面,实现对人的模仿。人形机器人具有拟人智能、类人形态和广泛适用三个特点:一是拟人智能。一方面人形机器人可以通过人工智能大模型技术的赋能,实现拟人化的感知、决策、控制能力;另一方面,人形机器人还可以选择通过云“大脑”和智能联网的方式,突破“一个躯体、一个大脑”的限制,实现算力和智能的飞跃。二是类人形态。人的形态是生物进化自然选择的结果,目前社会中的所有城市基础设施、生产生活用的工具产品均为人类形态设计。人形机器人通过对人类形态的高度模拟,能快速融入到为人类设计的各类环境中执行复杂任务,具有更强的通用性和适应性。三是广泛适用。人形机器人具备比人类更强的耐受性和适应性,能够在非结构化环境中长期以低成本运行,有效解决未来劳动力短缺问题,将在工业生产、民生服务、特种作业等领域广泛应用,甚至在部分领域发挥更大优势。2·通过人工智能大模型技术赋能,提升感知、决策、控制能力·通过云大脑和智能联网的方式,突破“一个躯体、一个大脑”的限制,实现算力和智能的飞跃广泛适用·更强的耐受性和适应性·非结构化环境中长期以低成本运行·有效解决未来劳动力短缺问题类人形态-·通用性、适应性更强·快速融入到为人类设计的图1人形机器人的特点对“人形”追求的本质是机器人通用性的问题,核心点是当前是否有必要通过外形的拟人设计赋予机器人等同人类的“通用能力”,是“一机多用”还是“专机专用”。从现阶段的发展情况看,人形机器人主要在工业场景试水,相比后期服务应用场景中的复杂工作,工业场景任务相对重复和单一,人形需求并不强烈。随着“大脑”的逐步完善,通用人形机器人将会是终极形态,但在此之前不同进化阶段及分支是必要条件,主体人形+定制化组件的类人形可能是商业化初步完成前的最优解。所以,从长远看,“人形”是机器人的理想形态;从现状看,完全的“人形”不是现阶段的唯一选择。(二)人形机器人的分类目前由于人形的开发难度大,企业为快速完成功能开发、实现应用落地,在人形机器人的研发过程中,采用了诸如反关节、轮式、轮腿结合式、两指/三指灵巧手等方式代替完全拟人的结构,并实现部分3拟人化功能。按形态划分,目前主流的人形机器人可以分成三个大类:轮式人形机器人,主要采用轮式驱动,强调触觉传感器和灵巧手的操作功能。半身足式人形机器人,强调机器人的腿部运动能力,手部基本只用作平衡。全能型人形机器人,具备双足、双臂、双手及各类感知和人工智能功能,适应开放环境中的多任务。来源:中国信息通信研究院图2人形机器人的分类(按形态划分)按具体应用场景和主要功能划分,可以分成以下几个类型:特种作业型人形机器人,用于执行巡逻巡检、灾害救援、危险作业等任务。工业型人形机器人,用于工业生产及物流领域,如货物搬运、生产制造等。医疗型人形机器人,协助医生进行手术、诊断、康复等任务。教育型人形机器人,作为教学辅助工具,提供互动式学习内容。娱乐型人形机器人,与人类互动,提供陪伴和娱乐功能。公共服务型人形机器人,在酒店、餐厅、商场等场所提供公共服务。家庭服务型人形机器人,用于家庭养老、育儿、家务等任务。通用型人形机器人,可用于工业、服务、教育、医疗等多个领域。4通用型人形机器人通用型人形机器人家庭服务型人形机器人公共服务型人形机器人娱乐型人形机器人教育型人形机器人医疗型人形机器人工业型人形机器人特种作业型人形机器人按功能划分来源:中国信息通信研究院目前,人形机器人的发展已经经历了萌芽探索阶段、集成发展阶段、高动态发展阶段、智能化发展阶段四个阶段。这一时期以实现基本的双足行走功能为主要目标。以日本早稻田等。这一阶段的主要特点是基本实现双足行走功能和控制能力,初步具备了拟人化的结构,但整体上运动能力较弱。2.集成发展阶段(本世纪初至2010年)这一时期以感知和智能控制整合为主要特点,本田公司的ASIMO系列人形机器人代表了这一阶段的重大进展,通过感知和智能控制技术的整合,机器人具备了初步的感知系统,能够感知周围环境的基本信息,并根据感知输入做出简单判断并调整动作。ASIMO2000是其中的代表作,它不仅外观类人,还能预测未来动作5并主动调整重心,实现转弯时的流畅行走。3.高动态发展阶段(2010年至2022年)控制理论和技术的进步提升了机器人的认知能力,使其能够独立、稳定地执行复杂动作,且此阶段人形机器人已经具备了较强的运动能力。如本田的升级版ASIMO机器人采用电驱动的技术路线,并通过整合视觉和触觉物体识别技术,能够精确完成抓取物体和倒液体等精细任务。波士顿动力的ATLAS机器人采用液压驱动的技术路线,能够在具有挑战性的场景中保持平衡并实现高动态运动。4.智能化发展阶段(2022年)在人工智能技术的赋能下,机器人具有了更加智能化的感知、交互和决策能力。同时,电驱动成为“肢体”主流技术路线,实现了更加精准的行走和操作,并提高了研发迭代速度。如特斯拉公司的Optimus机器人,基于人工智能技术和自研的FSD(FullSelf-Driving,全自动驾驶)芯片,通过端到端的神经网络模型实现任务级和动作级的决策,以及复杂环境中物体、人脸和手势等的识别。同时,通过其全身压力计算和实时反馈机制,使机器人的四肢运动更加灵敏,能够实现流畅和自然的动作。历经多年发展及技术迭代,在巨大的潜在市场需求牵引以及人工智能技术深度赋能的带动下,人形机器人已进入技术集中突破和应用初步试水的关键发展阶段。6大规模应用阶段智能化发展阶段萌芽探索阶段高动态发展阶段集成发展阶段来源:中国信息通信研究院二、人形机器人的技术演进(一)人形机器人技术高度集成,多角度实现对人模仿个部分组成。其中,“大脑”负责实现环境感知、行为控制、人机交互等任务级能力,目前主要是基于人工智能大模型技术,同时也可通过云边协同,提高机器人的智能水平。“小脑”负责控制人形机器人的运动,目前主要基于人工智能、自动控制、机器人操作系统(ROS,RobotOperatingSystem)等技术,实现复杂环境下的运动控制。“肢体”负责实现高动态、高爆发、高精度运动,集成了人体运动力学、机械结构设计、新材料、传感器等诸多技术,包括仿人机械臂、灵巧手、腿足等关键结构,并通过集成传感器和长续航动力单元,实现能源-结构-感知一体化。7·控制人形机器人的运动小·基于人工智能、自动控制、机器人脑操作系统(ROS)等技术·实现复杂环境下的运动控制·实现高动态、高爆发、高精度运动现能源-结构-感知一体化交互“小脑”控制感知执行来源:中国信息通信研究院(二)人形机器人整机加速发展,创新产品不断涌现全球方面,目前美国特斯拉、FigureAI、波士顿动力已成为国外人形机器人整机产品第一梯队,其他1X、Digit等欧美产品为第二梯队。整体上看,其产品智能化水平和综合性能较高,特斯拉和亚马逊的产品已步入场景测试阶段。特斯拉Optimus系列机器人。特斯拉公司于2022年10月正式发布Optimus第一代(Gen1),使用了与特斯拉电动车相同的FSD系统,具备强大的计算机视觉处理能力。OptimusGen1身高约173厘米,重量约73公斤,采用全电驱动,具有行走、挥手和跳舞等功能。在结构方面,OptimusGen1身体具有28个自由度,包括14个旋转自由度和14个线性自由度。在此基础上,其灵巧手具有6个主动自由度和5个被动自由度。2023年12月,特斯拉发布了Optimus第二8代(Gen2),重量减轻到63公斤,颈部增加了2个自由度,步行速度提升了30%,平衡感和身体控制能力得到改善,能够完成非平坦地形下的行走,包括爬楼梯等复杂动作。精细操作方面,OptimusGen2的所有手指都配备了触觉传感器,能够轻松准确地抓取和放下鸡蛋,展示出精巧的双手操控能力。波士顿动力Atlas系列机器人。波士顿动力公司于2013年发布的第一代Atlas人形机器人由外置电驱动液压动力系统提供动力,高183厘米,全身28个液压驱动关节,能够实现碎石路面下的稳定行走。2016年发布的配备了机载液压动力系统的Atlas机器人,能够实现雪地、山地行走,可在倒地后迅速起身,并具备双臂协同搬运重物的能力。后续,该系列机器人完成了立定跳跃、跳高、跳转身、后空空中转体等一系列能力。2024年4月,波士顿动力宣布液压版Atlas退役,并推出了纯电驱的新款Atlas机器人,能够完成稳定的行走、FigureAI公司系列人形机器人。2023年3月14日,FigureAI发布的人形机器人Figure01,利用OpenAI的大型语言模型,可以与人类进行正常的完整对话,并具备分类识别物品的能力,被认为是世界上第一个具有商业可行性的自主型人形机器人。2024年8月6日FigureAI发布的新一代产品Figure02,与上一代相比,FigureAI拥有16个自由度的第四代机械手,负载能力与人类水平相当,可以抓取25公斤的物体,比上一代增加5公斤。同时,Figure02的机载计9算和AI推理能力提高了3倍,能够完全自主地在现实世界中执行任快速推进整机产品迭代,产业迅速发展,产品不断涌现。目前,已发布数十款人形机器人产品,具备较为稳定的行走、跑跳、站起等基本功能,在技术方面已有一定积累,与国外无明显代际差异。优必选的WalkerS1在环境感知与物品抓取方面取得了一定进展,已进入比亚迪工厂实训,与L4级无人物流车、无人叉车、工业移动机器人和智能制造管理系统协同作业。(三)“大脑”技术路线并行探索,具备初阶人类脑力1.大模型是现阶段“大脑”的最佳解决方案基于大模型的语言/视觉运行处理方式可为人形机器人提供任务级交互入口。在环境感知方面,大模型通过对多模态信息的统一处理与灵活转换,推动多模态感知泛化。在任务规划方面,大模型潜在的真实划提供基础。在决策控制方面,人形机器人基于大模型技术并优化奖励策略,通过整合环境、运动等多样化信息,实现决策控制功能。从实时交互能力。人形机器人需要具备与人类实时的任务级交互能力,快速理解人类通过语言、手势等方式给出的指令,并有效执行。当出现指令理解不清或任务执行完毕后,可以与人类进行进一步的多轮交互。多模态感知能力。为了在复杂环境中做出正确决策,人形机器人需要能够通过视觉、听觉、触觉等多种感官获取信息。大模型需要整合这些多模态感知数据,以实现对环境的全面理解。自主可靠决策能力。人形机器人在执行任务时,需要能够理解任务的复杂性,并将其分解为一系列可执行的子任务。这要求大模型具备强大的语言理解能力和对物理世界的深刻理解。例如,机器人可能需要理解“清理房间”这一任务,包括识别哪些物品需要移动,哪些需要丢弃。涌现和泛化能力。除了在训练数据上的表现,大模型还应具备超出训练范围的执行能力。具体表现为人形机器人能够在未见过的新环境中执行任务,适应新的、未知的情况。面对新挑战时,展现出创新性的解决方案。2.人形机器人大模型多技术路线并行探索从技术路线上看,目前基于大模型的“大脑”技术路线正处在并行探索阶段,并逐渐向端到端的大模型演进。现阶段主要是4条技术路线,一是LLM(大语言模型)+VFM(视觉基础模型),实现人机语言交互、任务理解、推理和规划,目前最为成熟。主要代表是谷歌的SayCan模型,通过预训练技能的价值函数对齐(Grounds)大语言模型或者通过价值函数的训练使大语言模型对用户指令进行推理分解获得任务步骤。二是VLM(视觉-语言模型),弥合语言与视觉理解间的差距,实现更准确的任务规划和决策。主要代表是清华大学的CoPa模型,利用嵌入在基础模型(比如视觉语言模型的代表GPT-4V)中的常识知识为开放世界机器人操控生成一系列的自由度末端执行器姿势,生成的操控任务分为任务导向抓取和感知运动规划。三是VLA(视觉-语言-动作模型),在VLM基础上增加运动控制,解决机器人运动轨迹决策问题。主要代表是谷歌的RT-H模型,学习语言和运动,并使用视觉上下文,通过利用语言-视觉-动作结合的多任务数据集学习更强大和灵活的动作策略。四是多模态大模型,实现对物理世界环境的全面感知,是未来的主要研究方向。主要代表是麻省理工、IBM等共同研究的MultiPLY模型,将视觉、触觉、语音等3D环境的各类特征作为输入,以形成场景外观的初步印象,并通过多视图关联将印象中的输出融合到3D,最终得到以对象为中心的场景特征。此外,类脑智能和脑机接口等创新技术也为人形机器人“大脑”的解决方案带来无限可能。类脑智能是人工智能技术的进一步延伸,是通过对人脑生物结构和思维方式进行直接模拟,使智能体能够像人脑一样精确高效处理多场景下的复杂任务,是未来有望代替大模型的新技术路线。脑机接口是在人脑与外部设备间建立连接通路的技术,实现人脑与外界设备的信息交换。未来有望基于脑机接口实现“大脑”的3.人形机器人“大脑”向更高级的智能化和自主化发展当前,人形机器人“大脑”刚刚具备初阶人类脑力,仅能完成人的部分工作,无法形成人类大脑全能力闭环。同时,其情感表现属于模拟层面,不具备情感理解能力。基于大模型的“大脑”技术发展主要受限于数据和训练平台。数据方面,由于真实数据采集难度大,仿真数据保真度和规模有限,较难形成“数据飞轮”效应。平台方面,“大脑”的研究涉及数据采集、模型开发部署和仿真环境测试的整个流水线链路,需要强大的通用计算平台提供大规模计算支撑和通用服务能力。人形机器人作为人工智能的前沿应用领域,其发展速度令人瞩目。然而,要实现真正的智能化和自主化,现有的大模型仍需在多个方面重点发力。一是在感知模态维度方面形成突破。当前的人形机器人大模型主要依赖于视觉或语音感知,这种单一的感知模态在处理复杂环境时显得力不从心。例如,在嘈杂的环境中,仅凭视觉信息,机器人可能难以准确识别和响应。为了克服这一局限,未来的大模型需要整合视觉、听觉、触觉等多种感知模态。多模态感知能够提供更丰富的环境信息,使机器人在复杂场景中做出更准确的决策。例如,结合听觉和触觉信息,机器人可以更好地理解人类的指令和情感状态。二是在指令生成速度与复杂性方面形成突破。现有的大模型在生成指令时速度较慢,且生成的结果往往过于简单。这在需要快速反应的场景如紧急救援或复杂操作任务中,可能导致机器人无法及时作出正确响应。目前主流机器人大模型偏向于任务理解和拆分,对于机器人运动控制的涉及较少,只是用预设的端到端的训练方式生成了简单且离散分布的机械臂末端位置和底盘移动指令,未渗透到连续路径和轨迹规划等更偏机器人领域的内容。三是在泛化能力提升与模型架构优化方面形成突破。泛化能力是大模型在新环境和新任务中表现的关键。当前的模型在泛化能力上仍有待提高,尤其是在面对未知环境和任务时,模型的表现往往不尽人意。为了提高泛化能力,未来的大模型需要在架构、训练方法和数据集方面进行创新。例如,通过引入元学习、迁移学习等技术,可以使模型更好地适应新任务。同时,构建更多样化的数据集,也有助于模型学习到更广泛的知识。(四)“小脑”加载人工智能技术,运动方式更加拟人1.“小脑”运动控制包括基于模型的控制方法和基于学习的控制方式两个大类“小脑”的运动规划与控制是人形机器人实现自然和流畅动作的关键。传统的基于模型的控制方法通过建立机器人的运动学和动力学模型,进行运动轨迹规划和平衡控制,特点是身体控制稳健,步频较慢,代表算法有零力矩点(ZMP,ZeroMomentPoint)算法、线性倒立摆(LIP,LinearInvertedPendulum)算法、模型预测控制(MPC,Optimization)算法等,但整体开发较为复杂,成本高,不利于产品快速迭代。基于学习的控制方法则使用端到端的人工智能技术,代替复一般通过人类示教或自主学习建立运动执行策略。其中通过人类示教的方式也称为模仿学习,指通过人或者其他专家提供反馈示教的方式,使机器人以产生与示教相似的行动策略进行学习,效果依赖高质量示范数据。通过自主学习的方式也称为强化学习,指通过精心设计学习目标,机器人不断在环境中探索逐渐发现最大化奖励的方式学习到最优的执行策略,效果依赖于仿真环境。目前主要的“小脑”技术路线包括以下几种。基于模型的控制方法:ZMP判据及预观控制。基于简化的倒立摆模型/小车模型进行质心点运动规划和控制。该算法需要精确的动力学模型和复杂的在线控制策略,扰动适应性差。典型代表有日本本田、AIST的相关产品。混杂零动态规划方法。通过在全身动力学模型上采用非线性控制,根据状态选择步态,进行轨迹跟踪控制。该算法需要精确的动力学模型和线性化反馈,实时求解慢,对复杂环境适应性差。典型代表有美国俄勒冈州立大学的相关产品。虚拟模型解耦控制。将控制解耦为速度、姿态、高度等,建立弹簧阻尼等虚拟模型进行力矩控制。该算法降低了对精确动力学模型的依赖,但融合复杂,对复杂环境的容错能力有限。典型代表为波士顿动力的相关产品。模型预测控制+全身控制。基于简单/复杂的动力学模型进行力的预测控制,进而全身优化,可实现臂足协同及物体接触。该算法依赖精确动力学模型和状态估计,线性模型仅适用于下肢单一步态的控制,而非线性模型求解速度慢。典型代表有美国麻省理工学院、瑞士苏黎世联邦理工大学和波士顿动力公司的相关产品。基于学习的控制方法:强化学习。通过奖励设计和仿真环境设计,实现了受控步态、奔跑、转弯、上下台阶等运动学习,提升运动的鲁棒性,并可以通过采用因果Transformer模型,从观测和行动的历史中对未来行动进行自模仿学习。采用非线性最优化求解的动作映射,以人机关节轨迹相似为目标,以机器人可执行性、安全性、稳定性判据为约束,规划运动方案。该算法计算耗时长,严重依赖初值,对碰撞检测难以解析计算。典型代表有日本AIST、北京理工大学的相关产品。2.人形机器人“小脑”向基于学习的控制方法演进传统的机器人控制方法依赖于精确的动力学模型和专家知识,难以适应非结构化环境的不确定性和复杂性。近年来,学习型控制的发展使得机器人能够从数据中学习控制策略,但其泛化能力和鲁棒性仍难以满足复杂场景需求。大模型为机器人控制引入了丰富的先验知识和泛化能力,有望进一步突破传统控制方法的局限性。整体上看,目前人形机器人的“小脑”核心技术正在从基于模型的控制方法向基于学习的控制方法演进。在强化学习领域,大模型为引入先验知识和提高样本效率提供了新的思路。以LanguagePlan为例,该模型利用GPT-3根据任务描述生成抽象的行动计划,如“先走到门口,然后打开门,再能够显著提高样本效率和泛化性能,加速复杂任务的学习。类似地,LOFT、T-EBM等模型也展示了利用语言模型引导策略学习的能力。在模仿学习方面,视觉-语言模型为机器人学习复杂技能提供了新的范式。以CLIP-ASAP为例,该模型首先利用CLIP将视频帧编码为语义特征,然后通过因果语言建模学习动作与视觉变化之间的关系。在控制阶段,CLIP-ASAP根据语言指令和当前视觉观察,预测下一时刻的关键帧,并将其传递给低层控制器执行。实验表明,CLIP-ASAP能够学习复杂的长期技能,如烹饪、家政等,且具有很强的泛化能力,能够根据不同的指令组合技能。类似地,R3M、Pix2R等模型也展示了利用视觉-语言对齐进行模仿学习的能力。尽管大模型在机器人控制中展现出了广阔的应用前景,但如何进一步提高其实时性、鲁棒性和可解释性仍然是亟待解决的问题。此外,如何将控制与感知、决策和规划更紧密地结合,构建端到端的自主系统,也是未来的重要研究方向。(五)“肢体”多技术融合发展,技术路线逐步收敛“肢体”是人形机器人实现所有拟人功能的载体和基础,主要包括执行机构、芯片、传感器、电源、新材料方面的诸多先进技术。1.执行机构目前,“肢体”执行机构的核心驱动技术路线已由传统的液压驱动方式全面转为电驱动。液压驱动技术依赖于液体压缩泵产生高压液体,进而驱动输出机构。主要优点是力量输出大、易于扩展,但也存在控制技术复杂、能量效率相对较低、系统零件多、成本高、故障率高、维护维修繁琐、响应速度不够快等诸多问题。液压驱动的代表产品主要是波士顿动力在2024年前的一系列人形机器人产品。电驱动技术以各类电机作为动力输出机构。其优点是成熟可靠、寿命长、鲁棒性好、成本相对较低、易于控制、响应速度快、能量转化效率高等,主要缺点是本身扭矩密度较低,通常需要搭配减速器使用。目前以特斯拉Optimus为代表的新一代人形机器人均采用电驱动技术。2024年4月波士顿动力正式放弃传统的液压驱动路线并发布了该公司首款电驱动人形机器人,标志着驱动技术全面向电驱动路线收敛。人形机器人的执行机构主要包括旋转执行机构、线性执行机构、末端执行机构三类。旋转执行机构多用于人形机器人关节处,如手腕、膝关节,主要由电机和减速器组成,核心零部件是无框力矩电机、行星减速器和谐方案,由高转速低扭矩电机+谐波减速器组成,优点是输出扭矩大、精度高,可实现精准的运动控制。目前,谐波减速器减速比为50-300,并且体积紧凑,在扭矩密度提升层面更具优势,“下肢”应用较多。缺点是减速器体积和质量要求高,力控需要力矩传感器,成本高。二是准直驱(PA,优点是行星减速器刚性传动可反算力矩,不需要额外传感器,行星减速器成本约为谐波减速器的1/5,整体成本较低,在其负载范围内时,是最经济的选择。缺点是扭矩电机成本高,体积大,且扭矩密度的进一步提升只能通过增大尺寸,同时该方案对散热有较高要求。线性执行机构多安装于机器人上臂、大腿及肘部,可理解为旋转执行器的线性转换,通常实现伸展、推拉等直线运动,主要通过梯形丝杠、滚珠丝杠或行星滚柱丝杠实现。其中,行星滚柱丝杠具有更高的承载力、更长的使用寿命及更小的体积,是线性执行器目前及未来的主要技术趋势,但行星滚柱丝杠的成本远高于其他类型丝杠。特斯拉的Optimus的线性执行器即采用了反向行星滚柱丝杠技术,承载能力强,寿命长,比常规滚珠丝杠提升一个数量级。Optimus整机采用了14个线性执行器,包含4根梯形丝杠(约100元/副)及10根行星滚柱丝杠(约10000元/副),占总成本约10%末端执行机构可分为爪手类和工具类,爪手类从各类夹持器已进化为多指灵巧手。目前全球灵巧手处于技术突破阶段,研发重点是系统简化和小型化、提高鲁棒性和自由度、多感知能力融合。目前灵巧手的主流技术路线是使用电机驱动和连杆传动,结构形式上正逐步向驱动器混合置方向发展,空心杯电机是灵巧手的核心部件。人形机器人执行机构人形机器人执行机构线性执行器多用于人形机器人大臂和下肢如手臂和腿部的伸展摆线计行里减旋转执行器多用于人形机器人关节处,如手腕、膝关节的灵活转动精密减速器未端执行器主要安装于机器人腕部末端,用于直接执行任务核心部件精密行星减速器谐波减速器RV减速器轴承速器来源:中国信息通信研究院2.芯片人形机器人的芯片主要包括处理器芯片、控制芯片和总线管理芯片,其中处理器芯片是其功能实现的核心。目前人形机器人处理器芯片的主流技术是技术路线最成熟的CPU+GPU方案。特斯拉人形机器人搭载的FSD芯片即采用该路线,并与汽车自动驾驶共享底层技术。单个芯片算力72TOPS,是市场上唯一从底层出发为自动驾驶和深度为神经处理单元,并集成了大量的计算单元和专门的神经网络加速器,能够高效地进行复杂的计算和推理任务,完全适用于人形机器人。同时,人形机器人的处理器芯片还可通过CPU+FPGA、CPU+ASIC等方案实现。CPU+FPGA方式,由于FPGA的开发流程简单,具有较短的研究周期和较低的成本,但流片成本高昂。同时FPGA功耗较高,式实现MAC操作,在电路级实现“存算一体”,该路线运行稳定性较高,但并行性和能效比要低;同时也可以采用本身具有存储和计算功能的固定存储器(NVM),实现器件级“存算一体”,单位器件可具有多级状态,发展潜力巨大。3.传感器大量传感单元是实现复杂感知功能、与环境交互的基础。人形机器人所需的传感器类型包括六维力传感器、关节扭矩传感器、拉压力接近觉传感器、距离传感器等多种类型。六维力传感器可以测量力和力矩,对于实现人形机器人的运动控制规划、姿态调整、力度感知和精确操作至关重要,通常安装在人形机器人的手腕、脚踝、足底或手部,用来提升操作的灵活性和行走的稳定性。关节扭矩传感器通常安装在人形机器人的上下肢关节处,用于测量关节所受到的力,实现输出力的主动控制。拉压力传感器用于测量拉力和压力,一般安装在人形机器人小臂、腿部和灵巧手等位置的线性执行器上。指尖测力传感器多应用于灵巧手上,实现加载力位置的实时判定及反馈。视觉传感器可以获取周围环境的图像信息,实触觉传感器可以感知外部压力、温度和其他物理参数,可以形成类似于人类皮肤的触觉感知层。惯性测量单元一般由加速度计、陀螺仪和磁力计组成,可以实时测量物体的加速度、角度和磁场方向。接近觉传感器用于检测物体是否接近以及接近的距离,用于控制人形机器人的位置、识别路径、障碍急停等。距离传感器则用于测量人形机器人与物体之间的距离,实现避障、定位等功能,包括激光、超声波、红外线等实现方式。以特斯拉的人形机器人为例,一台人形机器人需要1套视觉传感器、1套位置传感器、14个一维力矩传感器、14个一维压力传感器、4个六维力矩传感器、10个MEMS(Micro-Electro-MechanicalSystem,微机电系统)触觉传感器(手指部位)、1套薄膜传感器。目前传感器方面的整体趋势是向多维度、高精度、高集成度、高延展性方向发展,高维力矩传感器和高维触觉传感器是传感器方面的当前研究重点。4.电源人形机器人需要高性能的电源来提供持久的动力。FigureAI公司发布的Figure02人形机器人搭载2.25KWh的电池组,一次充电可以运行5小时。我国目前大部分人形机器人的运行时间通常为2-4小时。电源包括电池和电源管理系统两部分。电池方面,目前锂离子电池是主流,但其在能量密度、循环寿命等方面仍无法满足未来人形机器人长时间、高负荷工作的要求。国内企业如宁德时代等正在研发更高性能的电池技术。电源管理系统方面,主要用于监控电池状态,优化能源使用,确保人形机器人在各种工况下都能稳定运行。国内在电源管理系统的研发方面也在不断加强。5.新材料人形机器人的新材料主要应用在骨骼、外壳等方面。该部分是支撑人形机器人进行各种行动的基本框架,其应用场景包括外壳材料、脊椎、大臂、小臂、大腿、小腿等结构件。目前人形机器人“肢体”骨骼的常用材料包括钢材、铝合金、镁合金、碳纤维、工程塑料等。在保证机器人功能的先进性、稳定性、使用可靠性和服役安全性的前提下,采用轻量化材料,结合结构优化设计、先进制造工艺,可使机器人构件轻量化,能够提高机器人的机动灵活性,保证机器与人类一起协作工作时不会受到机器的伤害等问题。目前,聚醚醚酮(PEEK)在人形机器人“肢体”方面具有较大的应用潜力,可以满足人形机器人本体轻量化的要求,大幅提高人形机器人灵活性和工作效率,减轻其运动惯性,提高安全性。采用了PEEK材料的特斯拉OptimusGen2较上一代重量减轻10kg,步行速度提升30%。三、人形机器人产业现状分析(一)人形机器人处于发展初期,未来市场规模巨大从功能实现上,人形机器人可分为5个能力等级。第一级(Lv1)是基础能力实现,指人形机器人具备稳定的走、跑、跳功能和初步的交互能力。第二级(Lv2)是初级智能实现,本阶段人形机器人可实现特定场景下的特定功能,结构化任务,泛化能力较弱。第三级(Lv3)是场景智能实现,本阶段人形机器人在特定场景下能够完成大部分非结构化任务,具备一定泛化能力。第四级(Lv4)是多场景适配,本阶段人形机器人能够在多个场景完成大部分非结构化的任务,且不少于3个场景。第五级(Lv5)是全面智能实现,本阶段人形机器人能够实现真正的具身智能,通过简单的学习即可完成各类任务。Lv5全面智能实现实现真正的具身智能,通过简单的学习即可完成各类LV4多场景适配Lv5全面智能实现实现真正的具身智能,通过简单的学习即可完成各类LV4多场景适配在多个场景均能够完成大部分非结构化的任务,不少于3个场景Lv3场景智能实现特定场景下能够完成大部分非结构化任务,具备一定泛化能力Lv2初级智能实现特定场景下的特定功能,结构化任务,泛化能力较弱Lv1基础能力实现具备稳定的走、跑、跳功能和初步的交互能力人形机器人发展等级来源:中国信息通信研究院图7人形机器人五个发展等级从目前产业技术现状上看,目前全球绝大多数全能型人形机器人产品处于Lv1等级,少部分头部企业最新产品和轮式机器人等其他形态的人形机器人正在逐步向Lv2等级探索,并从工业制造领域的toB端向服务领域的toC端拓展。如2024年5月,特斯拉Optimus机器人已经进入特斯拉工厂“实训”,实现对电池单元进行准确分装及纠错能力。2024年10月,特斯拉Optimus机器人演示做饭、调酒、跳舞等服务功能,并展现出更高水平的交互能力和更流畅的运动能力。从需求侧分析,人形机器人的核心是代替或辅助人类完成各种任务,而根据相关统计分析数据,未来我国劳动人口将出现下滑,人形机器人可以有效填补我国未来短缺的劳动力。综合技术进展情况和需求侧情况预计,从现在到2028年,全能型人形机器人将整体处于Lv1等级,以科学研究为主要落地场景,客户主要是从事人形机器人相关软硬件研究的高校、企业等科研团队,其他形态人形机器人则加速向Lv2等级演进。我国整机市场规模约在20至50亿元。2028年到2035年,人形机器人整体进入Lv2等级,以特种场景应用为主,工业场景逐步落地,整机市场规模达到约50至500亿元。2035年到2040年,人形机器人整体进入Lv3等级,在工业场景形成规模,服务场景逐步落地,整机市场规模达到约1千至3千亿元。2040年到2045年,人形机器人整体进入Lv4等级,实现工业场景和服务场景规模应用,整机市场规模达到约5千至1万亿元。2045年后,人形机器人整体进入Lv5等级,在用人形机器人超过1亿台,进入各行业领域,整机市场规模可达约10万亿元级别。产业规模产业规模(元)应用为主,工业场应用:工业场景和i服务场景规模应用机来源:中国信息通信研究院(二)人形机器人潜在应用丰富,全面覆盖生产生活人形机器人有着与人类相似的感知方式、“肢体”结构和运动方式,是人工智能和机器人技术的创新高地,在各类应用场景中将发挥重要作用。人形机器人的主要潜在应用场景包括生产制造、社会服务、特种作业三个大类。其中在生产制造领域,可以有效解决人口老龄化问题,缓解未来的劳动力短缺,如农业采摘、汽车和3C领域制造业生产等。在社会服务领域,可以代替人类从事公共服务员、家政服务员、物流配送员、安保巡逻员等岗位,为人类提供各方面的服务。特种作业场景主要是指在危险的作业环境中对人类进行替代,如在深海、民爆、核电站等危险工作场景替代人类完成生产、巡检、探测、排爆等工作;在航空航天领域代替人类长期驻守空间站,执行航空器维护和空间科研任务,放大、延长外太空的工作时间,甚至直接登录地外行星进行探索任务。1.工业生产(自动化装配、质量检测等)目前,特斯拉、优必选、小米、小鹏、智元机器人等人形机器人厂商均已将目光聚集于工业生产领域,人形机器人将有望在汽车制造领域率先批量使用。人形机器人通过与传统自动化设备的协同,在汽车生产上,可用于装配底盘、打螺丝等,提升工厂智能化水平,实现复杂工业场景的无人化生产。如特斯拉宣称其人形机器人Optimus将率先应用于汽车制造领域,包括但不限于特斯拉的超级工厂内部,协助或替代人类完成重复性、危险性高的工作,未来有望全面接管特斯拉汽车的生产。优必选推出的工业版人形机器人WalkerS系列,也将率先适用于汽车领域工业场景,未来还将逐步拓展至汽车零部件、3C、智慧物流等其他智能制造领域及应用场景。小鹏等则积极推进人形机器人在自有制造系统中的分阶段落地。智元机器人的远征A1将首先面向工业场景,规划在比亚迪工厂参与外观检测流程、进行底盘装配等汽车装配线上作业。在工业生产制造领域,人形机器人重点应用场景包括以下方面:精密装配与操作。3C电子产品如智能手机、笔记本电脑、智能穿戴设备等,其内部结构复杂,包含大量微小精细的零部件。人形机器人通过高精度的机械臂和灵巧手,可以进行精准的抓取、放置、组装等操作,完成电路板焊接、屏幕安装、电池固定等精密装配任务。柔性化生产线作业。由于人形机器人具备类似人类的移动能力和关节灵活性,能够适应不同的生产线布局和工位需求,实现产线的快速调整和重组,尤其适合多品种、小批量、快节奏的生产模式。厂内物料流转与管理。在仓库管理和生产线物料供应环节,人形机器人可以高效地进行物料搬运、库存盘点等工作,通过自动识别技术,准确无误地将物料送达指定工位,提高供应链效率。质量检测与维护。结合视觉识别、力感知等先进技术,人形机器人可以执行产品的外观检查、功能测试等质量控制任务,同时也能对生产设备进行预防性维护和故障排查,降低停机时间。2.物流(分拣、配送等)在智慧物流领域,1XTechnologies、AgilityDigit和中国电科21所等厂商在尝试利用人形机器人的优势来解决传统物流难题,推动行业向更加智能化和自动化的方向发展。在物流领域,人形机器重点应用场景包括以下方面:仓储管理与拣选。人形机器人可以灵活地在货架间移动,利用视觉识别和深度学习技术精准定位和抓取货物,实现智能拣选。例如,在大型电商仓库中,人形机器人能根据订单信息高效完成商品的分拣、打包工作。搬运与装卸。利用人形机器人的力量与灵活性,能够进行重物搬运以及复杂环境下的货物装卸作业,减轻工作人员的体力负担,并在高架库、窄巷道等特殊环境下替代人力操作。自主导航与调度。配备先进的传感器和自主导航系统的人形机器人可以在复杂的仓库环境中实现自主路径规划和避障行驶,同时通过中央管理系统实时调度,提高整体作业效率。最后一公里配送。在快递和外卖行业,人形机器人或类人形的递送机器人可以将包裹直接送达消费者手中,尤其适合于公寓楼、办公区等场所的室内递送服务,提供更便捷的终端交付体验。3.家庭和商业服务(家庭服务、迎宾接待等)随着人工智能、机器学习和传感器技术的快速发展,以及人们对便捷生活需求的不断提高,人形机器人将在服务、娱乐、医疗、养老等领域发挥重要作用。从供给端角度来看,目前人形机器人在民生服务领域有落地计划的厂商包括达闼科技、宇树科技、傅利叶智能、开普勒机器人及优必选等。家庭服务与陪伴。作为陪伴型机器人,人形机器人能提供家政、教育、娱乐等多种服务,如照顾老人与儿童、进行简单的家务劳动、辅导孩子学习等。随着老龄化社会问题日益凸显以及家庭结构的变化,这类需求将会持续增长,进而提高人形机器人在家用市场的渗透率。当前,人形机器人在家庭服务与陪伴领域的应用仍处于起步阶段,主要集中在提供基本陪伴、娱乐互动和简单家务服务。例如日本的Softbank公司推出的Pepper机器人和美国的Jibo机器人,这些机器人能够进行语音交流、表情识别、情感分析等,为用户提供陪伴和简单的家庭服务。但目前市面上的人形机器人功能仍然相对有限,尚未广泛应用于家庭环境。商业服务。在大模型技术持续提升人形机器人交互能力的背景下,探究人形机器人在商业服务领域的逐步落地。目前,商业服务人形机器人主要应用在封闭环境下的室内场景中,迎宾接待、导览讲解、需求解答、舞蹈表演等场景对机器人的运动性能要求不高,且部署周期短,将成为商业服务领域的最先落地场景。当前,人形机器人产品(全能型人形机器人和轮式人形机器人)应用在展览展厅、商超酒店、网点大厅等场合。优必选、达闼科技、傅利叶智能、星动纪元等公司在商业服务人形机器人领域均有布局。科研教育。人形机器人可作为教学助手进入课堂,实现科研助手、教学演示等功能。通过生动有趣的方式传授知识,激发学生的学习兴趣,同时也能减轻教师的工作负担。未来,随着教育信息化进程加快,人形机器人在教育领域的渗透率有望进一步提升。4.医疗健康(辅助手术、康复护理等)随着人口老龄化、慢性病发病率上升以及新型疾病的出现,医疗系统面临着极大的压力,主要表现为不断增长的全球医疗和康复需求。当前,我国医疗行业面临长期护理工作人员短缺和人口老龄化日益严重的问题,主要的痛点包括医护人员短缺、医疗资源分布不均衡和医疗成本高昂等。人形机器人在医疗保健与健康领域的主要作用是辅助医护人员进行日常工作,降低其工作强度与工作负担。考虑到劳工成本不断上涨和长期护理工作人员的供应增长预期相对缓慢,作为更有效和高效的方式,智能康养人形机器人能够承担繁重和重复的康复任务,并确保训练动作的准确性和一致性,可以应对快速增加的养老需求,并填补长期的人工供需缺口。现阶段,人形机器人在医疗保健与康复领域的应用仍处于起步阶段。面临的难点主要包括技术成熟度、成本、医疗准确性和安全性等问题,人形机器人需要具备高度可靠的操作能力和判断力,以便在各种医疗场景中准确执行任务。此外,医疗行业对安全性和隐私性要求极高,人形机器人的生产和应用需要满足诸多严格的标准和认证要求。5.安防巡逻在过去的几年里,非人形的机器人已经被用于安保任务,例如美国加利福尼亚州Knightscope开发的蛋形机器人K5和创业公司Ascento创建的两轮机器人,实现了在铁路车库的巡逻。从供给端来看,1XTechnologies的EVE人形机器人目前已成功应用于巡逻安保场景,区别于其他保安类机器人,EVE人形机器人具有头、脸和两只自主移动的手臂。随着技术的不断进步和成本的降低,未来人形机器人在安保领域的应用将会越来越广泛。人形机器人可以在各种复杂的环境中执行安保任务,例如在园区、工厂、仓库等区域进行巡逻监控,对机柜外观、开关、表计等进行巡查,排查是否存在安全隐患。人形机器人可以替代人类在危险的环境中进行工作,提高工作效率和安全性。在石油和天然气行业中,人形机器人可以用于井下作业、油气管道巡检、危化品处理等危险作业。通过远程控制和智能化决策,人形机器人可以在高污染、高辐射等恶劣环境下进行工作,提高工作效率和安全性。在核能行业中,人形机器人可以在辐射环境下进行工作,用于核废料处理、核设施维护等危险作业,降低人员伤亡风险。此外,在矿山、化工、消防等领域,人形机器人也可以发挥重要作用。在矿山场景中,人形机器人可以用于矿井巡检、采矿等危险作业;在化工场景中,人形机器人可以用于化工厂巡检、危险品处理等危险作业;在消防场景中,人形机器人可以用于灭火、救援等危险作业。但目前需进一步提高人形机器人的技术能力、智能水平和可靠性,从而实现在危险作业中对人的代替。7.灾害救援人形机器人在灾害救援领域具有广泛的应用前景。在地震、火灾、洪水等灾害发生后,人形机器人可以帮助救援人员快速定位受害者,提高救援效率,减少人员伤亡。首先,人形机器人可以进入人类无法到达或者难以进入的区域,如废墟、坍塌的建筑物等。这些区域可能会存在危险,但是人形机器人可以替代救援人员进行搜索和救援工作,并通过配备各种传感器和设备检测生命迹象、搜寻被困人员、探测有害气体等,为救援人员提供重要的信息。其次,人形机器人可以帮助救援人员进行危险的操作。例如,在一些情况下,需要进入高温、有毒或放射性等对人类的生命健康有严重威胁的危险环境。通过远程控制人形机器人,救援人员可以在安全的环境下进行操作,避免暴露于危险之中。此外,人形机器人还可以协助救援人员进行物资运输和后勤保障工作。在灾区中,物资运输可能会受到限制,但是人形机器人可以在复杂的环境中自主导航,将物资送达救援人员手中。同时,人形机器人也可以提供如送餐、运送医疗用品等必要的生活支持。总体来说,人形机器人可用于生产制造、社会服务、特种作业三大应用场景。各场景的共性需求包括人机交互能力、精准作业能力、自主决策能力、运动能力和安全伦理需求等,同时也各有侧重。特种作业类任务大部分属于标准化场景流程,对人机交互能力和精准度要求一般(危险环境作业可能根据具体任务不同,对精准度有更高要求)。而较为恶劣的场景环境对设备的环境适应要求较高。该场景通常需求明确,供需对接相对容易,短期发展潜力较大。制造业场景主要是对工业制造场景中的工人进行替代,大部分工作为标准化流程,但总装等环节对于细节的处理要求较高,对运动控制能力,手部精细化操作能力要求较高。由于在生产过程中需要和人类工人或工作指令下达人员进行频繁交流,需要有一定的人机交互能力。该场景客户相对集中,属于toB类型,且技术实现难度处于中等水平,预计中期的应用潜力较大。服务业场景主要是提供综合家政服务、医疗、教育、商业、公共服务等,一般均为非标准化场合,对于人形机器人的交互能力、智能水平、灵活性、精准度等要求较高,同时还涉及诸多安全伦理问题。该场景客户相对分散,主要为toC类型,并有部分toB的客户,预计落地应用将随着技术进步逐步释放,远期市场潜力巨大。(三)人形机器人产业链初步形成,正在持续优化发展人形机器人产业链主要由上游零部件、中游人形机器人本体以及下游终端应用等环节构成。目前,我国已基本形成了覆盖人形机器人全产业链的供给体系,但由于人形机器人尚未在下游终端应用领域实现规模化商业化落地,且随着人形机器人技术的不断成熟,其核心零部件的技术选型也在持续探索,我国人形机器人产业链仍在不断构建机器人产业链和供应链体系。1.上游原材料与零部件人形机器人的产业链上游包括减速器、电机、丝杠、控制器和传感器等硬件组件,以及相关的软件系统。从长期角度来看,产业链中最具价值的部分在于软件。掌握或自主研发运动控制和人工智能算法等核心技术的企业,将在技术层面上主导人形机器人发展方向和节奏,成为此领域的“中枢”和“脑”,并且同时也成为中游机器人本体制造的主导企业。从当前形势来看,传感器、减速器、电机和丝杠等核心零部件的价值占比较高,增量空间显著。由于我国工业基础好、相关产业链齐全,人形机器人核心零部件的发展潜力巨大。零部件的技术突破将有助于提升人形机器人的性能、降低成本、提高可靠性和安全性,并促进技术创新,从而推动人形机器人产业化的进程。2.中游机器人本体研发设计与制造人形机器人本体的设计、制造与集成是产业链的关键环节。目前,人形机器人本体制造业正处于产业化发展的初期阶段,行业内对人形机器人本体的价值已达成共识,但大规模商业化落地仍未真正实现。零部件选用、软硬件整合、本体设计以及应用场景的聚焦仍在探索之中,各类人形机器人总体解决方案正持续迭代与创新,人形机器人产业的“0-1”拐点有望提前到来。然而,人形机器人本体的发展面临多重挑战,包括技术基础亟待增强、制造成本需显著降低、算力需求高以及场景验证困难等问题。唯有解决上述发展困境,人形机器人行业才能成功从实验研究转向规模商业应用。3.下游应用领域2023年以来,众多人形机器人制造商在产品研发和市场策略上人形机器人将主要应用于工业制造、仓储物流以及特种应用领域;而在中长期内,人形机器人的目标则是进入千家万户,为家庭养老育儿等场景提供相关服务。随着应用的普及,面向各领域的专业运营企业也将应运而生。此外,业界领军企业也在加速打造人形机器人“大脑”“小脑”“肢体”的开源软硬件平台、典型行业应用场景的数据采集和训练场等,开源、协同、高效的产业链创新生态正在逐步形成。(四)人形机器人是近年融资热点,受到各界资本青睐从国

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论