人工智能行业专题报告AI大模型赋能人形机器人_第1页
人工智能行业专题报告AI大模型赋能人形机器人_第2页
人工智能行业专题报告AI大模型赋能人形机器人_第3页
人工智能行业专题报告AI大模型赋能人形机器人_第4页
人工智能行业专题报告AI大模型赋能人形机器人_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能行业专题报告AI大模型赋能人形机器人(报告出品方/作者:国泰君安证券,肖群稀、鲍雁辛)1.通用——解决机器人高需求和低渗透率的矛盾1.1.机器人进化路径:从固定到移动,从独立到协作,从单一到通用服务机器人商业化落地的前提是产品能提供真实价值,真实价值的判断在于机器人能否通用。在全球劳动力短缺的背景下,机器人产业蓬勃发展,2022年全球服务机器人市场规模217亿美元,过去5年复合增速超过20%。然而,在高速发展背景下,服务机器人渗透率仍然不高,规模化商业落地并不顺利。我们表示原因就是:目前大多数服务机器人都或多或少的存场景适应性的问题,比如无法适应环境变化,环境变化后,用户无法通过直观操作方式方式同时同时实现场景内置;智能化程度低,行人避障及功能整体整体表现不理想;机器人部署流程繁琐(比如SLAM建图、目标点标注等),所有部署操作方式方式就可以由机器人现场部署工程师继续执行,使用者难以操作方式方式及弁与,且当仍须修改时,仍仍须现场部署工程师进行操作方式方式。以商超场景为基准:环境繁琐:场景中镂空的货架(极高类障碍物)、窄小的地下通道、极容易跌落区域、宽广类障碍物及临时的摊铺,考验机器人的通过性、心智能力、任务规划能力。高动态化:商场人流大,极容易涌向,动态障碍物多,对机器人安全避障能力建议高。特定物体较多,场景光线变化大:比如玻璃护栏、自动扶梯、玻璃对角、玻璃墙等高揉物体大多数机器人基本无法识别,且难对激光雷达产生制约,导致机器人误判,发生追尾、跌落、无法紧临作业。对于依赖视觉传感器的机器人来说,必须在普通光线、黑暗、过曝等光照条件都能均衡运转难度很大。以上问题在工业机器人领域同样存,影响了工业机器人渗透率的提升,直到协作机器人的出现。2022年全球协作机器人市场规模89.5亿元人民币,进度表计2022~2028年市场规模将以22.05%的增长速度达致300亿元。2017~2022年中国协作机器人销量从3618台快速增长至19351台,预计2023年备货将多于2.5万台,2016~2021年市场规模从3.6亿人民币快速增长至20.39亿人民币,无机增长速度41.5%。协作机器人也可以被表示就是服务机器人,因为他们旨在与人类并肩作战。传统工业机器人在栅栏后与人拆分作业,顺利完成的工作也非常非常有限,比如说冲压、喷涂、吊装等。协谢泽生机器人更有效率,更智能,更容易合作,更具有适应能力,并使汽车、电子等生产行业能将自动化扩展到最终产品加装,顺利完成任务(比如说研磨和施涂涂层)以及质量检查等等。1.2.如何并使机器人更加通用型?使机器人更加通用,需要机器人的感知能力、思考和决策能力、行动执行能力的全面提升。我们认为GPT(预训练大预言模型)和人形机器人的出现,是机器人在迈向通用人工智能的道路上的一大步。感知世界的能力(机器人的眼睛):机器人自主移动的感知和定位技术中激光和视觉导航是主流应用方案。计算机视觉的发展经历了基于以特征描述子代表的传统视觉方法、以CNN卷积神经网络为代表的深度学习技术,目前通用的视觉大模型正处于研究探索阶段,人形机器人的场景相对工业机器人更通用、更复杂,视觉大模型的AllinOne的多任务训练方案能使得机器人更好地适应人类生活场景。一方面,大模型的强拟合能力使得人形机器人在进行目标识别、避障、三维重建、语义分割等任务时具备更高的精确度;另一方面,大模型解决了深度学习技术过分依赖单一任务数据分布,场景泛化效果不佳的问题,通用视觉大模型通过大量数据学到更多的通用知识,并迁移到下游任务中,基于海量数据获得的预训练模型具有较好的知识完备性,提升场景泛化效果。思索和决策的能力(机器人的大脑):目前的机器人都就是专用机器人,就可以在限量场景中应用领域,即使就是机器人抓取,基于计算机视觉,仍然就是在限量场景中,算法仅用于识别物体,如何搞出、搞出什么仍仍须人的定义。必须并使机器人通用型,叫作他回来储水,他就知道去拿水壶,取水,然后储水,这就是仍须常识就可以顺利完成的事情。如何能并使机器人具备常识?在大模型出现之前,这个问题几乎就是难以解决的。大模型并使机器人可以巍然存常识,从而具备通用性回来顺利完成各种任务,彻底改变通用型机器人同时同时实现的模式。人类工具和环境的适应性,不必再为了机器人而所造工具。继续执行能力(机器人的四肢):行动能力(腿)+精细操作方式方式(手)。把机器人做成人形,就是为了并使机器人的继续执行能力更加通用型。机器人继续执行任务时所处的环境就是按照人类的体型建好不好所所造的:建筑、道路、设施、工具等,这个世界就是为了便捷人类这种人形生物才这样设计。如果出现了某种新形态的机器人,人们就必须再次设计一套机器人适应环境的全新环境。设计在某个特定范围内继续执行任务的机器人相对容易,如果想要提升机器人的通用性,就必须挑选出可以作为异能的人形机器人。此外,人类与人形机器人更容易存情感上的交流,人形机器人可以并使人深表亲近。日本机器人专家森昌弘的假成立则表示:由于机器人与人类在外表、动作上相似,所以人类亦可以对机器人产生负面的情感。1.3.人形机器人步入商业化前夜从2015年DARPARoboticsChallenge,至2019年人形机器人各种科研项目被砍,业内广为唱衰,再至2022年特斯拉助推的百花齐放,人形机器人产业处于螺旋式向上的发展之中。波士顿动力的Atlas、Tesla的Optimus、小米CyberOne、ihmc的Nadia,AgilityRobotics的Nadia、日系Asimo与HRP-5P都在积极探索人形机器人的商业形态。我们对人形机器人发展过程中存代表性的产品进行了剖析:第一台人形机器人WABOT-1(1973年)。1973年日本早稻田大学加藤一郎带领团队研发出世界上第一台真人大小的人形智能机器人——WABOT-1。该机器人存肢体控制系统、视觉系统和对话系统,胸部装有两个摄像头,手部装有触觉传感器。本田E系列机器人(1986~1993年),奠定均衡跳跃基础。本田面世E系列双足机器人,E0至E6,走路速度由慢减慢,从走直线至在台阶或坡地上均可同时同时实现均衡跳跃,为下一步P系列类人机器人的研发奠定了基础,就是机器人历史的里程碑。本田P系列机器人(1993-1997年)&ASIMO(2000~2011)。1993年本田上加刊发第1个仿效人机器人原型P1,2000年P系列中的第4台也就是最后一台机器人P4问世,通俗称呼阿西莫(ASIMO)。2011年面世的第三代ASIMO体重1.3米,体重48公斤,跳跃速度就是0-9km/h,2012最新版的ASIMO,除具备了跳跃功能与各种人类肢体动作之外,还可以预先预设动作,并依据人类的声音、手势等指令,做出适度动作。他还具备了基本的记忆与辨识能力。2018年本田正式宣布正式宣布暂停人形机器人ASIMO的研发,著眼于该技术的更多实际应用领域。HPR系列机器人(1998~2018)替代建筑行业的繁重工作:这就是由日本经济产业省和新能源与产业技术开发非政府冠名,川田工业株式会社(KawadaIndustries)甩头与国立一流工业科学技术研究院(AIST)和川崎重工株式会社共同研发的通用型家庭助手机器人的研发项目。项目起至至始于1998年HPR-1(HondaP3),先后面世了HPR-2P、HRP-2、HRP-3P、HRP-3、HRP-4C、HRP-4等多个人形机器人。目前最新的机器人HPR-5P于2018年发布,该机器人体重182cm,体重101kg,全身总共37个自由度,旨在替代建筑行业中的繁重工作。波士顿动力(1986~2023):腿足式机器人运控技术最前沿,军事化应用领域特征明显。波士顿动力最早因研发的BigDog而被世界闻名,公司发布了BigDog、Rise、LittleDog、PETMAN、LS3、Spot、Handle、Atlas等多个机器人,从秀尼、多肢机器人至人形机器人,有着明显的军事化应用领域的路线特征。波士顿动力就是一家典型的技术驱动的公司,从机械结构、算法步态掌控、动力系统能耗等方面对机器人持Chinian运算更新,核心就是发展腿式机器人以适应环境相同环境的使用,技术关键在于动力学研究和机器人平衡态的掌控。Digit系列机器人(2019~2023):具备跳跃能力,著眼物流领域商业化。Digit系则列于于就是AgilityRobotics公司在物流领域商业化的尝试,公司从俄勒冈州立大学(OSU)拆分出来的机器人公司,致力于研发和生产双足机器人,前后研发了MABEL、ATRIAS、CASSIE、DIGIT系列足式机器人。其中CASSIE可实现4m/s的不可思议配速,就是腿足式机器人在快速跳跃能力上里程碑式的成果。2019年,Agility发推出了人形机器人Digit,在Cassie的基础上加之了躯干、手臂,并增加了更多排序能力,大力支持功率18kg的箱子,可以进行移动吸附、装运等工作。小米“铁大“机器人(2022):21年小米曾发布一款机械狗Cyberdog,就是其在肢式机器人的首次尝试。2022年8月,小米首个全尺寸人形人造机器人CyberOne亮相秋季发布会。CyberOne体重177cm,体重52kg,艺名“铁大”,能心智45种人类语义情绪,分辨85种环境语义;搭载小米自研全身控制算法,可以协同运动21个关节;配备了MiSense视觉空间系统,可以三维重建真实世界;全身5种关节驱动,峰值扭矩300Nm。特斯拉Optimus机器人(2022年):推动人形机器人商业化。Optimus原型机暗狮属2022年特斯拉AIday,体重1.72m,体重57kg,可以功率20kg,最快运动速度8km/h。目前Optimus仍处于研发进展快速,仅8个月机器人已可实现四肢跳跃、载运、洒水等繁琐动作。交互型机器人索菲亚(2015)和阿梅卡(2021),面部表情拟人化的尝试:索菲亚(Sophia)是由汉森机器人技术公司(HansonRobotics)开发的类人机器人,2015年面世。索菲娅皮肤由Frubber仿生材料制成,基于语音识别、计算机视觉技术,可以识别和复制各种各样的人类面部表情,并通过分析人类表情和语言同人类对话。阿梅卡(Ameca)由英国领先的仿生娱乐机器人设计和制造公司——工程艺术有限公司(EngineeredArts)打造,具有12个全新的面部致动器,经过面部表情升级后,能对着镜子眨眼、抿嘴、皱眉、微笑。阿梅卡能够自由进行几十种仿人类的肢体运动,被认为是“世界上最逼真机器人”。2.AI大模型+人形机器人:给机器人提供更多更多常识2.1.AI大模型训练过程及发展趋势大模型=进度表训练+微调。从2017年Transformer已经已经开始,至GPT-1、BERT、GPT2、GPT-3、GPT-4模型的出现,模型的参数量级同时同时实现了从亿至百万亿量级的突破,大模型(进度表训练模型、FoundationModels)在并并无标注的数据上进行进度表训练,利用专用的小规模的标注数据对模型进行微调(fine-tuning),可以用做下游任务预测。迁址自学就是进度表训练模型的主要思想,当目标场景数据严重不足时,先在数据量大的官方数据集上训练基于深度神经网络的AI模型,然后将其迁址至目标场景中,通过目标场景中的小数据集进行微调,并使模型达致建议的性能。进度表训练模型非常大地减少了模型在标记数据量下游工作的仍须,从而适用于于于一些难以获得大量标记数据的场景。大模型的发展过程和趋势:从参数规模来看,大模型经历了从进度表训练模型、大规模进度表训练模型、超大规模进度表训练模型的阶段,参数量同时同时实现了从亿级至百万亿级的发展。从数据模态来看,大模型正在从文本、语音、视觉等单一模态大模型,向着多种模态融合的通用型人工智能方向发展。2.2.AI大模型并使人形机器人具备通用型任务解决能力AI大模型将可以从语音、视觉、决策、掌控等多方面同时同时实现同人形机器人的融合,形成心智、决策、掌控闭环,大大提高机器人的“智慧”程度:语音:ChatGPT作为一种进度表训练语言模型,可以被应用于机器人与人类之间的自然语言可视化。比如说,机器人可以通过ChatGPT回去心智人类的自然语言指令,并根据指令进行适度的动作。自然语言就是人类最通用型的可视化媒介,语音作为自然语言的载体将可以就是机器人拟人化的关键任务。尽管深度自学的出现已经将以语音识别技术、自然语言处理、语音分解成技术为构成模块的语音交互技术推向相对明朗的阶段,但实际过程中仍然容易出现语义心智偏差(嘲讽等)、多轮对话能力严重不足、文字死板的情况。语言大模型为机器人的独立自主语音可视化难题提供更多更多了解决方案,在上下文心智、多语种识别、多轮对话、情绪识别、模糊不清语义识别等通用型语言任务上,ChatGPT表散发出了不逊于人类的理解力和语言分解成能力。在以ChatGPT为代表的大模型的加持下,人形机器人对通用型语言的心智和可视化就可以加之日程,这将可以就是通用型AI生态圈通在用服务机器人的已经已经开始。视觉:视觉大模型赋能人形机器人识别更精确,场景更通用。计算机视觉的发展经历了基于以特征描述子代表的传统视觉方法、以CNN卷积神经网络为代表的深度学习技术,目前通用的视觉大模型正处于研究探索阶段。一方面,大参数量模型的强拟合能力使得人形机器人在进行目标识别、避障、三维重建、语义分割等任务时具备更高的精确度;另一方面,通用大模型解决了过去以卷积神经网络为代表的深度学习技术过分依赖单一任务数据分布,场景泛化效果不佳的问题,通用视觉大模型通过大量数据学到更多的通用知识,并迁移到下游任务中,基于海量数据获得的预训练模型具有较好的知识完备性,大大提升场景泛化效果。人形机器人的场景相对工业机器人更通用、更复杂,视觉大模型的AllinOne的多任务训练方案能使得机器人更好地适应人类生活场景。决策:通用型语言、环境心智能力就是自动化决策的基础,多模态大模型贴近人形机器人的决策市场需求。单一模态智能无法解决设计多模态信息的决策问题,比如“语音告知机器人提款桌子上绿色苹果”的任务。多模态统一建模,目的就是进一步进一步增强模型的跨模态语义对齐能力,并使模型逐步标准化,并使机器人能综合视觉、语音、文本多维度信息,同时同时实现各感官融合决策的能力。基于多模态的预训练大模型或将变成人工智能基为础设施,进一步进一步增强机器人可以顺利完成任务的多样性与通用性,并使其不只局限于文本和图像等单个部分,而是多应用领域相容,拓展单一智能为融合智能,并使机器人能融合其心智至的多模态数据同时同时实现自动化决策。掌控:生成式AI生态圈机器人自我掌控,最终形成心智、决策、掌控闭环。并使人形机器人具备通用型能力,首先仍须其具备“常识”,即为为通用型的语言理解能力(语音)和场景理解能力(视觉);其次仍须其具备决策能力,即为为传送指令后产生的对任务的拆除解;最后,仍须其具备自我掌控和继续执行性能,生成式AI的代码生成能力将最终并使机器人的心智、决策、动作形成闭环,达致自我掌控的目的。事实上,近来谷歌团队已经尝试将ChatGPT应用于机器人掌控的场景中,通过提前写出不好机器人底层函数库,并对其描述功能促进作用及目标,ChatGPT能分解成顺利完成任务的代码。在生成式AI的推动下,机器人编程的门槛将可以慢慢增加,最终同时同时实现自我编程、自我掌控,并回来成人类习以为常的通用型任务。2.3.OpenAI和谷歌将大语言模型应用于机器人OpenAI领投挪威人形机器人公司1XTechnologies。2017年OpenAI面世了向于机器人的开源软件Roboschool,在机器人中部署了代莱单样本调侃自学算法,通过人类在VR中向机器人演示如何继续执行任务。2018年,OpenAI发布了8个模拟机器人环节和事后经验家访基线推行,并用来训练在物理机器人上工作的模型。22年,HalodiRobotics在挪威Sunnaas医院测试了医护助理机器人EVE,并使其继续执行后勤工谢泽生。2023年3月28日,OpenAI领投挪威人形机器人公司1XTechnologies(前则表示HalodiRobotics)。HalodiRobotics通过Ansys初创公司计划利用Ansys仿真软件开发能在日常场景中与人安全协作的人形机器人。谷歌明确提出ChatGPTforRobotics,利用ChatGPT解决机器人应用程序编写问题。2023年4月,谷歌在其官网刊载了一篇名为《机器人ChatGPT:设计原则和模型能力(ChatGPTforRobotics:DesignPrinciplesandModelAbilities)》论文,这项研究的目标就是观测ChatGPT是否可以超越文本思索,并对物理世界进行推理小说回去帮助顺利完成机器人任务。人类目前仍然轻微依赖手写代码回去掌控机器人,该团队一直在积极探索如何出现发生改变这一现实,使用OpenAI的新人工智能语言模型ChatGPT同时同时实现自然的人机交互。人类可以从机器人流程中的intheloop变为ontheloop。论文明确提出,不建议LLM输出特定于机器人平台或者库的代码,只是创造直观的高级函数库可以可供ChatGPT阳入用,并在后端谈论高级函数库链接至各个平台,场景和工具的现有库和API。结果证清,ChatGPT的引入,并使人类通过自然语言等高级语言命令于语言模型可视化,用户通过文本对话不断将人类的心智信息输入ChatGPT,ChatGPT解析观测温品在对话系统中输出有关操作方式方式,不仍须分解成代码。这样,人类可以同时同时实现无缝部署各种平台和任务,人类对ChatGPT输出的质量和安全性进行评估。人类在机器人pipeline中的任务主要就是:1)首先,定义一组高级机器人API或函数库。该库可以针对特定的机器人类型进行设计,并且必须从机器人的掌控栈或心智库态箭至现有的低层次具体内容同时同时实现。为高级API使用描述性名称非常关键,这样ChatGPT就可以推理小说它们的犯罪行为。2)为ChatGPT编写一个文本提示信息,描述任务目标,同时明确说明高级库中的哪些函数需以。提示信息还可以囊括有关任务约束的信息,或者ChatGPT必须如何非政府它的答案,涵盖使用特定的编程语言,或使用辅助解析组件等。3)用户通过轻而易举检查或使用模拟器回去评估ChatGPT的代码输出。如果仍须,用户使用自然语言向ChatGPT提供更多更多有关答案质量和安全性的意见反馈。4)当用户对解决方案深表令人满意时,就可以将最终的代码部署至机器人上。ChatGPT可以以zero-shot的方式解决直观的机器人任务。对于直观的机器人任务,用户只仍须提供更多更多文本提示信息和函数库描述,不仍须提供更多更多具体内容的代码实例,ChatGPT就可以zero-shot解决时空推理小说(ChatGPT掌控一个平面机器人,用视觉控制器捕捉篮球边线)、掌控真实无人机顺利完成物体寻找、抬高交互式无人机同时同时实现工业检测等问题。在人类用户ontheloop可视化下,ChatGPT可以顺利完成更繁琐的机器人掌控任务。1)课程自学:教授ChatGPT直观的丢弃和放置物体的技能,并将所学会的技能按照逻辑女团用做更繁琐的区块排序任务;2)Airsim避障:ChatGPT构筑了避障称得上法的大部分关键模块,但仍须人工意见反馈无人机朝向等信息。人工意见反馈高级的自然语言,ChatGPT能够心智并在适当的边线进行代码修正。ChatGPT的对话系统能够解析观测并输出有关操作方式方式。1)提着API的闭环对象导航系统:为ChatGPT提供更多更多了对计算机视觉模型的访华,作为其函数库的一部分。ChatGPT在其“代码“输出中构筑心智-动作循环,同时同时实现估计相对物体角度、积极探索未明环境、并导航系统至用户选取对象的功能;2)使用ChatGPT的对话进系统进行闭环视觉语言导航系统。在模拟场景下,人类用户将代莱状态观测值作为对话文本输入,ChatGPT的输出仅返回向前的运动距离和拐弯角度,同时同时实现了向“对话系统”指导机器人一步步导航系统至感兴趣区域。3.人形,并使机器人的运动继续执行更加通用型继续执行能力(机器人的四肢):行动能力(腿)+精细操作方式方式(手)。把机器人做成人形,就是为了并使机器人的继续执行能力更加通用型。机器人继续执行任务时所处的环境就是按照人类的体型修筑出的:建筑、道路、设施、工具等,这个世界就是为了便捷人类这种人形生物才这样设计。如果出现了某种新形态的机器人,人们就必须再次设计一套机器人适应环境的全新环境。设计在某个特定范围内继续执行任务的机器人相对容易,如果想要提高机器人的通用性,就必须挑选出可以作为异能的人形机器人。本章挑选出两个代表性产品波士顿动力Altas和特斯拉Optimus,从驱动、环境心智、运动控制三方面对照方案差异,找寻人形机器人运动控制方案商业化的趋势。波士顿动力Altas的定座落在技术的前瞻性研究,侧重于积极探索技术应用领域的可能性而非商业化。从硬件架构来看,Altas具备出众的动态性能、瞬时功率密度和均衡的运动姿态,可以同时同时实现高功率、高复杂度的运动,像是一场技术驱动的盛宴。商业化并非波士顿动力当前主要考量因素,Altas项目更多作为一个研究平台可以可供研究者进行学术先行检,侧重于积极探索技术应用领域的可能性而非商业化。特斯拉Optimus菩提于人形机器人的规模化、商业化、标准化,商业化的目标驱型动下,成本、能耗变成特斯拉团队的考量指标。3.1.驱动:液压驱动VS电动驱动3.1.1.电驱成本低、难于维护、控制精度高,商业化潜力高主流人形机器人的驱动方案涵盖液压驱动和电气驱动(伺服电机+减速器)两种。二者比电气驱动,液压驱动输出力矩大、功率密度高和功率能力强,因而能满足用户波士顿动力Atlas高功率动作和快速运动的市场需求;但液压驱动的方式能耗大、成本高,同时难出现漏液等问题、可维护性低。一方面,商用场景Dier功率动作(比如跑酷、后空翻等)属于非必要犯罪行为,另一方面,随着电驱系统功率密度和响应速度的不断提升,我们表示融合电驱成本低、难于维护且技术应用领域明朗的优势,基于电驱的人形机器人商业化可能性更高。3.1.2.波士顿动力Atlas:采用“液压驱动”方案波士顿动力全身共28个液压执行器,可执行高负载复杂动作。HPU(HydraulicPowerUnit)作为Atlas的液压动力源具备极小尺寸的高能量密度(~5kW/5Kg),电液经由流体管线连接至各液压泵,可实现快速响应和精确力控,其高瞬时功率密度的液压驱动器能支持机器人实现奔跑、跳跃、后空翻等复杂动作,机器人的结构强度得益于其高集成度的结构总成。根据官方披露影像及专利细节,我们推测:踝、膝、肘关节由液压缸驱动;髋、肩、腕关节及腰腹由摆动液压缸驱动。3.1.3.特斯拉Optimus:采用“电动驱动”方案单台Optimus全身40个执行器,就是单台多关节机器人的6~7倍。其中:身体第一关节部分采用减速器/丝杆+伺服电机的传动方式,总计28个执行器;机械手基于不值驱动方案,采用电机+腱绳驱动(tendon-driven)的传动结构,单手6个电机,11个自由度。根据TestlaAIDay,特斯拉独立自主研发的六种执行器中,旋转关节方案承继工业机器人,线性执行器和微型伺服电机就是人形机器人崭新市场需求,具体内容看一看:旋转关节方案(肩、髋、腰腹):伺服电机+减速器,我们推测,单台人形机器人将搭载6台RV减速器(髋、腰腹)和8台谐波减速器(肩、腕)。根据特斯拉Optimus执行器方案,RV减速器体积小、功率能力强、刚度高,适用于于于髋、腰腹大功率关节,其中髋关节2*2台、腰腹两个自由度2台,总计6台;谐波减速器体积小、传动比高、精密度高,适用于于于肩、腕关节,其中肩关节3*2台、腕关节1*2台,总计8台。随着更多厂商的涌入,其执行器方案可能将将存差异,若线性执行器被旋转执行器替代,单台机器人减速器数量将有所提高。旋转角度并不小的关节(膝、肘、踝、腕):线形执行器(伺服电机+丝杠)。一体化伺衣电动缸(伺服电机+丝杠)方案具备自锁能力,能耗比纯旋转关节方案低。线性执行器空间利用率高、能提供更多更多非常大的推动力。我们猜测,线性执行器基于力矩电机结再分后行星滚柱丝杠的方案将应用于线性执行器关节(髋、膝、踝、肘、腕)中,预计合计将使用14个线性执行器。行星滚柱丝杠以其高横跨、高刚度、长寿命的特点或变成人形机器人线性执行器的关键传动装置,通过内置人形机器人市场需求同时同时实现降本就是大规模回调的前提。根据TeslaAIDay2022会上展现出的信息来看,Optimus线性执行器采用的方案即为为行星滚柱丝杠一体式控制器电动缸。我们表示下肢髋、膝、踝关节及上肢的肘关节的控制器电缸采用高横跨、高刚度的行星滚柱丝杠作为传动装置可能性比较大。行星滚柱丝杠结二重繁琐、加工难度大因而成本很高,通过调整设计、工艺方案内置人形机器人的需必须回去同时同时实现降本就是其大规模应用领域的前提。机械手:Optimus单手涵盖6个执行器,可实现11个自由度,由微型电机驱动,“不值驱动”方案性价比高,“绳驱“传动结构不确定性非常大。“不值驱动”,系统执行器的数目大于其自由度数目,因为机械手本身高自由度数目的特性,自身利益提高系统成立一千的集成性、紧凑型性和降低成本、更自身利益精简时程运动控制的考量,设计者们可以增至太太少所使用电机的数目(即为为执行器的数目),形成了执行器的数目大于其自由度数目的不值驱动方案。通过通过机械结构的优化同时同时实现以极少的执行机构驱动更多的自由度,节省成本,就是目前商业产品及高校机械手研发的主流挑选出。机械手驱动方案差异非常大,电机的轻量化、低成本就是关键。机械传动结构上,机械手的主流方案涵盖绳驱(TendonDriven)、连杆、齿轮齿条、材料形变等。各机械手驱动方案差异非常小:RitsumeikanHandRitsumeikanHand通过耦合走线同时同时实现了2个驱动器对15个关节的驱动;Stanford/JPL小巧手单手16个电机;ShadowHand单手30个电机,合计24个自由度。人形机器人机械手仍须满足用户质量轻、结二重紧凑型和抓取招盛纯的建议,因此电机应具有尺寸小、质量轻、精度高、扭矩大的特点。空心杯电机结构紧凑、能量密度高、能耗低,和人形机器人机械手市场需求契合度高。特斯拉Optimus机械手推行电机+腱绳驱动的方式,可能将将劲敌部传动方案进行优化。尽管绳驱给机械手平添了非常大的灵活性,且可以非常大精简设计难度和系统的为丛藓科扭口藓杂性,但其可靠性、传动效率都低于传统连杆、齿轮齿条等方式,可能将将就是研发团队短期研发的权宜之计。3.2.环境心智:深度相机+激光雷达VS氢铵视觉方案用做同时同时实现机器人独立自主移动的心智和定位技术原理主要涵盖视觉、激光、超声波、GPS、IMU等,对应机器人心智系统的相同传感器类别。SLAM(即时定位与地图构筑)就是发展比较明朗、应用领域广为的定位技术,它就是机器人通过对各种传感器数据进行采集和排序,分解成对其自身边线姿态的定位和场景地图信息的系统。SLAM问题可以描述为:机器人在未明环境中从一个未明边线已经已经开始移动,在移动过程中根据边线估一千和传感器数据进行自身定位,同时修筑增量式地图。以以获取定位和地图后,再根据路径规划算法(全局、局部、避障)同时同时实现独立自主移动。3.2.1.波士顿动力Atlas:深度相机+激光雷达波士顿动力Atlas心智方案融合深度相机和激光雷达,基于多平面划分算法同时同时实现步态规划。Atlas机器人心智视觉技术发展相对明朗,它先进经验GoogleTransformer模型,构筑HydraNet神经网络模型,优化视觉算法,顺利完成了自动驾驶氢铵视觉系统的迁址;Atlas使用ToF深度相机以每秒15帧的频率分解成点云,基于多平面分割称得上法从点云中提取环境表面,数据经过态射后顺利完成对周边物体的识别。之后,工控机基于识别至的表面和物体信息进行步态规划,以同时同时实现避障、观测地面状况以和航行等任务。IHMC全系列称为“人类与机器心智研究所”,就是一家著眼于研发机器人掌控称得上法的顶尖机构,主要研发人形机器人跳跃所需的关键算法,而统一指挥Atlas机器人东站公、跳跃等算法就源于于IHMC。3.2.2.特斯拉Optimus:氢铵视觉方案,成本更高特斯拉Optimus环境心智采用基于摄像头的纯视觉方案,移殖特斯拉全系列自动驾驶系统,成本更高。Optimus头部搭载三枚摄像头(鱼眼摄像头+左右摄像头),通过全景分割+自研的三维重建算法(OccupancyNetwork)同时同时实现环境心智,氢铵视觉方案较之激光雷达等心智设备成本更高,但对算力建议高。机器人承继了Autopilot算法框架,通过再次搜集数据训练适用于于于机器人的神经网络,以同时同时实现环境的三维重建、路径规划、独立自主导航系统、动态可视化等。特斯拉彪悍的全自动驾驶系统(FSD)的移植,并使机器人视觉方案在无法增加硬件成本的前提下朝着更精确、更智能的方向进步。3.3.运动控制:尚未形成通用型的控制器解决方案运控算法就是核心竞争力,各家人形机器人控制算法均为自研。人形机器人对运动往上制能力及心智计算能力建议较低,且相同厂商的执行器数量和类别差异非常大,未来运控算法或变成厂商核心竞争力,且自研可能性非常大;此外人形机器人掌控方案,对于客户应用领域场景的了解程度及工艺建议也就是关键因素,目前下游场景分散,单独一家厂商还很难将人形机器人重实效各个场景的通用型。3.3.1.运动控制算法:思路相似,均为离线犯罪行为库和实时调整波斯顿动力Atlas:基于离线犯罪行为库和模型预测掌控(MPC)同时同时实现犯罪行为掌控离线犯罪行为库基于轨迹优化算法(质心运动学优化+运动学优化)和动作捕捉(MotionCapture)创建,技术人员可以通过向库中内嵌崭新轨迹为机器人内嵌新功能;机器人被选取犯罪行为目标后,从犯罪行为库中挑选出尽可能相符目标的犯罪行为,获得理论上可行的动态已已连续动作。模型预测掌控(MPC)根据传感器意见反馈的实时信息,基于犯罪行为库调整部分后参数(力、姿势、关节动作时间等)的细节,以适应环境真实环

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论