具身智能机器人扩散策略Diffusion Policy环境安装与运行_第1页
具身智能机器人扩散策略Diffusion Policy环境安装与运行_第2页
具身智能机器人扩散策略Diffusion Policy环境安装与运行_第3页
具身智能机器人扩散策略Diffusion Policy环境安装与运行_第4页
具身智能机器人扩散策略Diffusion Policy环境安装与运行_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

具身智能机器人扩散策略DiffusionPolicy环境安装与运行1主要内容23扩散策略综述扩散策略源码使用逻辑训练UMI扩散策略4UMI训练过程1扩散策略综述具身智能基本原理4非端到端模型:基于VLM的具身分层模型具身智能(EmbodiedIntelligence):具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。具身智能三大环节:感知—决策—执行1.感知(Perception):智能体通过传感器(如视觉、听觉、触觉等)收集环境中的信息。感知环节是智能体理解周围环境并生成内部表示的基础。没有准确的感知,智能体无法做出有效的决策。2.决策(Decision-Making):智能体在获得感知信息后,通过内部模型和算法,评估不同的可能行动方案,并选择最优的行动策略。高效的决策是实现智能行为的核心,因为它直接影响智能体的反应和表现。3.执行(Execution):智能体将决策结果转化为具体的物理动作,以实现预定目标。执行能力的提升直接关系到智能体的实际应用效果。端到端模型:基于VLA的具身模型具身智能与dp/umi/dexcap5具身智能三大环节:感知—决策—执行1.感知:RealSenseD4152.决策:DiffusionPolicy3.执行:UR5-CB3orUR5e

及棍状末端1.感知:Goprohero92.决策:DiffusionPolicy3.执行:UR5-CB3orUR5e

及二指夹爪1.感知:RealsenseL515

RealSenseT2652.决策:DiffusionPolicy3.执行:FrankaFR3

及四指夹爪LEAPHandDiffusion基本原理6DiffusionPolicy:Diffusion(扩散)是一种生成方法,最初被用在图像生成领域。图像生成技术,如StableDiffusion和Midjourney,都基于这种扩散方法。扩散方法的核心思想是,通过逐步地对图像进行调整和改善,从而生成高质量的图像。扩散模型训练过程扩散模型图像生成过程VAE模型编码解码过程Policy基本原理7DiffusionPolicy:Policy(策略)在机器学习和控制系统中指的是一种决策规则或机制。对于机器人控制,策略的输入通常是感知信息(例如摄像头捕捉到的视频)以及其他传感器提供的数据(例如机器人各个关节的位置)。策略的输出则是机器人需要执行的具体动作。DiffusionPolicy架构对比DiffusionPolicy效果对比DiffusionPolicy基本原理8扩散策略是一种新的机器人行为生成方法,它将机器人的视觉运动策略表示为一个条件去噪扩散过程。扩散策略接收输入的观察数据,然后通过噪声预测网络将高斯噪声添加到输入数据上。接着,系统通过多次迭代去噪的过程,逐步减少噪声,使输出动作变得更加明确和稳定。每次迭代去噪都会将噪声减少一部分,直至最终得到一个接近真实的动作。这个过程形成一个闭环,系统能够以大约2Hz的频率进行实时反应。1.动作多模态性2.动作空间可扩展性3.训练稳定性2扩散策略源码使用逻辑dp/umi/dexcap源码解读10具身智能三大环节:感知—决策—执行1.感知:RealSenseD4152.决策:DiffusionPolicy3.执行:UR5-CB3orUR5e

及棍状末端1.感知:Goprohero92.决策:DiffusionPolicy3.执行:UR5-CB3orUR5e

及二指夹爪1.感知:RealsenseL515

RealSenseT2652.决策:DiffusionPolicy3.执行:FrankaFR3

及四指夹爪LEAPHanddp/umi/dexcap源码对比11脚本示例demo_pusht.py1.安装dp环境:condaenvcreate-fconda_environment.yaml2.安装rtde:pipinstallur_rtde3.启动环境并运行:pythondemo_pusht.py-odata/pusht_demo.zarr-o或--output:指定演示数据保存的输出文件路径(必需)。-rs或--render_size:设置环境渲染的大小,默认值为96。-hz或--control_hz:设置控制频率,默认值为10Hz。3训练UMI扩散策略UMI扩散策略训练131.生成训练数据:python

scripts_slam_pipeline/07_generate_replay_buffer.py

-o

example_demo_session/dataset.zarr.zip

example_demo_session2.训练扩散策略:pythontrain.py--config-name=train_diffusion_unet_timm_umi_workspacetask.da

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论