R

Rdt 170m

由 robotics-diffusion-transformer 开发
RDT-170M是一个拥有1.7亿参数的模仿学习扩散Transformer模型,用于机器人视觉-语言-动作任务。
下载量 278
发布时间 : 10/23/2024
模型介绍
内容详情
替代品

模型简介

RDT-170M是一个基于Transformer的扩散策略模型,能够根据语言指令和多视角RGB图像预测未来64个机器人动作,兼容多种移动机械臂平台。

模型特点

多模态输入支持
支持语言指令和多达三个视角的RGB图像输入
广泛兼容性
兼容单臂/双臂、关节空间/末端执行器空间、位置控制/速度控制等多种机器人平台
统一动作空间
通过统一动作空间支持多种机器人控制方式
大规模预训练
基于46个机器人数据集进行预训练

模型能力

视觉-语言理解
机器人动作预测
多模态融合
扩散模型推理

使用案例

机器人控制
移动机械臂控制
根据语言指令和视觉输入控制移动机械臂执行任务
可预测未来64个机器人动作
双臂协调操作
控制双臂机器人完成协调操作任务