R

Rdt 1b

由 robotics-diffusion-transformer 开发
基于100万+多机器人操作数据预训练的10亿参数模仿学习扩散Transformer模型,支持多视角视觉语言动作预测
下载量 2,644
发布时间 : 8/27/2024
模型介绍
内容详情
替代品

模型简介

该模型能够根据语言指令和多视角RGB图像预测未来64个机器人动作,兼容多种现代移动机械臂系统

模型特点

多模态输入支持
同时处理语言指令和多达三个视角的RGB图像输入
通用机器人兼容性
支持单臂/双臂、关节/末端执行器空间、位置/速度控制等多种机器人平台
大规模预训练
基于100万+机器人操作数据和46个公开数据集训练
长序列动作预测
能够预测未来64个连续机器人动作

模型能力

视觉语言理解
机器人动作序列预测
多视角图像处理
跨平台机器人控制

使用案例

工业自动化
装配线操作
根据语言指令完成零件抓取和装配任务
实现精确的连续动作控制
服务机器人
家庭物品整理
根据语音指令识别和整理家居物品
完成复杂的多步骤操作序列