O

Octo Small

由 rail-berkeley 开发
Octo小型版是一个基于扩散策略训练的机器人控制模型,能够预测未来4步的7维动作,适用于多源机器人数据集。
下载量 335
发布时间 : 12/13/2023
模型介绍
内容详情
替代品

模型简介

该模型采用Transformer架构,通过轻量级卷积编码器预处理图像数据,并结合T5语言编码器处理文本指令,用于机器人动作预测和控制。

模型特点

多源数据训练
整合了来自25个不同机器人数据集的训练数据,覆盖广泛的机器人操作场景
轻量级架构
采用2700万参数的紧凑Transformer架构,适合实时机器人控制
多模态输入
支持主摄像头和腕部摄像头图像输入,结合语言指令进行动作预测
扩散策略
使用扩散策略进行训练,能够预测未来4步的7维动作

模型能力

机器人动作预测
多模态数据处理
实时控制
语言指令理解

使用案例

工业机器人
装配线操作
根据视觉输入和语言指令完成产品装配任务
服务机器人
物品抓取
根据用户指令识别并抓取指定物品