O

Openvla 7b Oft Finetuned Libero Spatial Object Goal 10

由 moojink 开发
OpenVLA-OFT是基于OpenVLA模型优化的视觉-语言-动作模型,通过微调技术在LIBERO任务套件上显著提升了执行速度和成功率。
下载量 447
发布时间 : 4/28/2025

模型简介

该模型专注于机器人任务执行,通过视觉和语言输入生成连续动作序列,适用于空间、物体、目标和长期任务场景。

模型特点

优化的微调技术
采用OFT(Optimized Fine-Tuning)技术显著提升基础模型的执行速度和任务成功率
多任务支持
在LIBERO任务套件的四个子集(Spatial、Object、Goal、Long)上进行了专门优化
多模态输入
支持视觉(主相机和腕部相机图像)、语言(任务描述)和本体感受状态的多模态输入

模型能力

视觉-语言理解
连续动作序列生成
机器人任务执行
多模态信息融合

使用案例

机器人控制
空间导航任务
根据视觉输入和任务描述完成空间导航和物体操作
在LIBERO-Spatial任务上表现优异
长期任务执行
执行需要多步骤规划的长期机器人任务
在LIBERO-Long任务上表现良好
AIbase
智启未来,您的人工智能解决方案智库
简体中文