O

Openvla 7b Oft Finetuned Libero Spatial

由 moojink 开发
OpenVLA-OFT是一个经过优化的视觉-语言-动作模型,通过微调技术显著提升了基础OpenVLA模型的运行速度和任务成功率。
下载量 2,513
发布时间 : 2/25/2025

模型简介

该项目聚焦于视觉-语言-动作模型的微调,旨在优化模型运行速度并提高任务成功率。适用于LIBERO-Spatial任务,采用优化的微调技术提升性能。

模型特点

优化的微调技术
采用优化的微调技术显著提升基础OpenVLA模型的性能
高效动作生成
能够生成连续的动作块,适用于机器人控制任务
多模态输入处理
支持视觉(图像)、语言(任务描述)和本体感受状态的多模态输入

模型能力

视觉-语言-动作多模态处理
机器人动作序列生成
连续动作预测
任务导向控制

使用案例

机器人控制
LIBERO-Spatial任务执行
基于视觉和语言输入生成机器人动作序列
提高任务执行速度和成功率
AIbase
智启未来,您的人工智能解决方案智库
简体中文