O

Openvla 7b Finetuned Libero 10

由 openvla 开发
该模型是通过在LIBERO-10数据集上采用LoRA方法微调OpenVLA 7B模型得到的视觉语言动作模型,适用于机器人技术领域。
下载量 1,779
发布时间 : 9/3/2024

模型简介

一个针对机器人技术优化的多模态模型,能够处理图像文本到文本的任务,特别适用于视觉语言动作场景。

模型特点

LIBERO-10数据集微调
专门针对LIBERO仿真基准的LIBERO-Long版本进行优化
LoRA高效微调
采用LoRA(秩=32)方法进行参数高效微调,保持模型性能同时减少计算资源需求
多模态能力
结合视觉和语言理解能力,适用于机器人技术中的复杂任务
大规模预训练基础
基于强大的OpenVLA 7B模型构建,继承了其丰富的视觉语言理解能力

模型能力

图像理解
文本生成
机器人动作规划
多模态任务处理

使用案例

机器人技术
仿真环境中的任务规划
在LIBERO仿真环境中执行复杂的多步骤任务
经过优化的任务完成率和执行效率
视觉语言导航
根据视觉输入和语言指令进行导航决策
AIbase
智启未来,您的人工智能解决方案智库
简体中文