F

Flower Libero 10

由 mbreuss 开发
FlowerVLA是一个针对机器人操作任务预训练的视觉-语言-动作流策略模型,训练数据来自LIBERO 10数据集,仅包含10亿参数。
下载量 14
发布时间 : 3/17/2025
模型介绍
内容详情
替代品

模型简介

FlowerVLA采用创新架构,使用Florence-2模型半数参数实现多模态视觉语言编码,采用基于Transformer的新型流匹配架构,以约10亿参数提供高效通用的VLA策略。

模型特点

高效多模态编码
使用Florence-2模型半数参数实现多模态视觉语言编码
流匹配架构
采用基于Transformer的新型流匹配架构
高效参数规模
仅包含10亿参数,提供高效通用的VLA策略
高性能
在LIBERO 10挑战赛中取得高成功率

模型能力

视觉语言动作模型
机器人操作任务
多模态编码
流匹配

使用案例

机器人操作
将物品放入篮子
将字母汤和番茄酱放入篮子
成功率 0.9791666666666666
打开炉灶并放上摩卡壶
厨房场景3_打开炉灶并放上摩卡壶
成功率 0.9791666666666666
将黑碗放入橱柜底层抽屉并关闭
厨房场景4_将黑碗放入橱柜底层抽屉并关闭
成功率 1.0