F

Flower Calvin Abcd

由 mbreuss 开发
FlowerVLA是一个针对CALVIN ABCD数据集预训练的机器人操作模型,采用创新的视觉-语言-动作流策略,仅包含10亿参数,专为机器人学习设计。
下载量 24
发布时间 : 3/16/2025
模型介绍
内容详情
替代品

模型简介

FlowerVLA是一种高效的视觉-语言-动作流策略,采用半量Florence-2进行多模态视觉-语言编码,结合基于Transformer的新型流匹配架构,实现高效、通用的视觉-语言-动作策略。

模型特点

高效的多模态编码
使用半量Florence-2进行多模态视觉-语言编码,实现高效的视觉-语言-动作策略。
创新的流匹配架构
采用基于Transformer的新型流匹配架构,仅约10亿参数即可实现高效、通用的视觉-语言-动作策略。
高性能
在CALVIN ABCD挑战赛中排名第一,平均长度达到4.72。

模型能力

视觉-语言-动作编码
机器人操作
多模态任务执行

使用案例

机器人技术
拾取物体
根据语言指令拾取特定物体,如蓝色立方体。
在测试中达到99.1%的成功率。