P

Poseless 3B

由 homebrewltd 开发
PoseLess是一种创新的机器人手部控制框架,通过使用投影表示直接将2D图像映射到关节角度,无需显式的姿态估计。
下载量 98
发布时间 : 3/3/2025
模型介绍
内容详情
替代品

模型简介

该模型利用随机关节配置生成的合成训练数据,实现了对现实场景的零样本泛化,以及从机械手到人手的跨形态迁移。通过投影视觉输入并采用基于Transformer的解码器,PoseLess在解决深度模糊性和数据稀缺性等挑战的同时,实现了鲁棒、低延迟的控制。

模型特点

无姿态估计的直接映射
通过使用投影表示直接将2D图像映射到关节角度,无需显式的姿态估计,减少了传统两阶段流程中的误差传播。
合成数据生成
提出了一种合成数据生成流程,通过随机化关节角度和视觉特征生成无限训练样本,消除了对昂贵标注数据集的依赖。
跨形态泛化
展示了模型仅通过机械手数据训练就能模仿人手运动的能力,实现了跨形态迁移。
无需深度信息
证明了无需深度信息的控制是可行的,为后续采用不支持深度估计功能的相机铺平了道路。

模型能力

手部姿态估计
关节角度预测
跨形态迁移
图像到关节的直接映射

使用案例

机器人控制
机械手控制
通过单目图像直接控制机械手的关节角度,实现精确的运动控制。
在关节角度预测精度上具有竞争力
人手姿态估计
仅通过机械手数据训练,实现对人手姿态的估计。
展示了跨形态泛化的能力