S

Sapiens Pose 1b

由 facebook 开发
Pose-Sapiens-1B 是一个基于视觉 Transformer 架构的高分辨率人体姿态估计模型,在 3 亿张 1024x1024 分辨率的人类图像上预训练,支持 308 个关键点检测(身体、面部、手部和足部)。
下载量 82
发布时间 : 9/10/2024
模型介绍
内容详情
替代品

模型简介

该模型专为高精度人体姿态估计设计,能够在真实场景中表现出卓越的泛化能力,尤其适用于标注数据稀缺或完全合成的场景。

模型特点

高分辨率支持
原生支持 1K 高分辨率推理(1024x768),适合处理高精度图像。
多部位关键点检测
可同时检测身体、面部、手部和足部的 308 个关键点。
强泛化能力
即使在标注数据稀缺或完全合成的场景下,也能在真实数据上表现出色。
大规模预训练
基于 3 亿张人类图像的预训练,学习丰富的姿态特征表示。

模型能力

人体姿态估计
面部关键点检测
手部关键点检测
足部关键点检测
高分辨率图像处理

使用案例

动作分析与运动科学
运动员姿态分析
用于分析运动员的动作姿态,优化训练效果。
可提供 308 个关键点的精确位置数据
虚拟现实与增强现实
虚拟化身控制
用于驱动虚拟化身的精确动作捕捉。
实现高保真的人体动作重现
医疗康复
康复训练监测
监测患者的康复训练动作是否正确。
提供精确的姿态评估数据