Sapiens-pose-1b开源人体姿态估计模型 - 支持308个关键点检测实用工具

Sapiens Pose 1b

由 facebook 开发

Pose-Sapiens-1B 是一个基于视觉 Transformer 架构的高分辨率人体姿态估计模型，在 3 亿张 1024x1024 分辨率的人类图像上预训练，支持 308 个关键点检测（身体、面部、手部和足部）。

下载量 82

发布时间 : 9/10/2024

模型简介

该模型专为高精度人体姿态估计设计，能够在真实场景中表现出卓越的泛化能力，尤其适用于标注数据稀缺或完全合成的场景。

高分辨率支持

原生支持 1K 高分辨率推理（1024x768），适合处理高精度图像。

多部位关键点检测

可同时检测身体、面部、手部和足部的 308 个关键点。

强泛化能力

即使在标注数据稀缺或完全合成的场景下，也能在真实数据上表现出色。

大规模预训练

基于 3 亿张人类图像的预训练，学习丰富的姿态特征表示。

人体姿态估计

面部关键点检测

手部关键点检测

足部关键点检测

高分辨率图像处理

动作分析与运动科学

运动员姿态分析

用于分析运动员的动作姿态，优化训练效果。

可提供 308 个关键点的精确位置数据

虚拟现实与增强现实

虚拟化身控制

用于驱动虚拟化身的精确动作捕捉。

实现高保真的人体动作重现

医疗康复

康复训练监测

监测患者的康复训练动作是否正确。

提供精确的姿态评估数据

属性	详情
开发者	Meta
模型类型	视觉变换器（Vision Transformer）
许可证	知识共享署名 - 非商业性使用 4.0（Creative Commons Attribution-NonCommercial 4.0）
任务	姿态估计
格式	原始格式
文件	sapiens_1b_goliath_best_goliath_AP_639.pth