S

Sapiens Pose 0.6b

由 facebook 开发
Sapiens 是一个基于 3 亿张高分辨率人类图像预训练的视觉 Transformer 模型家族,专注于以人为中心的视觉任务。
下载量 19
发布时间 : 9/18/2024
模型介绍
内容详情
替代品

模型简介

Pose-Sapiens-0.6B 是一个用于姿态估计的视觉 Transformer 模型,支持单张图像上 308 个关键点(身体+面部+手部+足部)的估计。

模型特点

高分辨率支持
原生支持 1K 高分辨率推理,图像尺寸可达 1024 x 768。
卓越的泛化能力
即使在标注数据稀缺或完全合成的情况下,仍能展现出对真实数据的卓越泛化能力。
多关键点检测
支持身体、面部、手部和足部共 308 个关键点的估计。

模型能力

人体姿态估计
面部关键点检测
手部关键点检测
足部关键点检测

使用案例

计算机视觉
人体姿态分析
用于运动分析、健身指导等场景中的人体姿态估计。
虚拟现实
为虚拟现实应用提供精确的人体姿态数据。