S

Sapiens Seg 0.6b Torchscript

由 facebook 开发
Sapiens是一个基于3亿张1024x1024分辨率人类图像预训练的视觉Transformer模型家族,专注于以人为中心的视觉任务。
下载量 25
发布时间 : 9/9/2024
模型介绍
内容详情
替代品

模型简介

该模型用于对人类图像进行28类身体部位分割,支持1K高分辨率推理,在标注数据稀缺或完全合成的情况下仍能展现出对真实数据的卓越泛化能力。

模型特点

高分辨率支持
原生支持1K高分辨率推理,图像尺寸为1024x768。
强大的泛化能力
即使在标注数据稀缺或完全合成的情况下,也能展现出对真实数据的卓越泛化能力。
大规模预训练
基于3亿张1024x1024分辨率人类图像进行预训练。

模型能力

人体图像分割
高分辨率图像处理
28类身体部位识别

使用案例

医疗影像
身体部位分割
用于医疗影像中对人体各部位进行精确分割。
能够识别28类身体部位
虚拟现实
虚拟形象创建
用于创建高精度的虚拟人物形象。