Segformer B0 Person Segmentation
模型简介
模型特点
模型能力
使用案例
许可证:开放铁路 语言:
- 英语 任务标签:图像分割
描述
语义分割是一种计算机视觉技术,用于为图像中的每个像素分配一个标签,表示图像中物体或区域的语义类别。这是一种密集预测形式,因为它涉及为图像中的每个像素分配标签,而不仅仅是像目标检测或实例分割那样围绕物体或关键点的框。语义分割的目标是识别和理解图像中的物体和场景,并将图像分割成对应于不同实体的部分。
参数
model = SegformerForSemanticSegmentation.from_pretrained("/notebooks/segformer_5_epoch",
num_labels=2,
id2label=id2label,
label2id=label2id, )
使用方法
from torch import nn
import numpy as np
import matplotlib.pyplot as plt
# 转换
_transform = A.Compose([
A.Resize(height=512, width=512),
ToTensorV2(),
])
trans_image = _transform(image=np.array(image))
outputs = model(trans_image['image'].float().unsqueeze(0))
logits = outputs.logits.cpu()
print(logits.shape)
# 首先,将logits调整到原始图像大小
upsampled_logits = nn.functional.interpolate(logits,
size=image.size[::-1], # (高度, 宽度)
mode='bilinear',
align_corners=False)
seg = upsampled_logits.argmax(dim=1)[0]
color_seg = np.zeros((seg.shape[0], seg.shape[1], 3), dtype=np.uint8) # 高度, 宽度, 3
palette = np.array([[0, 0, 0],[255, 255, 255]])
for label, color in enumerate(palette):
color_seg[seg == label, :] = color
# 转换为BGR
color_seg = color_seg[..., ::-1]
<img src='











