S

Segformer B3 Finetuned Ade 512 512

由 nvidia 开发
该SegFormer模型在512x512分辨率下针对ADE20k数据集进行了微调,采用分层式Transformer编码器与轻量级全MLP解码头架构。
下载量 13.13k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SegFormer是一种基于Transformer的语义分割模型,适用于图像分割任务,在ADE20K和Cityscapes等语义分割基准测试中表现优异。

模型特点

高效设计
采用分层式Transformer编码器与轻量级全MLP解码头架构,实现简洁高效的语义分割。
高性能
在ADE20K和Cityscapes等语义分割基准测试中表现优异。
预训练+微调
分层Transformer首先在ImageNet-1k上进行预训练,随后添加解码头并在下游数据集上联合微调。

模型能力

图像语义分割
场景解析

使用案例

计算机视觉
房屋场景解析
对房屋图像进行语义分割,识别不同物体和区域。
城堡场景解析
对城堡图像进行语义分割,识别不同建筑结构和环境元素。