M

Mit B2

由 nvidia 开发
SegFormer是一个基于Transformer的语义分割模型,其编码器在Imagenet-1k上进行了微调。
下载量 13.86k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SegFormer由分层Transformer编码器和轻量级全MLP解码头组成,专注于语义分割任务。本版本仅包含预训练的分层Transformer,可用于微调目的。

模型特点

分层Transformer架构
采用分层设计的Transformer编码器,能有效处理不同尺度的视觉特征
轻量级MLP解码头
配合轻量级全MLP解码头,在保持高效的同时实现优异的语义分割性能
ImageNet预训练
编码器在ImageNet-1k数据集上进行了预训练,提供良好的特征提取基础

模型能力

图像语义分割
视觉特征提取
下游任务微调

使用案例

计算机视觉
场景理解
对ADE20K等场景数据集进行语义分割
在ADE20K和Cityscapes等基准测试中表现优异
图像分析
提取图像中的物体和区域信息