M

Mit B0

由 nvidia 开发
SegFormer是一个基于Transformer的语义分割模型,采用分层编码器和轻量级MLP解码头设计,在ADE20K和Cityscapes等基准测试中表现优异。
下载量 83.99k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是SegFormer的分层Transformer编码器部分,基于ImageNet-1k预训练,可用于下游语义分割任务的微调。

模型特点

分层Transformer架构
采用分层设计的Transformer编码器,能有效捕获多尺度特征
轻量级MLP解码头
配合轻量级全MLP解码头,实现高效的语义分割
ImageNet预训练
编码器在ImageNet-1k数据集上预训练,具有强大的特征提取能力

模型能力

图像特征提取
语义分割任务微调

使用案例

计算机视觉
场景理解
用于ADE20K等场景解析数据集的语义分割
城市场景分析
在Cityscapes数据集上进行道路、建筑物等城市场景元素的分割