M

Mit B1

由 nvidia 开发
SegFormer是一个基于Transformer架构的语义分割模型,采用分层编码器和轻量级MLP解码头设计。
下载量 7,305
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是SegFormer的预训练编码器部分,基于ImageNet-1k微调,适用于语义分割任务的迁移学习。

模型特点

分层Transformer架构
采用多尺度特征提取的分层设计,能有效捕捉不同层次的视觉特征
轻量级MLP解码头
相比传统卷积解码器,计算效率更高且参数量更少
ImageNet预训练
编码器在ImageNet-1k上预训练,具有强大的特征提取能力

模型能力

图像语义分割
视觉特征提取
迁移学习

使用案例

计算机视觉
场景理解
对室内外场景进行像素级语义分割
在ADE20K和Cityscapes等基准测试表现优异
自动驾驶
道路场景解析和物体识别