M

Mit B3

由 nvidia 开发
基于ImageNet-1k微调的SegFormer编码器,采用分层Transformer架构,适用于语义分割任务。
下载量 7,136
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

SegFormer是一种基于Transformer的语义分割模型,具有简洁高效的设计。本模型仅包含预训练的分层Transformer编码器,可用于下游任务微调。

模型特点

分层Transformer架构
采用分层Transformer编码器,能够有效处理不同尺度的视觉特征。
轻量级MLP解码头
配合轻量级全MLP解码头架构,在保持性能的同时减少计算复杂度。
ImageNet-1k预训练
编码器已在ImageNet-1k数据集上进行预训练,具备良好的特征提取能力。

模型能力

图像特征提取
语义分割
视觉任务微调

使用案例

计算机视觉
场景理解
可用于ADE20K等场景理解数据集的语义分割任务。
城市景观分析
适用于Cityscapes等城市景观数据集的语义分割。