M

Mit B4

由 nvidia 开发
基于ImageNet-1k微调的SegFormer编码器,采用分层式Transformer架构,适用于语义分割任务
下载量 3,573
发布时间 : 3/2/2022

模型简介

SegFormer是一个基于Transformer的语义分割模型,采用分层式编码器和轻量级全MLP解码头设计。本版本仅包含预训练的编码器部分,可用于下游任务的微调。

模型特点

分层Transformer架构
采用分层式Transformer编码器,能有效捕获多尺度特征
轻量级设计
结合轻量级全MLP解码头,在保持性能的同时降低计算复杂度
预训练编码器
提供在ImageNet-1k上预训练的编码器,便于下游任务微调

模型能力

图像语义分割
多尺度特征提取

使用案例

计算机视觉
场景理解
用于ADE20K等场景解析数据集的语义分割
在ADE20K和Cityscapes等基准测试中表现优异
物体识别
识别和分割图像中的特定物体
AIbase
智启未来,您的人工智能解决方案智库
简体中文