A

Ade20k Panoptic Eomt Large 640

由 tue-mps 开发
该论文提出了一种将Vision Transformer (ViT) 重新解释为图像分割模型的方法,展示了ViT在图像分割任务中的潜力。
下载量 105
发布时间 : 3/26/2025
模型介绍
内容详情
替代品

模型简介

该模型通过重新设计ViT架构,使其能够有效执行图像分割任务,扩展了ViT的应用范围。

模型特点

ViT架构创新应用
将原本用于图像分类的ViT架构创新性地应用于图像分割任务
高效分割能力
展示了Transformer架构在像素级预测任务中的有效性

模型能力

图像分割
像素级预测
语义分割

使用案例

计算机视觉
医学图像分析
用于医学图像中的器官或病变区域分割
自动驾驶场景理解
用于道路场景中的物体分割和识别