D

Dpt Large Ade

由 Intel 开发
这是一个基于ADE20k数据集微调的密集预测变换器(DPT)模型,用于语义分割任务。
下载量 3,497
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用视觉变换器(ViT)作为主干网络,并在其基础上添加了用于语义分割的颈部结构和头部结构,能够对输入图像进行高质量的语义分割。

模型特点

高性能语义分割
在ADE20K数据集上达到了49.02%的mIoU,创造了新的最先进水平。
基于视觉变换器
使用视觉变换器(ViT)作为主干网络,结合密集预测变换器(DPT)架构,提供高质量的分割结果。
可微调性
该架构可以在较小的数据集上进行微调,并在这些数据集上也达到了新的最先进水平。

模型能力

图像语义分割
高分辨率图像处理
多类别物体识别

使用案例

计算机视觉
场景解析
用于解析复杂场景中的各种物体和背景,适用于自动驾驶、机器人导航等应用。
在ADE20K数据集上达到49.02%的mIoU。
图像编辑
可用于图像编辑工具中,帮助用户快速分离图像中的不同元素。