D

Dpt Large Ade20k

由 smp-hub 开发
基于Transformer架构的语义分割模型,专为ADE20K数据集优化
下载量 279
发布时间 : 4/6/2025
模型介绍
内容详情
替代品

模型简介

DPT是一种基于Transformer的语义分割模型,采用Vision Transformer作为编码器,能够高效处理高分辨率图像分割任务。该模型在ADE20K数据集上预训练,适用于场景理解任务。

模型特点

基于Transformer的架构
采用Vision Transformer作为编码器,能够捕获长距离依赖关系
动态图像尺寸支持
支持处理不同尺寸的输入图像
预训练权重
在ADE20K数据集上预训练,可直接用于下游任务

模型能力

图像语义分割
场景理解
像素级分类

使用案例

计算机视觉
场景解析
对复杂场景中的各个元素进行像素级分类
可识别150个不同类别的物体和区域
自动驾驶环境感知
解析道路场景中的各种元素