DPT

D

DPT

由 vedantdalimkar 开发

基于PyTorch的图像分割模型，采用Transformer架构进行密集预测任务

开源协议:MIT #ViT编码器 #高分辨率分割 #语义分割

下载量 92

发布时间 : 3/22/2025

模型简介

DPT是基于Vision Transformer架构的图像语义分割模型，适用于各种密集预测任务。该模型通过segmentation_models.pytorch库提供，支持多种预训练编码器和自定义配置。

模型特点

Transformer架构

采用Vision Transformer作为编码器，适用于图像分割任务

灵活配置

支持多种编码器深度、特征维度和输出步长等参数配置

预训练支持

可与预训练权重配合使用，提升模型性能

模型能力

图像语义分割

密集预测

支持多种输入分辨率

使用案例

计算机视觉

场景理解

对复杂场景进行像素级语义分割

医学图像分析

医学图像中的器官或病变区域分割

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24