D

Dpt Swinv2 Large 384

由 Intel 开发
基于SwinV2骨干网络的DPT模型,用于单目深度估计,在140万张图像上训练
下载量 84
发布时间 : 12/10/2023
模型介绍
内容详情
替代品

模型简介

该模型是MiDaS 3.1版本中的DPT(密集预测变换器)模型,专门用于从单张图像估计深度信息。它采用了SwinV2架构作为骨干网络,适用于生成式AI、3D重建和自动驾驶等应用场景。

模型特点

基于SwinV2骨干网络
采用分层变换器架构,通过移位窗口计算提高效率,适合处理视觉任务
大规模训练数据
在140万张图像上进行训练,涵盖多样化的场景
零样本迁移能力
支持零样本深度估计,无需针对特定场景进行微调

模型能力

单目深度估计
零样本迁移
图像深度分析

使用案例

计算机视觉
3D场景重建
从单张图像生成深度信息,用于3D场景建模
可生成详细的深度图
自动驾驶
为自动驾驶系统提供环境深度感知
辅助车辆感知周围环境
增强现实
为AR应用提供场景深度信息
实现更真实的虚拟物体叠加