D

Dpt Beit Base 384

由 Intel 开发
DPT是基于BEiT骨干网络的密集预测变换器模型,用于单目深度估计,在140万张图像上训练。
下载量 25.98k
发布时间 : 11/28/2023
模型介绍
内容详情
替代品

模型简介

该模型是一种视觉变换器架构,专门用于从单张图像预测深度信息。它采用BEiT作为骨干网络,并添加了深度估计专用头部结构。

模型特点

基于BEiT骨干网络
利用BEiT预训练模型的强大特征提取能力
零样本深度估计
无需针对特定场景进行微调即可进行深度预测
高分辨率输出
能够生成与输入图像分辨率相匹配的深度图

模型能力

单目深度估计
图像深度预测
3D场景理解

使用案例

计算机视觉
3D场景重建
从单张图像重建3D场景深度信息
生成与输入图像分辨率相同的深度图
增强现实
为AR应用提供场景深度信息
机器人导航
为自主移动机器人提供环境深度感知