D

Dpt Beit Large 384

由 Intel 开发
基于BEiT骨干网络的单目深度估计模型,能够从单张图像推断详细深度信息
下载量 135
发布时间 : 11/28/2023
模型介绍
内容详情
替代品

模型简介

该DPT模型使用BEiT模型作为骨干网络,并在顶部添加了用于单目深度估计的颈部结构和头部。主要用于从单张图像或单一视角推断详细深度信息。

模型特点

BEiT骨干网络
使用BEiT Transformer作为骨干网络,可实现最高质量的深度估计
零样本迁移
支持零样本深度估计,无需针对特定场景进行微调
多分辨率支持
提供384x384和512x512等多种训练分辨率版本

模型能力

单目深度估计
图像深度图生成
零样本迁移学习

使用案例

计算机视觉
3D重建
从单张图像生成深度信息用于3D场景重建
自动驾驶
为自动驾驶系统提供环境深度感知
增强现实
为AR应用提供场景深度信息