D

Dpt Beit Large 512

由 Intel 开发
基于BEiT Transformer的单目深度估计模型,能够从单张图像推断精细深度信息
下载量 2,794
发布时间 : 11/28/2023
模型介绍
内容详情
替代品

模型简介

该DPT模型以BEiT模型为骨干网络,顶部添加颈部与头部结构实现单目深度估计,应用于生成式AI、三维重建和自动驾驶等领域。

模型特点

高质量深度估计
使用BEiT Transformer可获得最高质量的深度估计结果
多分辨率支持
提供BEiT512-L、BEiT384-L和BEiT384-B等变体,支持不同训练分辨率
零样本迁移能力
具备零样本迁移能力,指标值为10.82

模型能力

单目深度估计
图像深度信息推断
零样本迁移

使用案例

计算机视觉
三维重建
从单张图像推断深度信息用于三维场景重建
自动驾驶
为自动驾驶系统提供环境深度感知
生成式AI
为生成式AI模型提供深度信息输入