Depth-Anything-V2-Small开源单目深度估计模型 - 捕捉精细细节，性能强且更鲁棒

首页

Depth Anything V2 Small

由 depth-anything 开发

Depth Anything V2 是目前性能最强的单目深度估计模型，基于大规模合成与真实图像训练，相比V1版本能捕捉更精细的细节且更鲁棒。

3D视觉英语开源协议:Apache-2.0 #单目深度估计 #精细细节捕捉 #高效轻量化

下载量 55.22k

发布时间 : 6/13/2024

模型简介

高性能单目深度估计模型，适用于从单张图像预测深度信息

模型特点

精细细节捕捉

相比V1版本能捕捉更精细的深度细节

高鲁棒性

比V1版本及基于SD的模型（如Marigold、Geowizard）更鲁棒

高效轻量

比基于SD的模型效率更高（快10倍）且更轻量化

大规模训练数据

基于59.5万张合成标注图像与6200万+真实无标注图像训练

模型能力

单目深度估计

图像深度预测

3D场景理解

使用案例

计算机视觉

3D场景重建

从单张图像重建3D场景

可获得精确的相对深度信息

增强现实

为AR应用提供场景深度信息

实现更真实的虚拟物体叠加

机器人视觉

自主导航

为机器人提供环境深度感知

支持避障和路径规划

属性	详情
模型类型	单目深度估计（MDE）模型
训练数据	595K合成标注图像和62M+真实未标注图像

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Depth Anything V2 Small

模型简介

模型特点

模型能力

使用案例

🚀 Depth-Anything-V2-Small

🚀 快速开始

安装

使用

✨ 主要特性

📄 许可证

📚 详细文档

引用