开源DUSt3R模型 - 轻松从图像生成3D几何模型，搞定3D视觉任务

首页

Dust3r ViTLarge BaseDecoder 512 Linear

由 naver 开发

DUSt3R是一个用于从图像生成3D几何模型的深度学习模型，能够轻松实现几何3D视觉任务。

3D视觉

Safetensors

#图像转3D #几何重建 #多视角融合

下载量 313

发布时间 : 6/21/2024

模型简介

DUSt3R是一个基于ViT架构的深度学习模型，专注于从2D图像生成3D几何结构。它采用非对称CroCo3DStereo架构，能够处理不同分辨率的输入图像。

模型特点

多分辨率支持

支持多种输入分辨率(512x384到512x160)，适应不同场景需求

高效3D重建

能够从单张或多张2D图像快速重建3D几何结构

混合ViT架构

结合ViT-Large编码器和ViT-Base解码器，平衡性能和效率

模型能力

单图像3D重建

多视图3D重建

几何结构估计

深度估计

使用案例

计算机视觉

场景重建

从单张或多张照片重建室内外场景的3D几何结构

可生成场景的3D点云或网格表示

物体建模

从物体照片生成3D模型

可用于AR/VR内容创建或3D打印

机器人视觉

环境感知

为机器人提供环境的3D几何理解

支持机器人导航和避障

🚀 DUSt3R：让几何3D视觉变得简单

DUSt3R是一个致力于简化几何3D视觉的项目，它提供了便捷的模型使用方式，能帮助开发者更轻松地开展相关工作。

🚀 快速开始

首先，你需要安装dust3r。然后，按照以下代码加载模型：

from dust3r.model import AsymmetricCroCo3DStereo
import torch

model = AsymmetricCroCo3DStereo.from_pretrained("naver/DUSt3R_ViTLarge_BaseDecoder_512_linear")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

✨ 主要特性

提供了便捷的图像到3D转换功能。
支持多种训练分辨率，适应不同的应用场景。

📦 安装指南

请参考安装说明进行安装。

💻 使用示例

基础用法

from dust3r.model import AsymmetricCroCo3DStereo
import torch

model = AsymmetricCroCo3DStereo.from_pretrained("naver/DUSt3R_ViTLarge_BaseDecoder_512_linear")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

📚 详细文档

GitHub页面：https://github.com/naver/dust3r/
项目页面：https://dust3r.europe.naverlabs.com/

模型信息

属性	详情
模型名称	DUSt3R_ViTLarge_BaseDecoder_512_linear
训练分辨率	512x384, 512x336, 512x288, 512x256, 512x160
头部	Linear
编码器	ViT-L
解码器	ViT-B

🔧 技术细节

该项目的相关论文信息如下：

@inproceedings{dust3r_cvpr24,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      booktitle = {CVPR},
      year = {2024}
}

@misc{dust3r_arxiv23,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      year={2023},
      eprint={2312.14132},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2312.14132}, 
}