DUSt3R开源模型 - 免费实现几何3D视觉，轻松从图像重建3D场景

首页

Dust3r ViTLarge BaseDecoder 512 Dpt

由 naver 开发

DUSt3R是一个用于从图像轻松实现几何3D视觉的模型，能够从单张或多张图像重建3D场景。

3D视觉

Safetensors

#图像转3D #几何重建 #多视角融合

下载量 46.93k

发布时间 : 6/24/2024

模型简介

DUSt3R是一个基于深度学习的3D视觉模型，专注于从2D图像中重建3D几何结构。它采用了非对称的CroCo3DStereo架构，结合ViT-Large编码器和ViT-Base解码器，能够高效处理不同分辨率的输入图像。

模型特点

多分辨率支持

支持多种输入分辨率(512x384, 512x336等)，适应不同场景需求

高效3D重建

从单张或多张图像快速重建3D场景几何结构

先进架构

结合ViT-Large编码器和ViT-Base解码器的非对称CroCo3DStereo架构

模型能力

单图像3D重建

多视图3D重建

深度估计

点云生成

使用案例

计算机视觉

场景重建

从单张或多张照片重建室内外场景的3D模型

生成可用于AR/VR应用的3D场景

物体建模

从物体照片生成3D模型

可用于3D打印或数字内容创作

增强现实

AR场景理解

为AR应用提供场景的3D几何信息

增强AR对象的真实感和交互性

🚀 DUSt3R：轻松实现几何3D视觉

DUSt3R是一个致力于让几何3D视觉变得简单的项目，它提供了相关模型及代码，能助力开发者在3D视觉领域开展工作。

🚀 快速开始

若要使用DUSt3R，首先需要安装dust3r，然后可以按照以下步骤加载模型：

from dust3r.model import AsymmetricCroCo3DStereo
import torch

model = AsymmetricCroCo3DStereo.from_pretrained("naver/DUSt3R_ViTLarge_BaseDecoder_512_dpt")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

✨ 主要特性

提供了从图像到3D的转换能力。
支持多种训练分辨率，能适应不同的应用场景。

📦 安装指南

请参考安装说明进行安装。

💻 使用示例

基础用法

from dust3r.model import AsymmetricCroCo3DStereo
import torch

model = AsymmetricCroCo3DStereo.from_pretrained("naver/DUSt3R_ViTLarge_BaseDecoder_512_dpt")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

📚 详细文档

模型信息

Github页面：https://github.com/naver/dust3r/
项目页面：https://dust3r.europe.naverlabs.com/

属性	详情
模型名称	DUSt3R_ViTLarge_BaseDecoder_512_dpt
训练分辨率	512x384, 512x336, 512x288, 512x256, 512x160
头部	DPT
编码器	ViT - L
解码器	ViT - B

BibTeX引用

@inproceedings{dust3r_cvpr24,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      booktitle = {CVPR},
      year = {2024}
}

@misc{dust3r_arxiv23,
      title={DUSt3R: Geometric 3D Vision Made Easy}, 
      author={Shuzhe Wang and Vincent Leroy and Yohann Cabon and Boris Chidlovskii and Jerome Revaud},
      year={2023},
      eprint={2312.14132},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2312.14132}, 
}