D

Dust3r ViTLarge BaseDecoder 512 Dpt

由 naver 开发
DUSt3R是一个用于从图像轻松实现几何3D视觉的模型,能够从单张或多张图像重建3D场景。
下载量 46.93k
发布时间 : 6/24/2024
模型介绍
内容详情
替代品

模型简介

DUSt3R是一个基于深度学习的3D视觉模型,专注于从2D图像中重建3D几何结构。它采用了非对称的CroCo3DStereo架构,结合ViT-Large编码器和ViT-Base解码器,能够高效处理不同分辨率的输入图像。

模型特点

多分辨率支持
支持多种输入分辨率(512x384, 512x336等),适应不同场景需求
高效3D重建
从单张或多张图像快速重建3D场景几何结构
先进架构
结合ViT-Large编码器和ViT-Base解码器的非对称CroCo3DStereo架构

模型能力

单图像3D重建
多视图3D重建
深度估计
点云生成

使用案例

计算机视觉
场景重建
从单张或多张照片重建室内外场景的3D模型
生成可用于AR/VR应用的3D场景
物体建模
从物体照片生成3D模型
可用于3D打印或数字内容创作
增强现实
AR场景理解
为AR应用提供场景的3D几何信息
增强AR对象的真实感和交互性