D

Dust3r ViTLarge BaseDecoder 512 Linear

由 naver 开发
DUSt3R是一个用于从图像生成3D几何模型的深度学习模型,能够轻松实现几何3D视觉任务。
下载量 313
发布时间 : 6/21/2024
模型介绍
内容详情
替代品

模型简介

DUSt3R是一个基于ViT架构的深度学习模型,专注于从2D图像生成3D几何结构。它采用非对称CroCo3DStereo架构,能够处理不同分辨率的输入图像。

模型特点

多分辨率支持
支持多种输入分辨率(512x384到512x160),适应不同场景需求
高效3D重建
能够从单张或多张2D图像快速重建3D几何结构
混合ViT架构
结合ViT-Large编码器和ViT-Base解码器,平衡性能和效率

模型能力

单图像3D重建
多视图3D重建
几何结构估计
深度估计

使用案例

计算机视觉
场景重建
从单张或多张照片重建室内外场景的3D几何结构
可生成场景的3D点云或网格表示
物体建模
从物体照片生成3D模型
可用于AR/VR内容创建或3D打印
机器人视觉
环境感知
为机器人提供环境的3D几何理解
支持机器人导航和避障