VFusion3D开源3D生成模型 - 利用少量数据实现高效3D生成与重建

首页

Vfusion3d

由 facebook 开发

VFusion3D是一个通过少量3D数据与大量合成多视角数据训练的大型前馈式3D生成模型，是首个研究可扩展3D生成/重建模型的工作。

3D视觉

Transformers

#视频转3D生成 #多视角合成 #3D基础模型

下载量 57

发布时间 : 8/10/2024

模型简介

基于视频扩散模型的可扩展3D生成模型，用于3D生成和重建任务。

模型特点

可扩展3D生成

通过少量3D数据与大量合成多视角数据训练，实现可扩展的3D生成

前馈式架构

采用前馈式架构，相比传统方法更高效

视频扩散模型基础

基于视频扩散模型构建，充分利用时序信息

模型能力

3D模型生成

3D重建

多视角合成

使用案例

3D内容创作

3D资产生成

从单张图像生成3D模型

可生成高质量3D模型

虚拟现实

VR场景构建

快速生成3D场景元素

加速VR内容开发流程

🚀 [ECCV 2024] VFusion3D：从视频扩散模型中学习可扩展的3D生成模型

VFusion3D是一个大型前馈3D生成模型，它使用少量3D数据和大量合成多视图数据进行训练。该工作首次探索了可扩展的3D生成/重建模型，是迈向3D基础模型的重要一步。

项目页面，论文链接

VFusion3D：从视频扩散模型中学习可扩展的3D生成模型
 韩俊霖，菲利普斯·科基诺斯，菲利普·托尔
GenAI，Meta和牛津大学TVG实验室
欧洲计算机视觉会议 (ECCV)，2024

🚀 快速开始

使用VFusion3D非常简单！🤗 以下是如何在Hugging Face上使用该模型的步骤：

📦 安装依赖（可选）

根据你的需求，你可能需要启用特定功能，如网格生成或视频渲染。我们提供了以下额外的包来满足这些需求：

!pip --quiet install imageio[ffmpeg] PyMCubes trimesh rembg[gpu,cli] kiui

💻 直接加载模型

import torch
from transformers import AutoModel, AutoProcessor

# 加载模型和处理器
model = AutoModel.from_pretrained("jadechoghari/vfusion3d", trust_remote_code=True)
processor = AutoProcessor.from_pretrained("jadechoghari/vfusion3d")

# 下载并预处理图像
import requests
from PIL import Image
from io import BytesIO

image_url = 'https://sm.ign.com/ign_nordic/cover/a/avatar-gen/avatar-generations_prsz.jpg'
response = requests.get(image_url)
image = Image.open(BytesIO(response.content))

# 预处理图像并获取源相机信息
image, source_camera = processor(image)

# 生成平面（默认输出）
output_planes = model(image, source_camera)
print("平面形状:", output_planes.shape)

# 生成3D网格
output_planes, mesh_path = model(image, source_camera, export_mesh=True)
print("平面形状:", output_planes.shape)
print("网格保存路径:", mesh_path)

# 生成视频
output_planes, video_path = model(image, source_camera, export_video=True)
print("平面形状:", output_planes.shape)
print("视频保存路径:", video_path)

默认（平面）：默认情况下，VFusion3D输出平面，非常适合进一步的3D操作。
导出网格：如果你需要3D网格，只需将export_mesh设置为True，你将得到一个.obj文件。你还可以通过调整mesh_size参数来自定义网格分辨率。
导出视频：如果你想要一个3D视频，将export_video设置为True，你将获得一个从多个角度渲染的精美视频。你可以调整render_size和fps来优化视频效果。

查看我们的演示应用，看看VFusion3D的实际效果！🤗

✨ 主要特性

🔍 最新消息

[2024年8月8日] Hugging Face演示已上线，非常感谢Jade Choghari的帮助。
[2024年7月25日] 发布VFusion3D的权重和推理代码。

📊 结果与比较

3D生成结果

用户研究结果

🔗 致谢

VFusion3D的推理代码大量借鉴了OpenLRM。

📖 引用

如果你觉得这项工作有用，请引用我们：

@article{han2024vfusion3d,
  title={VFusion3D: Learning Scalable 3D Generative Models from Video Diffusion Models},
  author={Junlin Han and Filippos Kokkinos and Philip Torr},
  journal={European Conference on Computer Vision (ECCV)},
  year={2024}
}