L

Ldm3d 4c

由 Intel 开发
LDM3D是一个能从文本提示生成图像和深度图数据的潜在扩散模型,支持3D内容创作
下载量 1,086
发布时间 : 6/22/2023
模型介绍
内容详情
替代品

模型简介

基于潜在扩散框架的3D生成模型,可同时输出RGB图像和深度图,应用于数字内容创作领域

模型特点

双模态输出
同时生成RGB图像和对应深度图,支持3D内容构建
高质量生成
在FID(27.82)和CLIP(26.61)等指标上表现优异
深度感知
深度图生成绝对相对误差仅0.0911,精度较高

模型能力

文本到图像生成
深度图预测
3D场景构建
多模态输出

使用案例

数字娱乐
游戏场景生成
根据文本描述自动生成游戏场景的RGB和深度信息
可快速构建3D游戏素材
建筑设计
建筑可视化
通过文本描述生成建筑效果图及深度信息
支持360度视图应用开发