开源Lotus-depth-g-v2-0-disparity模型 - 实现高质量深度估计和稳定视频深度预测

首页

Lotus Depth G V2 0 Disparity

由 jingheya 开发

Lotus是一个基于扩散模型的视觉基础模型，专注于高质量密集预测任务，如深度估计。相比前一版本，本模型在视差空间（逆深度）进行训练，实现了更优性能和更稳定的视频深度估计。

3D视觉开源协议:Apache-2.0 #视频深度估计 #逆深度训练 #扩散模型

下载量 182

发布时间 : 11/13/2024

模型简介

Lotus是一个官方模型系列，专注于深度估计任务。通过扩散模型架构，在视差空间进行训练，提供高质量的密集预测结果。

模型特点

视差空间训练

在逆深度空间进行训练，相比传统深度空间训练，实现了更优的性能和更稳定的视频深度估计结果。

高质量密集预测

能够生成高质量的密集预测结果，适用于各种复杂场景。

视频深度估计

特别优化了视频深度估计的稳定性，适合连续帧处理。

模型能力

单图像深度估计

视频深度估计

密集预测

使用案例

计算机视觉

3D场景重建

从单张图像或视频序列中估计深度信息，用于3D场景重建。

高质量深度图，可用于精确的3D建模

增强现实

为AR应用提供实时深度信息，增强虚拟物体的真实感。

稳定的视频深度估计，提高AR体验质量

自动驾驶

环境感知

帮助自动驾驶系统理解周围环境的3D结构。

准确的深度估计，提高环境感知能力

属性	详情
库名称	diffusers
模型类型	深度估计
许可证	Apache-2.0

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Lotus Depth G V2 0 Disparity

模型简介

模型特点

模型能力

使用案例

🚀 Lotus：基于扩散的视觉基础模型，用于高质量密集预测

开发者信息

🚀 快速开始

💻 使用示例

基础用法

📄 许可证