J

Janus Pro 1B

由 deepseek-ai 开发
Janus-Pro 是一种新颖的自回归框架,统一了多模态理解与生成能力。通过解耦视觉编码路径,使用单一 Transformer 架构处理多模态任务。
下载量 34.02k
发布时间 : 1/26/2025
模型介绍
内容详情
替代品

模型简介

Janus-Pro 是一个统一多模态理解和生成的模型,通过分离视觉编码设计,解决了理解与生成角色间的冲突,具有高灵活性和高效性。

模型特点

解耦视觉编码
将视觉编码解耦为独立路径,缓解理解与生成角色间的冲突,增强模型灵活性。
统一架构
使用单一 Transformer 架构处理多模态任务,简化模型设计。
高性能
超越之前的统一模型,达到或超过专用任务模型的性能。

模型能力

多模态理解
文本到图像生成
视觉问答
图像描述生成

使用案例

内容生成
图像生成
根据文本描述生成高质量图像。
支持 16 倍降采样率,生成细节丰富的图像。
视觉理解
图像分析
理解图像内容并回答相关问题。
支持 384 x 384 分辨率图像输入。