J

Janus Pro 1B

由 deepseek-community 开发
Janus-Pro是一种新颖的自回归框架,统一了多模态理解和生成任务,通过解耦视觉编码增强灵活性。
下载量 4,636
发布时间 : 3/1/2025

模型简介

Janus-Pro是一个统一的多模态理解和生成模型,通过解耦视觉编码解决了以往方法的局限性,性能与特定任务模型相当甚至更优。

模型特点

统一多模态理解和生成
将多模态理解和生成任务统一在一个框架内,解决了以往方法的局限性。
解耦视觉编码
通过解耦视觉编码缓解了视觉编码器在理解和生成任务中的角色冲突,增强了框架的灵活性。
高性能
性能与特定任务模型相当甚至更优,超越了以往的统一模型。

模型能力

多模态理解
图像生成
文本生成

使用案例

视觉理解
图像内容描述
根据输入图像生成描述性文本
能够准确描述图像内容
图像生成
文本到图像生成
根据文本提示生成图像
生成符合文本描述的图像
AIbase
智启未来,您的人工智能解决方案智库
简体中文