J

Janusflow 1.3B

由 deepseek-ai 开发
JanusFlow是一个强大的框架,将图像理解与生成统一在单一模型中,采用自回归语言模型与修正流相结合的方法。
下载量 1,538
发布时间 : 11/12/2024
模型介绍
内容详情
替代品

模型简介

JanusFlow是一个统一的多模态大语言模型,支持图像理解和生成任务,基于DeepSeek-LLM-1.3b-base构建,结合了SigLIP-L视觉编码器和SDXL-VAE生成器。

模型特点

统一的多模态理解与生成
将图像理解与生成统一在单一模型中,简化了多模态任务的流程。
极简架构
采用自回归语言模型与修正流相结合的方法,无需复杂的架构修改。
高分辨率支持
支持384×384分辨率的图像输入和生成。

模型能力

图像理解
文本生成图像
多模态任务处理

使用案例

图像生成
文本到图像生成
根据文本描述生成高质量的图像。
生成384×384分辨率的图像。
多模态理解
图像理解
理解输入的图像内容并生成相关描述或回答。