R

Reasongen R1

由 Franklin0 开发
ReasonGen-R1是一个融合思维链推理的自回归图像生成模型,通过SFT和RL提升图像生成的逻辑性和质量。
下载量 142
发布时间 : 5/27/2025

模型简介

ReasonGen-R1是一个两阶段的框架,首先通过有监督微调(SFT)赋予模型基于文本的显式'思考'能力,然后使用组相对策略优化(GRPO)来优化其输出。该模型在生成图像前能通过文本进行推理,实现对对象布局、风格和场景组合的可控规划。

模型特点

思维链推理
通过文本推理显式规划图像生成,提升逻辑性和可控性
两阶段训练框架
先进行有监督微调(SFT)学习推理能力,再通过强化学习(RL)优化生成质量
组相对策略优化(GRPO)
使用预训练视觉-语言模型的奖励信号评估和优化生成质量
可控图像生成
能对对象布局、风格和场景组合进行精确规划和控制

模型能力

文本到图像生成
基于推理的图像规划
可控图像合成
多风格图像生成

使用案例

创意设计
概念艺术生成
根据详细文本描述生成高质量概念艺术作品
生成符合逻辑且细节丰富的概念图
广告设计
根据产品描述自动生成广告图像
风格一致且符合营销需求的广告图
教育
教学材料生成
根据课程内容自动生成插图
准确表达抽象概念的视觉材料
AIbase
智启未来,您的人工智能解决方案智库
简体中文