G

Gligen Inpainting Text Image

由 anhnct 开发
GLIGEN是一种基于扩散的接地文本到图像生成模型,能够根据文本提示、边界框和参考图像生成逼真图像。
下载量 108
发布时间 : 8/23/2023
模型介绍
内容详情
替代品

模型简介

该模型可以根据文本提示、边界框和参考图像生成图像,支持在指定区域内插入新对象或风格,无需额外微调。

模型特点

开放集接地生成
支持根据文本提示和边界框在指定区域内生成或插入对象,无需额外微调。
多模态输入
支持文本、边界框和参考图像作为输入,灵活控制生成内容。
高质量生成
基于扩散模型和CLIP ViT-L/14文本编码器,生成逼真图像。

模型能力

文本生成图像
图像编辑
对象插入

使用案例

艺术创作
艺术作品生成
根据文本提示生成艺术作品,用于设计或创意过程。
生成符合描述的艺术图像
教育工具
教学辅助
生成教学用图像,帮助学生理解抽象概念。
生成直观的教学图像
研究
生成模型研究
探索和理解生成模型的局限性和偏见。
提供研究数据和案例