🚀 索莫夫的狂欢节风格LoRA模型
本项目是一个用于图像生成的低秩适配器(LoRA)模型,它基于FLUX系列模型进行微调,能够生成具有康斯坦丁·索莫夫(Konstantin Somov)风格的艺术作品。该模型受到18世纪梦幻般的玩具月光、皮埃罗的蕾丝泪滴、 Columbina的绸缎喘息和丑角的天鹅绒舞步等元素的启发,为用户带来独特的艺术体验。
🚀 快速开始
依赖安装
你可以使用以下代码加载模型并生成图像:
from diffusers import AutoPipelineForText2Image
import torch
pipeline = AutoPipelineForText2Image.from_pretrained('black-forest-labs/FLUX.1-dev', torch_dtype=torch.float16).to('cuda')
pipeline.load_lora_weights('AlekseyCalvin/Somov_Carnivalesques_V1_FluxLoRA_BySilverAgePoets')
image = pipeline('your prompt').images[0]
提示词示例
在生成图像时,你可以使用以下提示词:
Somov style art, artwork by Konstantin Somov, detailed carnivalesque illustration
示例输出

✨ 主要特性
- 独特艺术风格:该模型能够生成具有康斯坦丁·索莫夫风格的艺术作品,展现出18世纪狂欢节的独特魅力。
- 多版本支持:提供了两种不同的检查点版本(Variant I和Variant II),用户可以根据自己的需求进行选择。
- 灵活的提示词:用户可以通过调整提示词来生成不同主题和风格的图像。
📦 安装指南
环境要求
- Python 3.6+
- PyTorch 1.7+
- diffusers库
安装步骤
- 安装必要的库:
pip install diffusers torch
- 按照快速开始部分的代码加载模型。
💻 使用示例
基础用法
from diffusers import AutoPipelineForText2Image
import torch
pipeline = AutoPipelineForText2Image.from_pretrained('black-forest-labs/FLUX.1-dev', torch_dtype=torch.float16).to('cuda')
pipeline.load_lora_weights('AlekseyCalvin/Somov_Carnivalesques_V1_FluxLoRA_BySilverAgePoets')
prompt = 'Somov style art, artwork by Konstantin Somov, detailed carnivalesque illustration'
image = pipeline(prompt).images[0]
image.save('output.png')
高级用法
你可以尝试不同的提示词来生成不同风格的图像,例如:
prompt = 'Somov style art, artwork by Konstantin Somov, detailed carnivalesque illustration of Arthur Rimbaud, the revolutionary blonde messy haired teenage trans man poet delivering a lecture to parlor book club group of revolutionary poet cat-person hermaphrodite angels circa the 1870s'
image = pipeline(prompt).images[0]
image.save('advanced_output.png')
📚 详细文档
模型版本说明
超参数说明
该模型在大约130张图像上进行微调,这些图像从我们整理的300多张索莫夫艺术文件中挑选出来,并经过手动预处理和修复。在微调过程中,我们使用了以下超参数:
属性 |
详情 |
模型类型 |
低秩适配器(LoRA) |
训练数据 |
约130张受康斯坦丁·索莫夫启发的艺术作品 |
维度 |
64dim |
Alpha值 |
128alpha(Variant I);64alpha(Variant II) |
优化器 |
Adamw8bit |
学习率 |
0.0005 |
EMA |
无 |
时间步长 |
线性时间步长(FALSE) |
配置 |
FluxCFG |
分辨率 |
768 |
批次大小 |
1 |
训练设备 |
单个L4(通过Google Colab Pro) |
由于数据集的大小,我们不得不将分辨率限制为768,因为即使是1024的分辨率也会导致内存不足错误,有时在训练的早期阶段就会出现这种情况。
🔧 技术细节
该模型是一个基于FLUX系列的低秩适配器(LoRA),通过微调来学习康斯坦丁·索莫夫的艺术风格。在微调过程中,我们使用了特定的基础模型和CLIP模型,并对不同版本的检查点进行了不同的超参数设置。具体来说,我们在大约130张经过精心挑选和预处理的艺术作品上进行训练,以确保模型能够学习到索莫夫风格的细节和特点。
📄 许可证
本项目采用Apache-2.0许可证。