Flux Super Portrait LoRA
基于FLUX.1-dev的文本生成图像LoRA模型,专注于生成高质量人物肖像
下载量 330
发布时间 : 12/6/2024
模型简介
该模型是基于扩散模型的LoRA微调版本,专门用于根据文本描述生成超级肖像风格的人物图像。支持细节丰富的面部特征和服装描述生成。
模型特点
高细节肖像生成
能够根据详细文本描述生成具有精细面部特征和服装细节的人物肖像
LoRA微调
基于FLUX.1-dev基础模型的轻量级适配器,保持基础模型能力的同时增强肖像生成效果
多分辨率支持
支持多种宽高比输出,特别是3:2和1:1比例
模型能力
文本生成图像
人物肖像生成
细节特征控制
使用案例
数字艺术创作
角色设计
为游戏或动画角色快速生成概念肖像
可生成具有特定面部特征、服装和配饰的角色形象
个性化头像
根据用户描述生成个性化头像
可生成符合用户描述特征的独特头像
🚀 Flux-Super-Portrait-LoRA
Flux-Super-Portrait-LoRA 是一款文本到图像的模型,借助 LoRA 技术,能依据输入的文本描述生成高质量的人物特写肖像。它在图像生成领域具有较高的应用价值,可满足多样化的创意需求。
🚀 快速开始
安装依赖
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Super-Portrait-LoRA"
trigger_word = "Super Portrait"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
触发图像生成
你应该使用 Super Portrait
来触发图像生成。
下载模型
此模型的权重以 Safetensors 格式提供。 点击下载(在“文件与版本”选项卡中)。
✨ 主要特性
- 文本到图像转换:能够根据输入的文本描述生成对应的人物特写肖像。
- 高质量输出:生成的图像具有较高的质量和细节。
- 特定触发词:使用
Super Portrait
作为触发词,方便控制图像生成。
📦 安装指南
安装依赖库
import torch
from pipelines import DiffusionPipeline
加载基础模型
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
加载 LoRA 模型
lora_repo = "strangerzonehf/Flux-Super-Portrait-LoRA"
trigger_word = "Super Portrait"
pipe.load_lora_weights(lora_repo)
设备设置
device = torch.device("cuda")
pipe.to(device)
💻 使用示例
基础用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Super-Portrait-LoRA"
trigger_word = "Super Portrait"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
# 示例文本输入
text = "Super Portrait, A close-up portrait of a young man with dark brown eyes and dark brown eyebrows. He is wearing a green and yellow striped polo shirt with a black collar. His earring is adorned with a silver earring. The backdrop is a light blue color."
image = pipe(text).images[0]
image.save("output.png")
📚 详细文档
图像生成示例
以下是一些图像生成的示例:
输入文本 | 输出图像 |
---|---|
Super Portrait, A close-up portrait of a young man with dark brown eyes and dark brown eyebrows. He is wearing a green and yellow striped polo shirt with a black collar. His earring is adorned with a silver earring. The backdrop is a light blue color. | 点击查看 |
Super Portrait, A close-up shot of a young blonde girl with blue eyes and a black beanie on her head. The beanie is adorned with a pink patch that reads "CUTIE REBEL" in bold white letters. The girls hair is pulled back in a ponytail and she is wearing a black turtleneck. The background is a vibrant brown color. | 点击查看 |
Super Portrait, a close-up shot of a young mans face is adorned with a beige baseball cap adorned with red lettering. The mans eyes are a piercing blue, and he is wearing a pink t-shirt. His hair is dark brown, adding a touch of texture to his face. The backdrop is a vibrant shade of blue, creating a stark contrast to the mans head and the cap. | 点击查看 |
Super Portrait, a close-up shot of a young girls face is featured prominently in the frame. The girls eyes are a piercing blue, and her hair is pulled back in a ponytail, adding a pop of color to her face. She is wearing a gray baseball cap, adorned with a white logo that reads "E-NILS" in a cursive font, while the rest of the text is in a darker shade of white. Her eyebrows are a lighter shade of blue, while her lips are a darker pink. She is wearing a long-sleeved gray sweater, with a slight smile on her lips. The backdrop is a vibrant orange, creating a stark contrast to the girls outfit. | 点击查看 |
Super Portrait, A close-up of a young girl with almond-shaped hazel eyes and long jet-black hair tied in twin braids. She wears a bright red turtleneck sweater and a pair of small silver hoop earrings. The background is a soft peach, highlighting her vibrant outfit. | 点击查看 |
Super Portrait, A close-up of a young man with dark brown eyes and wavy black hair. He is wearing a dark green trench coat with a high collar and a light brown scarf around his neck. The backdrop is a cloudy gray, adding an air of mystery to the scene. | 点击查看 |
图像生成参数
参数 | 详情 |
---|---|
LR Scheduler | constant |
Noise Offset | 0.03 |
Optimizer | AdamW |
Multires Noise Discount | 0.1 |
Network Dim | 64 |
Network Alpha | 32 |
Epoch | 14 |
Save Every N Epochs | 1 |
Multires Noise Iterations | 10 |
Repeat & Steps | 17 & 2650 |
最佳尺寸与推理
尺寸 | 长宽比 | 推荐情况 |
---|---|---|
1280 x 832 | 3:2 | 最佳 |
1024 x 1024 | 1:1 | 默认 |
推理范围
- 推荐推理步数:30–35
标注信息
标注使用 florence2-en(自然语言 & 英语)。
训练图像总数
总共使用 19 张 [Flat 4K] 图像进行训练。
🔧 技术细节
模型训练参数
参数 | 详情 |
---|---|
LR Scheduler | constant |
Noise Offset | 0.03 |
Optimizer | AdamW |
Multires Noise Discount | 0.1 |
Network Dim | 64 |
Network Alpha | 32 |
Epoch | 14 |
Save Every N Epochs | 1 |
Multires Noise Iterations | 10 |
Repeat & Steps | 17 & 2650 |
标注与训练数据
- 标注:使用 florence2-en(自然语言 & 英语)进行标注。
- 训练图像总数:总共使用 19 张 [Flat 4K] 图像进行训练。
最佳尺寸与推理
尺寸 | 长宽比 | 推荐情况 |
---|---|---|
1280 x 832 | 3:2 | 最佳 |
1024 x 1024 | 1:1 | 默认 |
推理范围
- 推荐推理步数:30–35
📄 许可证
本模型使用 creativeml-openrail-m 许可证。
Stable Diffusion V1 5
Openrail
稳定扩散是一种潜在的文本到图像扩散模型,能够根据任何文本输入生成逼真的图像。
图像生成
S
stable-diffusion-v1-5
3.7M
518
Stable Diffusion Inpainting
Openrail
基于稳定扩散的文本到图像生成模型,具备图像修复能力
图像生成
S
stable-diffusion-v1-5
3.3M
56
Stable Diffusion Xl Base 1.0
SDXL 1.0是基于扩散的文本生成图像模型,采用专家集成的潜在扩散流程,支持高分辨率图像生成
图像生成
S
stabilityai
2.4M
6,545
Stable Diffusion V1 4
Openrail
稳定扩散是一种潜在文本到图像扩散模型,能够根据任意文本输入生成逼真图像。
图像生成
S
CompVis
1.7M
6,778
Stable Diffusion Xl Refiner 1.0
SD-XL 1.0优化器模型是Stability AI开发的图像生成模型,专为提升SDXL基础模型生成的图像质量而设计,特别擅长最终去噪步骤处理。
图像生成
S
stabilityai
1.1M
1,882
Stable Diffusion 2 1
基于扩散的文本生成图像模型,支持通过文本提示生成和修改图像
图像生成
S
stabilityai
948.75k
3,966
Stable Diffusion Xl 1.0 Inpainting 0.1
基于Stable Diffusion XL的潜在文本到图像扩散模型,具备通过遮罩进行图像修复的功能
图像生成
S
diffusers
673.14k
334
Stable Diffusion 2 Base
基于扩散的文生图模型,可根据文本提示生成高质量图像
图像生成
S
stabilityai
613.60k
349
Playground V2.5 1024px Aesthetic
其他
开源文生图模型,能生成1024x1024分辨率及多种纵横比的美学图像,在美学质量上处于开源领域领先地位。
图像生成
P
playgroundai
554.94k
723
Sd Turbo
SD-Turbo是一款高速文本生成图像模型,仅需单次网络推理即可根据文本提示生成逼真图像。该模型作为研究原型发布,旨在探索小型蒸馏文本生成图像模型。
图像生成
S
stabilityai
502.82k
380
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文