Canopus LoRA Flux FaceRealism
基于Flux风格和LoRA技术的超写实面部生成模型,专注于高保真肖像和时尚摄影
下载量 2,066
发布时间 : 8/29/2024
模型简介
采用LoRA微调技术的超写实模型,可生成具有逼真纹理、光影和精细细节的高质量面部图像。特别适合肖像摄影和时尚摄影场景。
模型特点
超写实面部细节
能够生成具有精细纹理和逼真光影的面部特征
Flux风格融合
结合Flux风格的写实主义表现手法
LoRA微调技术
采用低秩适应技术对基础模型进行高效微调
多场景适应
支持户外、影棚等多种拍摄场景的肖像生成
模型能力
高保真面部生成
时尚摄影模拟
肖像风格转换
光影效果控制
多比例图像输出
使用案例
时尚摄影
模特肖像
生成具有专业影棚灯光效果的模特肖像
如图2所示的英俊男模半身像
户外时尚摄影
模拟户外环境下的时尚拍摄效果
如图1所示的树林背景女性肖像
创意艺术
风格化肖像
生成具有特定艺术风格的肖像作品
如图5所示的女性剪影黑白照片
🚀 Canopus-LoRA-Flux-FaceRealism
Canopus-LoRA-Flux-FaceRealism 是一款图像生成模型,借助 LoRA 微调技术,专注于生成逼真的面部图像,能在多种场景下输出高质量的图像效果。
🚀 快速开始
代码示例
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Canopus-LoRA-Flux-FaceRealism"
trigger_word = "Realism" # 若不使用触发词,可留空。
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
✨ 主要特性
- 高逼真度:能够生成极其逼真的面部图像,还原细腻的纹理和真实的光影效果。
- 多场景适用:可用于生成不同风格和场景的图像,如时尚摄影、人像写真等。
- 易于使用:通过简单的触发词即可触发图像生成。
📦 安装指南
暂未提及具体安装步骤,可参考代码示例中的导入和加载操作。
💻 使用示例
基础用法
# 上述快速开始中的代码示例即为基础用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Canopus-LoRA-Flux-FaceRealism"
trigger_word = "Realism" # 若不使用触发词,可留空。
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
高级用法
可根据不同的触发提示词生成不同风格的图像,例如:
A portrait of an attractive woman in her late twenties with light brown hair and purple, wearing large a a yellow sweater. She is looking directly at the camera, standing outdoors near trees.. --ar 128:85 --v 6.0 --style raw
📚 详细文档
模型描述
prithivMLmods/Canopus-LoRA-Flux-FaceRealism
图像处理参数
参数 | 值 | 参数 | 值 |
---|---|---|---|
LR Scheduler | constant | Noise Offset | 0.03 |
Optimizer | AdamW | Multires Noise Discount | 0.1 |
Network Dim | 64 | Multires Noise Iterations | 10 |
Network Alpha | 32 | Repeat & Steps | 30 & 3.1K+ |
Epoch | 20 | Save Every N Epochs | 1 |
标注信息
标注:florence2 - en(自然语言 & 英语)
训练数据
总共使用 200 + [高分辨率] 图像进行训练。
新版本信息
这里有一个表格总结了 Hugging Face 上 Flux - Super - Realism - LoRA
模型的相关信息:
特性 | 详情 |
---|---|
模型名称 | Flux - Super - Realism - LoRA |
仓库地址 | [strangerzonehf/Flux - Super - Realism - LoRA](https://huggingface.co/strangerzonehf/Flux - Super - Realism - LoRA) |
作者 | strangerzonehf |
描述 | 超逼真 LoRA 模型,旨在使用 LoRA 微调技术生成高质量、超逼真的图像。该模型可以生成逼真的纹理、光影和复杂的细节。 |
模型类型 | LoRA(Transformer 的低秩自适应) |
用例 | - 逼真图像生成 - 高保真艺术创作 - 纹理细节处理和增强 |
主要语言 | 不适用(基于图像的模型) |
基础模型 | 用于 LoRA 微调的基础模型(可能因实现而异) |
许可证 | 请参考 Hugging Face 模型页面获取具体的许可信息。 |
标签 | 超逼真、LoRA、高保真、超现实 |
使用方法 | 该模型通常与 Hugging Face 的 Diffusers 或其他支持 LoRA 微调的库一起使用,以增强图像生成的逼真度。 |
管道 | 在 StableDiffusionPipeline 或兼容的图像生成管道中使用。 |
图像对比 DLC
图像 | 描述 |
---|---|
图像 1 | 一位有吸引力的女性肖像:二十多岁晚期,浅棕色头发,穿着黄色毛衣,直视镜头,站在户外树木附近。宽高比:128:85。风格:原始 |
图像 2 | 一位英俊年轻男子的特写:穿着带纽扣和大披肩领的深灰色毛衣,棕色头发,短胡须,黑色背景下表情严肃,柔和的摄影棚灯光。宽高比:85:128。风格:原始 |
图像 3 | 时尚照片:模特穿着白色紧身衣和米色风衣,在日落时双手放在头上,在火车站前摆姿势。高分辨率,35mm 镜头,f/22,自然光线。宽高比:85:128。风格:原始 |
图像 4 | 乡村肖像:皮肤白皙、自然波浪卷发的女性。穿着红色和海军蓝格子衬衫,里面是白色内衣,袖子卷到前臂。随意地靠在有剥落油漆的破旧蓝色门框上,表情沉思。 |
触发提示
以下是一些触发提示示例:
A portrait of an attractive woman in her late twenties with light brown hair and purple, wearing large a a yellow sweater. She is looking directly at the camera, standing outdoors near trees.. --ar 128:85 --v 6.0 --style raw
Headshot of handsome young man, wearing dark gray sweater with buttons and big shawl collar, brown hair and short beard, serious look on his face, black background, soft studio lighting, portrait photography --ar 85:128 --v 6.0 --style raw
A photo of the model wearing a white bodysuit and beige trench coat, posing in front of a train station with hands on head, soft light, sunset, fashion photography, high resolution, 35mm lens, f/22, natural lighting, global illumination. --ar 85:128 --v 6.0 --style raw
An image of a woman with fair skin and natural, wavy hair styled in soft curls around her face. She has defined eyebrows and light-colored eyes that draw attention. She's dressed in a red and navy plaid shirt with the top unbuttoned to show a white undershirt, and the sleeves rolled up to the forearms. The woman is casually leaning against a weathered blue door frame with peeling paint, adding a rustic charm to the scene. Her arms are crossed or resting in front of her, and she has a soft, contemplative expression on her face.
A black and white photo of a woman with shadow., in the style of minimalist beauty, light bronze and bronze, serene faces, sharp edges, karencore, high definition, contrast shading, realism --ar 3:5 --stylize 750 --v 6.0 --style raw
Photograph, face, young man professional model, minimalist, stylish nessy long hairstyle, beard, profound gaze, Canon EOS R5 with an RF 85mm F1.2L lens, solid white environment, studio lights setting, ultra-realistic, 32K UHD --ar 9:16 --style raw --stylize 700
触发参数
参数 | 值 |
---|---|
Prompt | Photograph, face, young man professional model, minimalist, stylish nessy long hairstyle, beard, profound gaze, Canon EOS R5 with an RF 85mm F1.2L lens, solid white environment, studio lights setting, ultra-realistic, 32K UHD --ar 9:16 --style raw --stylize 700 |
Sampler | euler |
触发词
你可以使用以下触发词来触发图像生成:
face
realism
face realism
应用文件结构
/project-root/
├── .gitattributes
├── README.md
├── app.py
├── pythonproject.py
下载模型
该模型的权重以 Safetensors 格式提供。 点击下载,在 Files & versions 标签中获取。
- 🪄 动漫模型:https://huggingface.co/prithivMLmods/Canopus-Anime-Art-Flux-LoRA
🤗 更多信息:https://hf.co/prithivmlmods
🔧 技术细节
暂未提供足够详细的技术实现细节。
📄 许可证
该模型使用 creativeml - openrail - m
许可证。
⚠️ 重要提示
请勿使用负提示词,因为这可能会导致生成的图像出现伪影和扭曲。
Stable Diffusion V1 5
Openrail
稳定扩散是一种潜在的文本到图像扩散模型,能够根据任何文本输入生成逼真的图像。
图像生成
S
stable-diffusion-v1-5
3.7M
518
Stable Diffusion Inpainting
Openrail
基于稳定扩散的文本到图像生成模型,具备图像修复能力
图像生成
S
stable-diffusion-v1-5
3.3M
56
Stable Diffusion Xl Base 1.0
SDXL 1.0是基于扩散的文本生成图像模型,采用专家集成的潜在扩散流程,支持高分辨率图像生成
图像生成
S
stabilityai
2.4M
6,545
Stable Diffusion V1 4
Openrail
稳定扩散是一种潜在文本到图像扩散模型,能够根据任意文本输入生成逼真图像。
图像生成
S
CompVis
1.7M
6,778
Stable Diffusion Xl Refiner 1.0
SD-XL 1.0优化器模型是Stability AI开发的图像生成模型,专为提升SDXL基础模型生成的图像质量而设计,特别擅长最终去噪步骤处理。
图像生成
S
stabilityai
1.1M
1,882
Stable Diffusion 2 1
基于扩散的文本生成图像模型,支持通过文本提示生成和修改图像
图像生成
S
stabilityai
948.75k
3,966
Stable Diffusion Xl 1.0 Inpainting 0.1
基于Stable Diffusion XL的潜在文本到图像扩散模型,具备通过遮罩进行图像修复的功能
图像生成
S
diffusers
673.14k
334
Stable Diffusion 2 Base
基于扩散的文生图模型,可根据文本提示生成高质量图像
图像生成
S
stabilityai
613.60k
349
Playground V2.5 1024px Aesthetic
其他
开源文生图模型,能生成1024x1024分辨率及多种纵横比的美学图像,在美学质量上处于开源领域领先地位。
图像生成
P
playgroundai
554.94k
723
Sd Turbo
SD-Turbo是一款高速文本生成图像模型,仅需单次网络推理即可根据文本提示生成逼真图像。该模型作为研究原型发布,旨在探索小型蒸馏文本生成图像模型。
图像生成
S
stabilityai
502.82k
380
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98
智启未来,您的人工智能解决方案智库
简体中文