标签:
- 文本生成图像
- LoRA模型
- 扩散模型
- 模板:扩散-LoRA
组件:
- 文本: >-
1女孩,单人,蓝色背景,半色调背景,注视观众,兽耳,校服,黄瞳,黑发,长发,坐姿,跷二郎腿,猫耳,边框,半色调,白边框,沙发,张嘴,衬衫,短裙,长袖,白衬衫,黑短裙,百褶裙,水手服,领巾,黑色水手领,袜子,白袜,外边框,水手领,兽耳绒毛,黑领巾,杰作,最佳品质,高分,优秀评分,最新,figma可动手办
参数:
负面提示: >-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,少手指,裁剪,最差质量,低质量,低分,差评,平均分,签名,水印,用户名,模糊
输出:
图片链接: images/image.jpg
- 文本: >-
PVC材质,1女孩,单人,全身像,手套,腹股沟,遮眼发,发饰,歪头,手持,持杖,角饰,长发,注视观众,女仆头饰,泪痣,眼下痣,肚脐,微张唇,紫瞳,紫发,紫色主题,披肩,短裤,独角,法杖,站姿,大腿袜,双马尾,白色鞋履,白手套,白色大腿袜,杰作,最佳品质,高分,优秀评分,最新
参数:
负面提示: >-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,少手指,裁剪,最差质量,低质量,低分,差评,平均分,签名,水印,用户名,模糊
输出:
图片链接: images/image(1).jpg
- 文本: >-
可爱动漫女孩配超大蓬松耳与大尾巴,金色凌乱长发,蓝瞳,穿着女仆装搭配黑色金叶纹长裙与白围裙,张嘴将装饰蜡烛的黑森林蛋糕放置在古老阴暗维多利亚宅邸的餐桌上,烛光映照下可见雾气森林的明亮窗户,四周布满昂贵物品与墙上的油画,PVC材质,杰作,最佳品质,高分,优秀评分,最新
参数:
负面提示: >-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,少手指,裁剪,最差质量,低质量,低分,差评,平均分,签名,水印,用户名,模糊
输出:
图片链接: images/image(2).jpg
- 文本: >-
1女孩,单人,户外,注视观众,花朵,手套,灰发,帽子,外套,长发,长裙,长袖,开襟外套,连裤袜,红瞳,红花,红帽,红外套,红玫瑰,红裙,衬衫,微笑,飘雪,站姿,白手套,白衬衫,PVC材质,杰作,最佳品质,高分,优秀评分,最新
参数:
负面提示: >-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,少手指,裁剪,最差质量,低质量,低分,差评,平均分,签名,水印,用户名,模糊
输出:
图片链接: images/image(3).jpg
- 文本: >-
1女孩,单人,女仆装,牛仔镜头,茶杯,绿瞳,绿发,发束,发饰,手持茶杯,嘴唇,长发,注视观众,马尾辫,写实风,纯色背景,茶具,超长发,白背景,腕饰,PVC材质,杰作,最佳品质,高分,优秀评分,最新
参数:
负面提示: >-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,少手指,裁剪,最差质量,低质量,低分,差评,平均分,签名,水印,用户名,模糊
输出:
图片链接: images/image(4).jpg
- 文本: >-
1女孩,初音未来,虚拟歌姬,单人,:o表情,露肩,黑短裙,黑色袖套,黑色大腿袜,蓝瞳,蓝发,脸红,翻领衬衫,分离袖套,发饰,跪姿,长发,长袖,注视观众,迷你裙,微张唇,百褶裙,衬衫,无袖上衣,大腿袜,双马尾,超长发,白衬衫,翼领,PVC材质,杰作,最佳品质,高分,优秀评分,最新
参数:
负面提示: >-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,少手指,裁剪,最差质量,低质量,低分,差评,平均分,签名,水印,用户名,模糊
输出:
图片链接: images/image(5).jpg
- 文本: >-
1女孩,单人,垂手而立,黑色发带,黑衬衫,黑短裙,蓝瞳,脸红,翻领衬衫,渐变发,遮眼发,发带,举手,长发,长袖,多彩发色,领巾,橙发,橙色领巾,微张唇,百褶裙,紫发,衬衫,侧发,纯色背景,短裙,过腕袖口,上半身,超长发,白背景,PVC材质,杰作,最佳品质,高分,优秀评分,最新
参数:
负面提示: >-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,少手指,裁剪,最差质量,低质量,低分,差评,平均分,签名,水印,用户名,模糊
输出:
图片链接: images/image(6).jpg
基础模型: cagliostrolab/animagine-xl-4.0
实例提示: PVC材质,黏土人,figma可动手办
许可证: Apache-2.0
AnimagineXL 4.0优化版PVC风格LoRA模型
模型说明
目前仅在ComfyUI环境中完成测试。
触发词
使用pvc
触发图像生成。
使用nendoroid
触发图像生成。
使用figma
触发图像生成。
模型下载
本模型权重提供Safetensors格式。
在文件与版本选项卡中下载。
数据集
约7000张PVC手办图片。
训练过程
训练代码
https://github.com/p1atdev/vision-ft
训练配置
`config.yml`
模型:
检查点路径: "./models/animagine-xl-4.0-opt.bnb_nf4.safetensors"
预训练模型: cagliostrolab/animagine-xl-4.0
数据类型: bfloat16
降噪器:
注意力机制: "flash_attention_2"
参数高效微调:
配置:
类型: lora
秩: 2
alpha值: 1.0
丢弃率: 0.0
数据类型: bfloat16
包含键:
- "attn1"
- "attn2"
- ".ff."
排除键: ["文本编码器", "变分自编码器"]
数据集:
文件夹: "data/pvc"
重复次数: 4
批次大小: 4
基准桶尺寸: 1024
步长: 128
最小尺寸: 384
启用放大: true
标注处理器:
- 类型: 随机排序
分隔符: ","
优化器:
名称: "schedulefree.RAdamScheduleFree"
参数:
学习率: 0.005
调度器:
追踪器:
项目名称: "sdxl-pvc-1"
记录器:
- wandb
保存策略:
周期保存: 0.25
步数保存: null
保留最终版本: true
回调:
- 类型: "safentensors"
名称: "sdxl-pvc"
保存目录: "./output/sdxl-pvc-2"
预览:
策略:
周期预览: 1
步数预览: 100
回调:
- 类型: "本地预览"
保存目录: "./output/sdxl-lora/preview"
数据:
路径: "./projects/pvc-sdxl/preview.yml"
随机种子: 42
训练周期: 10
训练器:
梯度检查点: true
torch编译: true
编译参数:
后端: eager
模式: default
全图模式: false
fp32矩阵精度: "high"
允许tf32: true
`preview.yml`
- 提示词: |-
PVC风格,1女孩,水色瞳,棒球帽,金发,闭唇,耳环,
绿色背景,帽子,环形耳饰,珠宝,注视观众,
衬衫,短发,纯色背景,单人,上半身,黄衬衫,
杰作,高分,优秀评分,超高分辨率
负面提示: |-
低分辨率,结构畸形,手部缺陷,文字,错误,缺手指,多手指,
少手指,裁剪,最差质量,低质量,低分,差评,
平均分,签名,水印,用户名,模糊
高度: 1024
宽度: 1024
CFG尺度: 5.0
步数: 20
随机种子: 0
训练在第9周期中断,因训练导致室温过高。
设备与耗时
RTX 4070 Ti Super显卡(16GB显存),耗时27小时。