语言:
- 英文
基础模型:
- OnomaAIResearch/Illustrious-xl-early-release-v0
任务标签: 文本生成图像
库名称: diffusers
标签:
- 动漫

采用先进技术对Illustrious进行大规模微调,实现卓越性能。
从1200万张动漫艺术和其他媒体(包括私有数据集)中精选并平衡了450万张图片(其中80万张带有自然文本描述)作为训练数据。更多详情参见Civitai
核心优势:
- 更精准的提示跟随能力
- 出色的美学表现、人体结构稳定性与多功能性
- 鲜艳色彩与平滑渐变,无灼烧痕迹
- 即使使用epsilon也能保持完整亮度范围
- 掌握数万种风格及几乎任何角色特征
相比原版Illustrious和NoobAI的改进:
- 消除烦人水印
- 无标签渗透,提示分割更清晰
- 杜绝角色标签渗透及相关副作用(意外服装/风格/构图变化)
- 更强的连贯性与人体结构
- 艺术家风格精准还原
- 包括基础风格在内的所有风格在不同种子下均保持稳定
- 新增知识库
特性与提示技巧:
本模型兼容短标签式提示与长文本复杂提示。结合标签与自然语句可获得最佳效果。
标签采用经典danbooru风格(逗号分隔,无下划线)。
基础设置:
文生图建议约100万像素,长宽为64倍数(如1024x1024/1152x/1216x832等)。推荐Euler_a采样器,CFG值:epsilon版4-8/vpred版3-5,20-28步数。LCM/PCM未测试,cfg++采样器表现良好。高清修复:潜在空间放大1.5倍+降噪0.6,或任意GAN+降噪0.3-0.55。
注意:vpred版本需调低CFG值
示例图片见仓库image文件夹。
质量标签:
仅需4个:
正向标签:
masterpiece, best quality
负向标签:
low quality, worst quality
无需其他元标签(如lowres),低分辨率图片已通过DAT技术处理。
负向提示:
worst quality, low quality, watermark
保持简洁可获得最佳效果。堆砌流行负面词不仅无益(相关缺陷已修复),反而会导致偏差与质量下降。
艺术家风格:
掌握超2.2万种艺术家风格。风格列表,示例网格图(Mega网盘)。使用时需前缀"by "。
0.6.1 vpred版本新增风格:
by nyalia, by flooxyfloox, by koni, by truck-kun, by 748cm, by galawave, by aruhshura, by kyomu, by youlichu, by alens, by chlenix, by cleandongye, by fltccktl, by merratatustle, by xi410, by youmuanon, by memento mori
通用风格:
2.5d, anime screencap, bold line, sketch, cgi, digital painting, flat colors, smooth shading, minimalistic, ink style, oil style, pastel style
自然文本:
与标签组合使用效果极佳。建议在风格/质量标签后使用纯自然文本。当然您也可以仅用标签——完全取决于个人偏好。数据集包含80万张采用Opus-Vision/GPT-4o/ToriiGate生成的混合标注图片。
亮度/色彩/对比度:
可通过元标签控制:
low brightness, high brightness, low gamma, high gamma, sharp colors, soft colors, hdr, sdr, limited range
Vpred版本:
0.6.1版vpred经过重新训练修复缺陷,现运行完美。需使用a1111/comfy/reforge的最新开发版。切记将CFG降至3-5,过高值会导致过饱和。
Discord社区
加入链接
安全声明:
模型可能根据提示生成NSFW内容,建议添加额外过滤。输出结果可能存在偏差/争议,请勿作为事实参考。
许可协议:
与原版Illustrious相同,使用限制请查阅原页面。欢迎用于模型融合/微调等,请保留出处链接。
捐赠渠道:
BTC bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
ETH/USDT(e) 0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db