🚀 大规模微调Illustrious模型,具备先进技术与卓越性能
本项目使用先进技术对Illustrious模型进行大规模微调,性能卓越。从1200万张动漫艺术及其他媒体图像(包含私有数据集)中挑选并平衡出450万张图片(其中80万张配有自然文本描述)作为数据集。在Civitai上查看更多详细描述

✨ 主要特性
核心优势
- 更好的提示跟随性:能更精准地按照输入提示生成图像。
- 出色的美学、解剖结构、稳定性与通用性:生成的图像在美学、解剖结构上表现出色,且具有良好的稳定性和通用性。
- 鲜艳的色彩和平滑的渐变:色彩鲜艳,渐变平滑,无过曝痕迹。
- 全亮度范围:即使使用epsilon参数,也能呈现全亮度范围。
- 丰富的风格和角色知识:掌握数万个风格和几乎任何角色的特征。
与原始Illustrious和NoobAI相比
- 无水印困扰:不再有烦人的水印。
- 更好的提示分割:无标签渗透问题,提示分割更精准。
- 无角色标签渗透及相关副作用:避免了不必要的服装、风格和构图变化。
- 更好的连贯性和解剖结构:生成的图像连贯性和解剖结构表现更佳。
- 准确还原艺术家风格:艺术家风格呈现准确。
- 风格稳定性高:每种风格(包括基础风格)在不同种子下都稳定,无随机波动。
- 新知识:具备新的知识和能力。
📚 详细文档
特性与提示
本模型设计为支持基于短Booru标签和长复杂自然文本的提示。结合标签和一些自然文本短语可获得最佳效果。标签使用经典的Danbooru风格,即无下划线的逗号分隔标签。
基本设置
- 图像分辨率:txt2img约100万像素,任意长宽比,分辨率为64的倍数(如1024x1024、1152x、1216x832等)。
- 采样器:Euler_a。
- CFG值:epsilon模式下为4 - 8,vpred模式下为3 - 5。
- 步数:20 - 28步。
- LCM/PCM未测试:cfg++采样器效果良好。
- 高分辨率修复:x1.5潜在空间 + 去噪0.6或任何GAN + 去噪0.3 - 0.55。
⚠️ 重要提示
vpred版本需要较低的CFG值。
示例可在仓库的图像文件夹中找到。
质量标签
仅使用4个标签:
- 正标签:
masterpiece, best quality
- 负标签:
low quality, worst quality
其他元标签(如lowres)已移除,请勿使用。低分辨率图像已根据重要性进行移除或使用DAT进行上采样和清理。
负提示
worst quality, low quality, watermark
💡 使用建议
为获得最佳效果,请尽量保持负提示简洁。堆砌流行序列不会改善结果,因为所有相关缺陷已解决,反而可能导致不必要的效果、偏差和质量下降。
艺术家风格
模型掌握超过22000种艺术家风格。风格列表,Mega上的示例网格。使用时需加上“by ”,否则效果不佳。
0.6.1 vpred版本还支持以下风格:
by nyalia, by flooxyfloox, by koni, by truck-kun, by 748cm, by galawave, by aruhshura, by kyomu, by youlichu, by alens, by chlenix, by cleandongye, by fltccktl, by merratatustle, by xi410, by youmuanon, by memento mori
通用风格
2.5d, anime screencap, bold line, sketch, cgi, digital painting, flat colors, smooth shading, minimalistic, ink style, oil style, pastel style
自然文本
可与Booru标签结合使用,效果极佳。在输入风格和质量标签后使用自然文本。也可仅使用Booru标签,具体取决于个人需求。数据集包含超过80万张由Opus-Vision、GPT-4o和ToriiGate生成的混合自然文本描述的图片。
亮度/颜色/对比度
可使用额外的元标签进行控制:
low brightness, high brightness, low gamma, high gamma, sharp colors, soft colors, hdr, sdr, limited range
Vpred版本
Vpred版本编号为0.6.1,因其从基础版本重新训练以修复观察到的缺陷,目前运行良好。使用时需要最新的a1111开发版、Comfy或Reforge。请将CFG值降低到3 - 5,较高的值会导致过饱和。
Discord服务器
加入
安全性
模型可能会根据相应提示生成NSFW图像,请考虑添加额外的过滤机制。输出结果可能不准确或具有挑衅性,请勿将其作为参考。
📄 许可证
与Illustrious相同,请查看原始页面了解限制。可自由用于合并、微调等,但请保留链接。
捐赠
- 比特币(BTC):bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
- 以太坊/USDT(e):0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db
信息表格
属性 |
详情 |
模型类型 |
文本到图像生成模型 |
训练数据 |
从1200万张动漫艺术及其他媒体图像(包含私有数据集)中挑选并平衡出450万张图片(其中80万张配有自然文本描述) |
基础模型 |
OnomaAIResearch/Illustrious-xl-early-release-v0 |
库名称 |
diffusers |
标签 |
anime |