语言:
- 英语
基础模型:
- Minthy/RouWei-0.6
任务标签: 文本生成图像
库名称: diffusers
标签:
- 动漫

采用先进技术对Illustrious进行大规模微调,实现卓越性能。
从1400万张动漫艺术和其他媒体(包括私有数据集)中精选并平衡出700万张独特图片(约200万张带有自然文本描述)。Civitai上的详细说明
Vpred版本现已发布!
主要优势:
- 更精准的提示跟随
- 出色的美学、解剖结构、稳定性及多样性
- 鲜艳色彩与平滑渐变,无灼烧痕迹
- 即使使用epsilon也能呈现完整亮度范围
- 掌握数万种风格及几乎任何角色特征
相比原版Illustrious和NoobAI的改进:
- 不再有烦人的水印
- 无标签干扰,提示分割更优
- 无角色标签干扰及相关副作用(如意外服装、风格或构图变化)
- 更强的连贯性与解剖结构
- 艺术家风格精准还原
- 包括基础风格在内的所有风格在不同种子下均保持稳定
- 新增知识库
数据集截止日期:2024年12月20日。
特性与提示技巧:
本模型兼容简短标签式提示与复杂自然语言描述。结合标签与自然语句可获得最佳效果。标签采用经典Danbooru风格(逗号分隔,无下划线)。
基础设置:
文本生成图像建议约100万像素,长宽为64倍数(如1024x1024、1152x、1216x832等)。采样器推荐Euler_a,CFG值:epsilon版4-8/vpred版3-5,步数20-28。LCM/PCM/DMD未测试,cfg++采样器表现良好。高清修复建议:1.5倍潜空间+降噪0.6,或任意GAN+降噪0.3-0.55。
注意:vpred版本需降低CFG值。
示例见仓库,更多内容请访问civitai。
质量标签:
仅4种:
正向:
masterpiece, best quality
负向:
low quality, worst quality
其他元标签(如lowres)已移除请勿使用。低分辨率图像经DAT处理后被删除或超分修复。
负面提示:
worst quality, low quality, watermark
保持简洁效果最佳。堆砌流行负面词不会提升质量(相关问题已修复),反而会导致偏差与质量下降。
艺术家风格:
模型掌握超3.5万种艺术家风格。列表,风格示例网格图(Mega网盘)。必须使用by
前缀。
通用风格:
2.5d, anime screencap, bold line, sketch, cgi, digital painting, flat colors, smooth shading, minimalistic, ink style, oil style, pastel style
自然语言:
与标签组合效果卓越。建议在风格/质量标签后使用自然语句。数据集内约200万图片采用Opus-Vision、GPT-4o、Gemini及ToriiGate生成的混合标注。0.7版改进了提示理解与分割机制,建议关注CLIP的75词元分块。
亮度/色彩/对比度:
可通过元标签控制:
low brightness, high brightness, low saturation, high saturation, low gamma, high gamma, sharp colors, soft colors, hdr, sdr
Vpred版本:
RouWei-0.7的Vpred版本已发布,无灼烧问题开箱即用。建议CFG值3-5,其他设置相同。请勿使用针对灼烧问题的实验性采样器(本无需修复)。
基础模型:
此处epsilon/vpred版本经最终美学抛光以提升细节。如需用于模型融合/提取/微调,请使用基础版RouWei。
Discord社区
加入
安全声明:
模型可能根据提示生成NSFW内容,建议添加额外过滤。输出可能存在偏差,请勿作为事实参考。
许可协议:
与illustrious相同,使用限制详见原页。欢迎用于模型融合/微调等,请保留出处链接。
致谢:
匿名贡献者、Bakariso、dga、Fi.、ello、K.、LOL2024、NeuroSenko、rred、Soviet Cat、Sv1.、T.等伙伴。
捐赠:
BTC bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
ETH/USDT(e) 0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db
XMR 47F7JAyKP8tMBtzwxpoZsUVB8wzg2VrbtDKBice9FAS1FikbHEXXPof4PAb42CQ5ch8p8Hs4RvJuzPHDtaVSdQzD6ZbA5TZ