RouWei-0.6开源文本生图模型 - 免费部署生成精美动漫风格图像

首页

Rouwei 0.6

由 Minthy 开发

RouWei-0.6是基于Illustrious-xl-early-release-v0进行大规模微调的文本生成图像模型，专注于动漫风格图像生成，具有卓越的提示跟随能力和美学表现。

图像生成英语#高精度动漫生成 #多风格兼容 #自然语言理解

下载量 36

发布时间 : 12/9/2024

模型简介

该模型通过精选450万张图片（含80万张带自然文本描述）进行训练，优化了提示跟随、色彩表现和风格稳定性，适用于高质量的动漫风格图像生成。

模型特点

精准提示跟随

优化后的模型能更准确地理解和执行复杂提示

美学表现

出色的色彩表现、平滑渐变和人体结构稳定性

风格多样性

掌握数万种艺术家风格和通用风格，风格表现稳定

无干扰元素

消除水印和标签渗透问题，输出更纯净

模型能力

动漫风格图像生成

艺术家风格模仿

自然文本理解

高质量图像渲染

使用案例

艺术创作

动漫角色设计

根据文本描述生成各种风格的动漫角色

高质量、风格一致的动漫角色图像

场景创作

生成复杂的动漫场景和背景

具有良好构图和色彩的场景图像

概念设计

快速原型设计

为游戏或动画项目快速生成概念图

多样化的设计选项和风格变体

🚀 大规模微调Illustrious模型，具备先进技术与卓越性能

本项目使用先进技术对Illustrious模型进行大规模微调，性能卓越。从1200万张动漫艺术及其他媒体图像（包含私有数据集）中挑选并平衡出450万张图片（其中80万张配有自然文本描述）作为数据集。在Civitai上查看更多详细描述

![image](https://huggingface.co/Minthy/RouWei-0.6/resolve/main/images/alltogether.jpg)

✨ 主要特性

核心优势

更好的提示跟随性：能更精准地按照输入提示生成图像。
出色的美学、解剖结构、稳定性与通用性：生成的图像在美学、解剖结构上表现出色，且具有良好的稳定性和通用性。
鲜艳的色彩和平滑的渐变：色彩鲜艳，渐变平滑，无过曝痕迹。
全亮度范围：即使使用epsilon参数，也能呈现全亮度范围。
丰富的风格和角色知识：掌握数万个风格和几乎任何角色的特征。

与原始Illustrious和NoobAI相比

无水印困扰：不再有烦人的水印。
更好的提示分割：无标签渗透问题，提示分割更精准。
无角色标签渗透及相关副作用：避免了不必要的服装、风格和构图变化。
更好的连贯性和解剖结构：生成的图像连贯性和解剖结构表现更佳。
准确还原艺术家风格：艺术家风格呈现准确。
风格稳定性高：每种风格（包括基础风格）在不同种子下都稳定，无随机波动。
新知识：具备新的知识和能力。

📚 详细文档

特性与提示

本模型设计为支持基于短Booru标签和长复杂自然文本的提示。结合标签和一些自然文本短语可获得最佳效果。标签使用经典的Danbooru风格，即无下划线的逗号分隔标签。

基本设置

图像分辨率：txt2img约100万像素，任意长宽比，分辨率为64的倍数（如1024x1024、1152x、1216x832等）。
采样器：Euler_a。
CFG值：epsilon模式下为4 - 8，vpred模式下为3 - 5。
步数：20 - 28步。
LCM/PCM未测试：cfg++采样器效果良好。
高分辨率修复：x1.5潜在空间 + 去噪0.6或任何GAN + 去噪0.3 - 0.55。

⚠️ 重要提示

vpred版本需要较低的CFG值。

示例可在仓库的图像文件夹中找到。

质量标签

仅使用4个标签：

正标签：masterpiece, best quality
负标签：low quality, worst quality

其他元标签（如lowres）已移除，请勿使用。低分辨率图像已根据重要性进行移除或使用DAT进行上采样和清理。

负提示

worst quality, low quality, watermark

💡 使用建议

为获得最佳效果，请尽量保持负提示简洁。堆砌流行序列不会改善结果，因为所有相关缺陷已解决，反而可能导致不必要的效果、偏差和质量下降。

艺术家风格

模型掌握超过22000种艺术家风格。风格列表，Mega上的示例网格。使用时需加上“by ”，否则效果不佳。

0.6.1 vpred版本还支持以下风格： by nyalia, by flooxyfloox, by koni, by truck-kun, by 748cm, by galawave, by aruhshura, by kyomu, by youlichu, by alens, by chlenix, by cleandongye, by fltccktl, by merratatustle, by xi410, by youmuanon, by memento mori

通用风格

2.5d, anime screencap, bold line, sketch, cgi, digital painting, flat colors, smooth shading, minimalistic, ink style, oil style, pastel style

自然文本

可与Booru标签结合使用，效果极佳。在输入风格和质量标签后使用自然文本。也可仅使用Booru标签，具体取决于个人需求。数据集包含超过80万张由Opus-Vision、GPT-4o和ToriiGate生成的混合自然文本描述的图片。

亮度/颜色/对比度

可使用额外的元标签进行控制： low brightness, high brightness, low gamma, high gamma, sharp colors, soft colors, hdr, sdr, limited range

Vpred版本

Vpred版本编号为0.6.1，因其从基础版本重新训练以修复观察到的缺陷，目前运行良好。使用时需要最新的a1111开发版、Comfy或Reforge。请将CFG值降低到3 - 5，较高的值会导致过饱和。

Discord服务器

加入

安全性

模型可能会根据相应提示生成NSFW图像，请考虑添加额外的过滤机制。输出结果可能不准确或具有挑衅性，请勿将其作为参考。

📄 许可证

与Illustrious相同，请查看原始页面了解限制。可自由用于合并、微调等，但请保留链接。

捐赠

比特币（BTC）：bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
以太坊/USDT（e）：0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db

信息表格

属性	详情
模型类型	文本到图像生成模型
训练数据	从1200万张动漫艺术及其他媒体图像（包含私有数据集）中挑选并平衡出450万张图片（其中80万张配有自然文本描述）
基础模型	OnomaAIResearch/Illustrious-xl-early-release-v0
库名称	diffusers
标签	anime