推理: false
标签:
- 稳定扩散
- 稳定扩散-扩散器
- 文本生成图像
许可证: creativeml-openrail-m
说明
该模型的新版本已发布:
https://huggingface.co/naclbit/trinart_derrida_characters_v2_stable_diffusion
稳定扩散 TrinArt 角色模型 v1
trinart_characters_19.2m_stable_diffusion_v1 是一个基于稳定扩散 v1 的模型,训练数据包含约 1920 万张动漫/漫画风格图像(包括预增强图像),并最终通过约 5 万张图像进行了微调。该模型旨在在 SDv1 的规格范围内,寻求艺术风格多样性与解剖学质量之间的最佳平衡点。
此版本 1 模型与 9 月初至 10 月 14 日在 AI Novelist/TrinArt 服务中发布的模型相同。我们目前正在 TrinArt 服务上测试新的 Derrida 模型,以进一步提升解剖学稳定性。在此期间,请尽情体验这个经过实际服务验证的角色模型 v1!
硬件
自定义自动编码器
注:2022 年 11 月 5 日之前上传了一个错误的检查点文件,现已替换为最新版本。
我们还提供了自定义 KL 自动编码器的独立检查点。正如潜在扩散论文所建议的,我们发现分别训练自动编码器和潜在扩散模型能改善结果。由于官方稳定扩散脚本不支持加载其他 VAE,若要在您的脚本中使用,您需要覆盖 first_stage_model
的 state_dict
。
流行的 WebUI 提供了加载独立 first_stage_model
参数的脚本。
安全性
数据集经过过滤,排除了 NSFW 或不安全内容。通过我们对 1000 万张以上用户生成图像的广泛实验和测试,我们认为该模型足够安全,相比原版 SD v1.4 模型或其他动漫/漫画模型,它更不容易生成不当(裸露/过度色情/真实血腥)内容。然而,如果用户刻意逼迫模型,仍有可能强制其生成令人不快的素材。我们不认为该模型是 100% 无风险的。
*此声明并不限制第三方训练包含 NSFW 内容的该模型衍生版本。
示例
以下图像由原生 TrinArt 服务直接生成,包含其特有的放大器、解析器和处理流程。您的实际效果可能有所不同。

(随机混合示例)


广角镜头,高质量,htgngg 动物扶手棕色头发欢乐椅子杯子连衣裙花朵俯视角外套搭肩长发独坐糖碗幻想冒险者酒馆桌子茶杯茶壶风景微缩(2022 艺术风格预设)

高分辨率广角镜头刘海露肩水鸟笼玻璃缸分离袖褶边腿部装饰发饰发带兜帽长发中等胸部发带大腿袜(2019 艺术风格预设)

1女孩站立持剑手臂抬起刘海露肩靴子蝴蝶结胸部明亮瞳孔项圈分离袖钻石(形状)漂浮头发侧身全身手套抬腿长发看向观众张嘴伸展手臂独处渐变色头发扫掠刘海双色头发超长发::4 愤怒::1(2022 艺术风格预设)

1男孩男性焦点站立持剑手臂抬起蝴蝶结明亮瞳孔斗篷外套钻石(形状)漂浮头发折叠靴子侧身全身手套抬腿长袖看向观众张嘴伸展手臂敞开外套独处扫掠双色头发大腿靴::4 愤怒::1.25(2022 艺术风格预设)

大教堂 1女孩女学生桃子校服猫粒子美丽流星细节大教堂外套张嘴眼镜猫(2022 艺术风格预设)

高分辨率 2女孩百合广角镜头刘海露肩水鸟笼玻璃缸分离袖褶边腿部装饰发饰发带兜帽长发中等胸部发带大腿袜(更多细节预设)

广角镜头最佳质量青金石高分辨率 1男孩刘海黑色手套棕色头发闭口手套遮眼发看向观众男性焦点花朵绿瞳(更多细节预设)
TrinArt 2022 艺术风格预设负面提示:复古风格,1980s,1990s,2000s,2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
TrinArt 更多细节预设负面提示:平涂色块,平涂阴影
建议添加已知的负面提示集以稳定解剖结构,例如:畸形手部,缺指等。
致谢
-
Sta,AI Novelist 开发者 (https://ai-novel.com/) @ Bit192, Inc.
Twitter https://twitter.com/naclbbr(日语)https://twitter.com/naclbbre(英语)
-
稳定扩散 - Rombach, Robin 和 Blattmann, Andreas 以及 Lorenz, Dominik 和 Esser, Patrick 和 Ommer, Bjorn
许可证
CreativeML OpenRAIL-M