许可证:其他
标签:
- stable-diffusion
- text-to-image
小部件示例:
- 文本:"动漫,黑发红眼的美丽少女,和服,4K高清,细节丰富"
示例标题:"少女(动漫)"
- 文本:"漫画,黑白风格,白色长发的可爱女孩"
示例标题:"少女(漫画)"
- 文本:"动漫,东京建筑群,4K高清,细节丰富"
示例标题:"建筑(动漫)"
- 文本:"漫画,黑白风格,东京建筑群,超高细节"
示例标题:"建筑(漫画)"
学习用酷日本扩散模型2.0 模型卡片

重要通知:自2023年1月10日起,中国将对图像生成AI实施法律限制(针对中国境内用户的警示)
本模型主要面向日本用户发布,因此模型文档以日语撰写。在获得日本用户共识后,我们将为海外用户提供英文翻译文档。感谢您的理解与合作。(致非日语使用者)
简介
学习用酷日本扩散模型是通过对Stable Diffusion进行微调,专为插画优化的模型。最初是为训练"酷日本扩散"模型而开发,现因特殊情况紧急发布。注:本模型与日本内阁府"酷日本战略"无直接关联。
许可证说明
基于原始许可证CreativeML Open RAIL++-M License,新增了非商业用途限制条款。此限制源于对创意产业潜在负面影响的担忧。若该担忧消除,后续版本将恢复原始许可证并允许商用。原始许可证日文译本参见此处。商业机构用户请咨询法务部门,个人用户遵循常识即可。根据许可证要求,任何模型修改都需继承本许可证。
法律与伦理
本模型在日本开发,适用日本法律。
- 训练依据:《著作权法》第30条之4,主张合法性
- 分发依据:主张不构成《著作权法》或《刑法》第175条的直接/间接侵权,详见柿沼律师的法律意见
- 生成内容需遵守各国法律法规
但开发者认为模型分发行为存在伦理争议,本次发布也旨在收集伦理层面的反馈。
使用方法
快速体验:右侧文本框输入提示词生成。或访问F君的演示空间
专业使用:阅读注意事项后参考使用指南,教程详见此处
模型详情
- 开发者:Robin Rombach, Patrick Esser, Alfred Increment
- 类型:基于扩散模型的文生图模型
- 语言:日语
- 许可证:CreativeML Open RAIL++-M-NC License
- 算法:潜在扩散模型 + OpenCLIP-ViT/H
使用方式
Web UI
参照此指南配置
Diffusers库
安装依赖:
pip install --upgrade git+https://github.com/huggingface/diffusers.git transformers accelerate scipy
生成脚本:
from diffusers import StableDiffusionPipeline
import torch
model_id = "alfredplpl/cool-japan-diffusion-for-learning-2-0"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16).to("cuda")
image = pipe("动漫,黑发红眼的和服少女,4K细节", height=512, width=512).images[0]
image.save("girl.png")
优化提示:
- 使用xformers加速
- 低显存设备启用
pipe.enable_attention_slicing()
预期用途
- AI艺术大赛投稿(需完整披露训练数据并通过审查)
- 新闻报道(包括商业媒体)
- "酷日本"文化推广
- 研发(DreamBooth微调/模型融合等)
- 教育(艺术院校毕业设计/AI教学)
- 个人创作表达
禁止用途
- 伪造事实性内容
- 盈利性视频内容
- 直接商业服务
- 干扰教学秩序
- 损害创意产业
局限性
- 存在与Stable Diffusion相同的性别/种族偏差
- 可能生成拟真图像(需注意)
训练数据
- 20万张通过Twitter API获取的动漫/漫画图像
性能指标
模型 |
CLIP Score |
Waifu Diffusion v1.3 |
33.9 |
本模型 |
34.8 |
FID对比结果:

环境影响
- 硬件:RTX 3090
- 训练时长:300小时
- 碳排放:可忽略
参考文献
@InProceedings{Rombach_2022_CVPR,
author = {Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bj\"orn},
title = {High-Resolution Image Synthesis With Latent Diffusion Models},
booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2022},
pages = {10684-10695}
}
*本卡片基于Stable Diffusion v2模板,由Alfred Increment撰写