license: other
tags:
- stable-diffusion
- text-to-image
酷日本扩散2.1.1模型卡片

重要通知:中国将对图像生成AI实施法律限制(面向中国境内用户的警示)
英文版请见此处。
简介
酷日本扩散是基于Stable Diffusion微调而成的模型,专注于表现动漫、漫画、游戏等日本流行文化元素。注:本模型与日本内阁府推行的"酷日本"战略无直接关联。
许可证说明
本模型在CreativeML Open RAIL++-M License原许可基础上新增了非商业用途限制条款。此限制源于对创意产业潜在负面影响的担忧。若该担忧得以消除,后续版本将恢复原许可的商业使用权限。原许可证日文译本可参考此链接。商业机构用户请咨询法务部门,个人爱好者只需遵守常识规范即可。根据许可条款,任何模型修改都需继承本许可证。
法律与伦理声明
本模型开发受日本法律管辖。我们主张:
- 模型训练符合《著作权法》第30条之4
- 模型分发不构成《著作权法》或《刑法》第175条的共犯行为
(详见柿沼律师的法律意见)
但开发者承认未经原作者授权的模型分发存在伦理争议。虽然法律上无需授权(与搜索引擎同理),本次发布也旨在探讨AI技术的伦理边界。生成内容请严格遵守各国法律法规。
使用指南
快速体验请访问演示空间。详细教程见使用手册,模型文件可在此下载。
模型详情
- 开发者: Robin Rombach, Patrick Esser, Alfred Increment
- 类型: 基于潜在扩散模型的文生图系统
- 语言: 日语
- 许可证: CreativeML Open RAIL++-M-NC License
- 技术说明: 采用潜在扩散模型架构与OpenCLIP-ViT/H编码器
使用示例
Web UI方式
参照详细教程配置
Diffusers库方式
安装依赖:
pip install --upgrade git+https://github.com/huggingface/diffusers.git transformers accelerate scipy
生成脚本:
from diffusers import StableDiffusionPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/cool-japan-diffusion-2-1-1"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "动漫风格,杰作,少女肖像,精致瞳孔,4K高清"
negative_prompt="变形模糊、解剖结构错误、面部扭曲、多肢畸形、低画质、文字水印"
images = pipe(prompt,negative_prompt=negative_prompt, num_inference_steps=20).images
images[0].save("girl.png")
优化建议:
- 使用xformers加速
- 低显存设备启用
pipe.enable_attention_slicing()
适用场景
- AI艺术创作比赛(需完整披露训练数据)
- 新闻报道(含商业媒体)
- 日本文化海外推广
- 学术研究(模型微调/混合/性能评估)
- 美术教育(毕业设计/课题研究)
- 个人情感表达
禁止用途
- 伪造事实性内容
- 商业视频内容盈利
- 直接SaaS服务
- 干扰教学秩序
- 损害创意产业的行为
高风险限制
- 禁止制作数字赝品(可能违反《著作权法》)
- 禁止未经授权的图生图改造
- 禁止传播淫秽内容(触犯《刑法》175条)
- 禁止制造虚假新闻
模型局限性
继承Stable Diffusion v2的固有偏差,具体表现有待观察。
训练数据
- VAE部分:60万组合规日本本土图像(经数据增强)
- U-Net部分:100万组合规图文对
训练配置
- 硬件:RTX 3090, A6000
- 优化器:AdamW
- 累计梯度:1
- 批大小:1
环境影响
本卡片基于Stable Diffusion v2模型卡片改编,由Alfred Increment撰写。