许可协议:其他
标签:
Cool Japan Diffusion 2.1.1 Beta 模型卡片

重要通知:中国将对图像生成AI实施法律限制(面向中国境内用户的警示)
英文版请见此处。
简介
Cool Japan Diffusion(学习版)是基于Stable Diffusion微调的模型,专注于表现动漫、漫画、游戏等“酷日本”文化内容。注:本模型与日本内阁府的“酷日本”战略无直接关联。
许可说明
本模型在原始许可协议CreativeML Open RAIL++-M License基础上追加了非商业用途限制条款,以避免对创意产业造成潜在负面影响。若此担忧消除,后续版本将恢复原始许可并开放商用。原始协议日文译本参见此链接。商业机构用户请咨询法务部门,个人爱好者遵循常识使用即可。根据协议要求,任何模型修改版本仍需继承本许可条款。
法律与伦理
- 法律依据:本模型在日本开发,适用日本法律。
- 训练过程依据《著作权法》第30条之4主张合法性。
- 分发行为不构成直接或间接侵权(详见柿沼律师观点)。
- 伦理声明:
作者认为未经著作权人许可的分发行为存在伦理争议,但法律层面与搜索引擎类似无需授权。本次分发亦包含伦理研究目的。生成内容需遵守各国法律法规。
使用方法
模型详情
- 开发者:Robin Rombach, Patrick Esser, Alfred Increment
- 类型:基于扩散模型的文本生成图像模型
- 语言:日语
- 许可:CreativeML Open RAIL++-M-NC License
- 算法:潜在扩散模型 + OpenCLIP-ViT/H
使用示例
Web UI方式
参照操作手册配置。
Diffusers库方式
from diffusers import StableDiffusionPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/cool-japan-diffusion-2-1-1-beta"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe.to("cuda")
prompt = "动漫风格,穿和服的红瞳黑短发少女肖像,全彩插画,官方艺术,4K高清"
negative_prompt = "变形、模糊、结构错误、多肢体、低质量、手部瑕疵等负面特征描述"
image = pipe(prompt, negative_prompt=negative_prompt, width=512, height=512, num_inference_steps=20).images[0]
image.save("girl.png")
优化建议:
- 使用xformers加速
- 低显存设备启用
pipe.enable_attention_slicing()
适用场景
- AI艺术比赛(需完整披露训练数据)
- 新闻报道(含商业媒体)
- 日本文化海外推广
- 学术研究与教育(毕业设计/论文)
- 个人创意表达
禁止用途
- 伪造数字艺术品(尤其避免公开已有角色)
- 未经授权的图像转译
- 色情内容传播
- 虚假新闻制作
- 直接商业服务
模型局限性
- 存在与Stable Diffusion相似的偏差问题
- 性能边界尚不明确
训练数据
- VAE部分:60万组合规日本本土数据(经扩增处理)
- U-Net部分:80万组文本-图像对
训练配置
- 硬件:RTX 3090
- 优化器:AdamW
- 批次大小:1
- 累计梯度:1
环境影响
参考文献
@InProceedings{Rombach_2022_CVPR,
author = {Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bj\"orn},
title = {High-Resolution Image Synthesis With Latent Diffusion Models},
booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2022},
pages = {10684-10695}
}
本卡片基于Stable Diffusion v2模板由Alfred Increment撰写