许可证:其他
标签:
Cool Japan Diffusion 2.1.2 Beta 模型说明

注意事项:中国将对图像生成的人工智能实施法律限制。(针对中国境内用户的提醒)
英文版请见此处。
简介
Cool Japan Diffusion 是基于 Stable Diffusion 微调的模型,专注于表现动漫、漫画、游戏等“酷日本”文化。请注意,此模型与日本内阁府的“酷日本”战略无直接关联。
许可证说明
本模型在原有 CreativeML Open RAIL++-M 许可证基础上,新增了“禁止商业用途”条款(例外情况除外)。这一限制源于对创意产业潜在负面影响的担忧。若此担忧消除,后续版本将恢复原许可证并允许商业使用。
原许可证的日文翻译可参考此链接。营利企业用户请咨询法务部门,个人用户遵循常识即可。根据许可证要求,任何模型修改仍需继承此许可证。
法律与伦理
本模型在日本开发,适用日本法律。
- 合法性声明:模型训练基于《著作权法》第30条之4,主张合法;模型分发不构成直接或间接侵权(详见柿沼律师的观点)。
- 伦理争议:作者认为未经原著作者许可的分发行为存在伦理问题,但法律上无需授权(类似搜索引擎)。本次分发亦旨在探讨伦理边界。
使用方法
快速体验请使用此Space。
详细教程见使用手册。
模型下载地址:点击此处。
模型详情
使用示例
Web UI
推荐启用 --xformers --disable-nan-check
选项(或 --no-half
)。具体设置参考手册。
Diffusers
安装库后运行以下脚本:
from diffusers import StableDiffusionPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/cool-japan-diffusion-2-1-2-beta"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float32)
pipe.to("cuda")
prompt = "动漫, 杰作, 少女肖像, 精致瞳孔, 4K, 细节丰富"
negative_prompt = "变形, 模糊, 结构错误, 瞳孔异常..."
image = pipe(prompt, negative_prompt=negative_prompt, num_inference_steps=20).images[0]
image.save("girl.png")
提示:
- 使用 xformers 加速;
- 低显存设备启用
pipe.enable_attention_slicing()
。
适用场景
- 竞赛:如AI艺术大奖赛(需公开训练数据);
- 媒体报道:允许营利机构报道AI技术;
- 文化推广:向海外介绍“酷日本”文化;
- 研发:模型微调、性能评估等;
- 教育:学术研究或课堂教学;
- 个人表达:社交媒体创作。
禁止用途
- 伪造事实内容;
- 营利性视频内容;
- 直接商用服务;
- 损害创意产业的行为。
风险提示
- 数字伪造:禁止生成受版权保护的角色;
- 侵权使用:未经许可的Image-to-Image;
- 不当内容:违反刑法第175条;
- 虚假信息:避免制造假新闻。
局限性
- 存在与Stable Diffusion相同的偏差问题。
训练数据
- VAE:65万组合规日本数据(经扩增);
- U-Net:200万组数据 + 合并模型(Open RAIL许可)。
训练配置
- 硬件:RTX 4090, A6000;
- 优化器:AdamW;
- 批次大小:1。
环境影响
参考文献
@InProceedings{Rombach_2022_CVPR,
author = {Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bj\"orn},
title = {High-Resolution Image Synthesis With Latent Diffusion Models},
booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2022},
pages = {10684-10695}
}
*本模型卡基于Stable Diffusion v2编写,由Alfred Increment完成。