extra_gated_prompt: 从此页面下载该模型需要提供您在Hugging Face注册的信息。这些信息将用于指导您如何使用图像生成AI。 To download this model from this page, you need to provide information registered with Hugging Face. The information provided will be used to guide you on how to utilize the image-generation AI.
license: openrail++
tags:
- stable-diffusion
- text-to-image
inference: false
library_name: diffusers
Emi 模型卡片
原始PNG文件
英文版: 点击此处
简介
Emi(Ethereal master of illustration)是一款由AI Picasso公司开发的专注于AI艺术的图像生成AI,采用了最先进的H100开发设备和Stable Diffusion XL 1.0图像生成技术。该模型的特点之一是未使用Danbooru等网站上的未经授权转载图像进行训练。
许可证说明
与以往不同,本模型采用CreativeML Open RAIL++-M License,因此允许商业用途。这一决定基于以下原因:
- 随着图像生成AI的普及,遵守规则的人越来越多,以减少对创意行业的负面影响。
- 其他图像生成AI已允许商业用途,非商业许可证的实际效力逐渐减弱。
使用方法
您可以通过此处使用演示版本。如需正式使用,请从此处下载模型。如果标准版生成效果不佳,请尝试使用稳定版。
简单作品示例

正向提示词: anime artwork, anime style, (1girl), (black bob hair:1.5), brown eyes, red maples, sky, ((transparent))
负向提示词: (embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand

正向提示词: monochrome, black and white, (japanese manga), mount fuji
负向提示词: (embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand

正向提示词: (1man), focus, white wavy short hair, blue eyes, black shirt, white background, simple background
负向提示词: (embedding:unaestheticXLv31:0.5), photo, deformed, realism, disfigured, low contrast, bad hand
模型输出优化建议
- 如需确保生成动漫风格插图,请在提示词开头添加“anime artwork, anime style”。
- 在提示词中加入“transparent”可使画风更接近现代风格。
- 绘制全身(full body)时可能效果不佳,此时建议使用稳定版。
- 可用提示词与Waifu Diffusion相同,也可像Stable Diffusion一样使用。
- 建议在负向提示词中使用Textual Inversion。
- 由于手部表现不稳定,建议与DreamShaper XL1.0等写实模型合并使用。
- 使用ChatGPT优化提示词可突破创作局限。
- 使用最新ComfyUI中的FreeU节点或Web UI扩展并设置以下参数可进一步提升输出质量。下图是使用FreeU的示例:
- b1 = 1.1, b2 = 1.2, s1 = 0.6, s2 = 0.4 报告

法律声明
本模型在日本开发,适用日本法律。模型训练基于《著作权法》第30条之4,主张其合法性。模型分发行为根据《著作权法》和《刑法》第175条,主张不构成正犯或帮助犯。详情请参阅柿沼律师的观点。请注意,根据许可证要求,模型生成内容需遵守相关法律法规。
联系方式
support@aipicasso.app
以下是标准模型卡片的中文翻译。
模型详情
@misc{podell2023sdxl,
title={SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis},
author={Dustin Podell and Zion English and Kyle Lacey and Andreas Blattmann and Tim Dockhorn and Jonas Müller and Joe Penna and Robin Rombach},
year={2023},
eprint={2307.01952},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
模型使用示例
使用方法与Stable Diffusion XL 1.0相同。提供三种典型方案:
- ComfyUI
- Fooocus
- Diffusers
ComfyUI或Fooocus
与Stable Diffusion XL 1.0相同,使用safetensor格式的模型文件。具体安装方法请参考此文章。
Diffusers
使用🤗的Diffusers库。
首先安装必要库:
pip install invisible_watermark transformers accelerate safetensors diffusers
运行以下脚本生成图像:
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
import torch
model_id = "aipicasso/emi"
scheduler = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionXLPipeline.from_pretrained(model_id, scheduler=scheduler, torch_dtype=torch.float16)
pipe = pipe.to("cuda")
prompt = "1girl, sunflowers, brown bob hair, brown eyes, sky, transparent"
images = pipe(prompt, num_inference_steps=20).images
images[0].save("girl.png")
复杂操作请参考演示源代码。
预期用途
- 插画/漫画/动画的辅助创作(商用/非商用均可)
- 与委托创作者沟通时的参考
- 图像生成服务的商业提供(需注意生成内容合规性)
- 自我表达(通过AI展现个人风格)
- 研发:
- Discord上的模型应用(提示词工程/微调/模型合并)
- 通过FID等指标评估模型性能
- 通过校验和或哈希函数验证模型独立性
- 教育:
- 艺术院校学生毕业创作
- 大学生论文或课题研究
- 教师讲解图像生成AI现状
- Hugging Face社区列出的用途(需用日语或英语提问)
非预期用途
- 以事实形式呈现虚构内容
- 干扰教学秩序的行为
- 其他对创意行业产生负面影响的行为
禁止用途及恶意用途
- 不得用于洗钱活动
- 不得公开数字伪造品(可能违反《著作权法》)
- 不得未经授权对他人作品进行图生图(可能违反《著作权法》)
- 不得传播淫秽物品(可能违反《刑法》第175条)
- 不得捏造事实(可能构成妨碍业务罪)
模型局限性及偏差
局限性
扩散模型和大语言模型仍存在大量未知领域,其局限性尚未完全明确。
偏差
扩散模型和大语言模型仍存在大量未知领域,其偏差特性尚未完全明确。
训练
训练数据
- 从类似Stable Diffusion的数据集中手动筛选约2000张图像(剔除Danbooru未授权转载内容)
- 从类似Stable Diffusion的数据集中自动筛选约50万张图像(剔除Danbooru未授权转载内容)
训练过程
评估结果
期待第三方评估报告。
环境影响
- 硬件类型: H100
- 训练时长(小时): 500
- 训练地点: 日本
参考文献
@misc{podell2023sdxl,
title={SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis},
author={Dustin Podell and Zion English and Kyle Lacey and Andreas Blattmann and Tim Dockhorn and Jonas Müller and Joe Penna and Robin Rombach},
year={2023},
eprint={2307.01952},
archivePrefix={arXiv},
primaryClass={cs.CV}
}