pipeline_tag: 文生图
widget:
- text: >-
黑色蓬松华丽而危险的猫科动物,橙黄色大眼睛,毛茸茸的大耳朵,锐利凝视,满月背景,暗黑氛围,极致画质,超精细细节
output:
url: assets/final_output_00875_.png
- text: >-
(印象派现实主义风格 by csybgh),50多岁男性银行从业者,染黑的短卷发稀疏,亚非混血血统,喋喋不休却疏于倾听,沉湎过去,身着西装,散发独特魅力,古铜肤色,深夜酒吧抽烟作态,啜饮梅子酒微醺,大师级作品,8K分辨率,超精细刻画,烟雾氤氲氛围,完美手部与手指细节
output:
url: assets/final_output_00886_.png
- text: >-
高品质像素艺术,太空朋克蒸汽朋克风格的动漫太空少女剪影,躺在宇宙飞船窗边的床榻抽烟,带粗犷质感。画面应体现史诗级肖像与双重曝光技法,透过窗户可见孤寂的太空景观。主色调需充满动态张力与激烈动感,巧妙运用负空间。整体为像素艺术风格,突出角色轮廓,白色背景衬托。剪影效果
output:
url: assets/final_output_00871_.png
- text: >-
画面描绘一位蓄着白色长须髯的老者,严肃表情透露出智者的阅历。其醒目的胡须增添了威严气质。面部特写镜头强化了五官特征与凝视的穿透力。
output:
url: assets/final_output_00895_.png
- text: >-
超近距肖像,动态抓拍,幽暗泛白的原野,玻璃花卉,污渍痕迹,太空废土风格,身着橄榄绿旧棉袍的圣女贞德,手持纤细银剑,科幻氛围,脏污噪点,复古僧侣风格,极致细节,高清画质
output:
url: assets/final_output_00902_.png
- text: >-
柯达电影胶片风格剧照:(锐利细节)荣获奥斯卡最佳摄影奖的影片,日本地铁上伫立的和服女子,柯达电影胶片质感,浅景深,暗角晕影,极致细节,高预算制作,焦外虚化,宽银幕比例,情绪化,史诗感,惊艳绝伦,胶片颗粒感
output:
url: assets/final_output_00906_.png
- text: >-
1980年代动漫风格角色肖像
output:
url: assets/final_output_00916_.png
- text: (("Proteus"):文字标志:1)
output:
url: assets/final_output_00923_.png
license: apache-2.0
<画廊组件 />
ProteusV0.5
ProteusV0.5是我开发的AI图像生成模型的最新完整版本,作为OpenDalleV1.1的进阶升级版,在写实表现、提示词理解及多元风格处理能力上均有显著提升。
关于Proteus
本模型基于OpenDalleV1.1核心架构进行强化,主要突破体现在提示响应灵敏度与创意表现力的提升。通过精选无版权图库素材与高质量AI生成图像对的精细调校,实现了性能飞跃。
V0.5核心升级:
高级定制CLIP集成:
- 采用精心训练的自定义CLIP模型
- 经长期迭代开发
- 专为Proteus和Prometheus特性优化
- 贡献模型90%的性能提升
- 需设置clip skip=2以获得最佳效果
风格化能力精进:
训练数据集扩容:
创意与精确度平衡:
- 修正过往"过度风格化"倾向
- 优化提示词与生成结果的匹配度
技术背景
Proteus作为OpenDalleV1.1的增强版,通过约22万张GPTV标注的无版权图库素材(含部分动漫)进行标准化训练,并采用DPO(直接偏好优化)技术对1万组精选AI图像对进行调校。通过独立训练多个LORA(低秩自适应)模型并动态集成,实现了面部细节与肌肤质感的突破性提升,同时保持超现实主义、动漫及卡通风格的卓越表现力。
训练参数
总训练数据:超40万张图像
基础训练:约22万张GPTV标注无版权素材(含动漫)
增补训练:精选写实图像
优化方式:1万组AI图像对DPO调校
LORA模型:独立训练后选择性集成
性能提升
- 面部微结构与肌肤纹理增强
- 超现实/动漫/卡通风格表现力优化
- 定制CLIP带来的提示理解飞跃
- 扩展数据集实现的多元精准输出
- 创意与精确度的黄金平衡
推荐参数
Clip Skip: 2
CFG Scale: 7
步数: 25-50
采样器: DPM++ 2M SDE
调度器: Karras
分辨率: 1024x1024
内置定制CLIP是本模型的显著特色,该设计在同类产品中极为罕见。尽情体验正式发布的ProteusV0.5吧!
搭配🧨 diffusers使用
import torch
from diffusers import (
StableDiffusionXLPipeline,
KDPM2AncestralDiscreteScheduler,
AutoencoderKL
)
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix",
torch_dtype=torch.float16
)
pipe = StableDiffusionXLPipeline.from_pretrained(
"dataautogpt3/ProteusV0.5",
vae=vae,
torch_dtype=torch.float16
)
pipe.scheduler = KDPM2AncestralDiscreteScheduler.from_config(pipe.scheduler.config)
pipe.to('cuda')
prompt = "沙滩上戴太阳镜的猫咪"
negative_prompt = ""
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
guidance_scale=7,
num_inference_steps=50,
clip_skip=2
).images[0]
image.save("生成图像.png")