simpletuner-finetuned-sd3开源文本生成图像模型

首页

Simpletuner Finetuned Sd3

由 Minh-Ha 开发

基于sd3/unknown-model进行全秩微调的文本生成图像模型，特别优化了病理图像的生成质量。

图像生成开源协议:其他 #病理图像生成 #高分辨率图像 #流匹配优化

下载量 393

发布时间 : 4/29/2025

模型简介

这是一个基于SD3基础模型进行全秩微调的文本生成图像模型，专注于生成照片级真实的病理图像。模型保留了基础模型的文本编码器，仅对图像生成部分进行了微调。

模型特点

病理图像优化

专门针对病理图像进行了微调，能够生成照片级真实的医学图像

高分辨率支持

支持最高1024x1024分辨率的图像生成

BF16优化

使用BF16精度进行训练和推理，平衡性能与质量

流匹配预测

采用流匹配(FlowMatch)预测类型，额外参数shift=3

模型能力

文本生成图像

图像生成图像

高分辨率图像生成

病理图像生成

使用案例

医学影像

病理图像生成

生成照片级真实的病理图像用于医学研究或教育

示例图像展示在模型页面的画廊中

创意设计

高分辨率艺术创作

利用文本提示生成高分辨率创意图像

🚀 simpletuner-finetuned-sd3

这是一个基于 sd3/unknown-model 的全秩微调模型。该模型主要用于文本到图像的生成任务，能够根据输入的文本生成高质量的图像。

🚀 快速开始

此模型是基于 sd3/unknown-model 的全秩微调模型。训练期间使用的主要验证提示为：

A photo-realistic pathology image

✨ 主要特性

文本到图像生成：支持根据输入的文本生成相应的图像。
图像到图像转换：可对输入的图像进行转换。
多种参数设置：提供丰富的训练和验证参数设置。

📦 安装指南

文档未提及安装步骤，暂不提供。

💻 使用示例

基础用法

import torch
from diffusers import DiffusionPipeline

model_id = 'Minh-Ha/simpletuner-finetuned-sd3'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16) # loading directly in bf16

prompt = "A photo-realistic pathology image"
negative_prompt = 'blurry, cropped, ugly'

pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu') # the pipeline is already in its target precision level
model_output = pipeline(
    prompt=prompt,
    negative_prompt=negative_prompt,
    num_inference_steps=20,
    generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
    width=1024,
    height=1024,
    guidance_scale=3.0,
).images[0]

model_output.save("output.png", format="PNG")