标签:
- 文本生成图像
- LoRA微调
- 模板:扩散模型-LoRA
控件示例:
- 文本描述: >-
蒸汽船威利风格,黄金时代动画,一位时尚女性行走在东京街头,街道充满温暖发光的霓虹灯和动态城市标识。她穿着黑色皮夹克、红色长裙和黑色靴子,手持黑色手提包。戴着太阳镜和涂着红色口红。她自信而随意地走着。街道湿润反光,形成彩色灯光的镜面效果。众多行人来往穿梭。
参数:
负面提示: >-
色彩过度艳丽,曝光过度,静态画面,细节模糊,字幕干扰,风格化处理,艺术作品感,绘画笔触明显,画面静止感,整体发灰,质量极差,低分辨率,JPEG压缩痕迹明显,丑陋畸形,肢体残缺,多余手指,手部绘制粗糙,面部刻画失真,肢体畸形扭曲,手指粘连,画面停滞感,背景杂乱,三腿畸形,背景人群密集,逆向行走
输出:
视频链接: videos/t2v-1.webp
- 文本描述: >-
蒸汽船威利风格,黄金时代动画,特写一只毛茸茸的矮小怪物跪在融化的红色蜡烛旁。氛围充满惊奇与好奇,怪物睁大嘴巴凝视火焰。其姿态表情传递天真顽皮之感,仿佛初次探索周遭世界。暖色调运用与戏剧性灯光进一步强化了画面的温馨氛围。
参数:
负面提示: >-
色彩过度艳丽,曝光过度,静态画面,细节模糊,字幕干扰,风格化处理,艺术作品感,绘画笔触明显,画面静止感,整体发灰,质量极差,低分辨率,JPEG压缩痕迹明显,丑陋畸形,肢体残缺,多余手指,手部绘制粗糙,面部刻画失真,肢体畸形扭曲,手指粘连,画面停滞感,背景杂乱,三腿畸形,背景人群密集,逆向行走
输出:
视频链接: videos/t2v-2.webp
基础模型: Wan-AI/Wan2.1-T2V-14B
触发词: 蒸汽船威利风格,黄金时代动画
许可证: CC0-1.0
流程标签: 文本生成视频
库名称: diffusers
蒸汽船威利LoRA模型
<画廊展示 />
模型说明
本模型基于《蒸汽船威利》影片片段训练,按场景分割并使用Qwen2.5-VL-3B-Instruct生成描述文本。
亦适用于Wan2.1-T2V-1.3B版本。
同步发布于CivitAI平台。
触发词
训练时使用的触发短语为"steamboat willie style"。实际使用中发现结合"golden era animation"黄金时代动画风格描述效果最佳。
Diffusers使用指南
pip install git+https://github.com/huggingface/diffusers.git
import torch
from diffusers.utils import export_to_video
from diffusers import AutoencoderKLWan, WanPipeline
from diffusers.schedulers.scheduling_unipc_multistep import UniPCMultistepScheduler
model_id = "Wan-AI/Wan2.1-T2V-14B-Diffusers"
vae = AutoencoderKLWan.from_pretrained(model_id, subfolder="vae", torch_dtype=torch.float32)
pipe = WanPipeline.from_pretrained(model_id, vae=vae, torch_dtype=torch.bfloat16)
pipe.scheduler = UniPCMultistepScheduler.from_config(
pipe.scheduler.config,
flow_shift=5.0
)
pipe.to("cuda")
pipe.load_lora_weights("benjamin-paine/steamboat-willie-14b")
pipe.enable_model_cpu_offload()
prompt = "蒸汽船威利风格,黄金时代动画,拟人化的猫咪角色脱帽行礼"
negative_prompt = "色彩过度艳丽,曝光过度,静态画面,细节模糊,字幕干扰,风格化处理,艺术作品感,绘画笔触明显,画面静止感,整体发灰,质量极差,低分辨率,JPEG压缩痕迹明显,丑陋畸形,肢体残缺,多余手指,手部绘制粗糙,面部刻画失真,肢体畸形扭曲,手指粘连,画面停滞感,背景杂乱,三腿畸形,背景人群密集,逆向行走"
output = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
height=720,
width=1280,
num_frames=81,
guidance_scale=5.0,
num_inference_steps=32
).frames[0]
export_to_video(output, "output.mp4", fps=16)
模型下载
本模型权重提供Safetensors格式下载。
在文件版本页获取所需文件。