🚀 Wan2.1-T2V-14B 旧书插画LoRA
本项目是一个基于LoRA(Low-Rank Adaptation)技术的文本到视频模型适配器,它能让你生成具有旧书插画风格的视频。通过在特定数据集上的训练,该适配器为Wan2.1-T2V-14B模型赋予了独特的图像生成能力。
🚀 快速开始
使用Diffusers库
首先,你需要安装diffusers
库:
pip install git+https://github.com/huggingface/diffusers.git
然后,使用以下代码生成视频:
import torch
from diffusers.utils import export_to_video
from diffusers import AutoencoderKLWan, WanPipeline
from diffusers.schedulers.scheduling_unipc_multistep import UniPCMultistepScheduler
model_id = "Wan-AI/Wan2.1-T2V-14B-Diffusers"
vae = AutoencoderKLWan.from_pretrained(model_id, subfolder="vae", torch_dtype=torch.float32)
pipe = WanPipeline.from_pretrained(model_id, vae=vae, torch_dtype=torch.bfloat16)
pipe.scheduler = UniPCMultistepScheduler.from_config(
pipe.scheduler.config,
flow_shift=5.0
)
pipe.to("cuda")
pipe.load_lora_weights("AdamLucek/Wan2.1-T2V-14B-OldBookIllustrations")
pipe.enable_model_cpu_offload()
prompt = "An old book illustration of a dog walking down a path"
negative_prompt = "色调艳丽,过曝,静态,细节模糊不清,字幕,风格,作品,画作,画面,静止,整体发灰,最差质量,低质量,JPEG压缩残留,丑陋的,残缺的,多余的手指,画得不好的手部,画得不好的脸部,畸形的,毁容的,形态畸形的肢体,手指融合,静止不动的画面,杂乱的背景,三条腿,背景人很多,倒着走"
output = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
height=720,
width=1280,
num_frames=81,
guidance_scale=5.0,
num_inference_steps=32
).frames[0]
export_to_video(output, "output.mp4", fps=16)
使用ComfyUI
你可以使用提供的ComfyUI工作流文件 oldbookillustration_workflow.json。
为了快速下载推荐的文本编码器、VAE和Wan2.1文件,请运行以下命令:
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/diffusion_models/wan2.1_t2v_14B_bf16.safetensors
✨ 主要特性
- 特定风格生成:基于Wan-AI/Wan2.1-T2V-14B文本到视频模型,训练出能生成旧书插画风格视频的LoRA适配器。
- 触发词机制:使用
An old book illustration of a
作为触发词,方便快捷地生成所需风格的图像。
📦 安装指南
使用Diffusers库时,通过以下命令安装所需库:
pip install git+https://github.com/huggingface/diffusers.git
💻 使用示例
基础用法
在使用Diffusers库时,按照上述“使用Diffusers库”部分的代码示例,即可生成具有旧书插画风格的视频。
高级用法
你可以根据自己的需求调整代码中的参数,如height
、width
、num_frames
、guidance_scale
和num_inference_steps
等,以获得不同效果的视频。
📚 详细文档
模型描述
本LoRA适配器是为Wan-AI/Wan2.1-T2V-14B文本到视频模型设计的,它在AdamLucek/oldbookillustrations-small数据集的一个子集图像上进行了训练。
触发词
你应该使用An old book illustration of a
来触发图像生成。
下载模型
该模型的权重以Safetensors格式提供。你可以在“Files & versions”标签页中 下载 它们。
📄 许可证
本项目采用MIT许可证。