Wan2.1-T2V-14B-OldBookIllustrations开源模型 - 免费生成古书插画风格视频

首页

Wan2.1 T2V 14B OldBookIllustrations

由 AdamLucek 开发

基于Wan2.1-T2V-14B文本转视频模型的LoRA适配器，专门用于生成古书插画风格的视频内容

文本生成视频开源协议:MIT #古书插画风格 #文本转视频 #LoRA微调

下载量 20

发布时间 : 3/31/2025

模型简介

该LoRA适配器通过微调Wan2.1-T2V-14B模型，使其能够生成具有古书插画风格的动态视频内容，适用于艺术创作和历史场景再现等应用

模型特点

古书插画风格转换

专门针对古书插画艺术风格进行优化，可生成具有复古质感的视频内容

LoRA适配器

作为轻量级适配层，可在保持基础模型能力的同时实现特定风格转换

负面提示词优化

提供精心设计的负面提示词模板，有效避免常见生成缺陷

模型能力

文本到视频生成

艺术风格转换

动态场景渲染

使用案例

艺术创作

古书场景动画化

将古书中的静态插图转换为动态场景

示例1.webp中展示的行走的狗

历史场景再现

生成具有历史感的场景动画

示例2.webp中的惊涛拍岸场景

教育应用

植物生长过程展示

以古书风格展示植物生长过程

示例3.webp中的玫瑰盛开过程

🚀 Wan2.1-T2V-14B 旧书插画LoRA

本项目是一个基于LoRA（Low-Rank Adaptation）技术的文本到视频模型适配器，它能让你生成具有旧书插画风格的视频。通过在特定数据集上的训练，该适配器为Wan2.1-T2V-14B模型赋予了独特的图像生成能力。

🚀 快速开始

使用Diffusers库

首先，你需要安装diffusers库：

pip install git+https://github.com/huggingface/diffusers.git

然后，使用以下代码生成视频：

import torch
from diffusers.utils import export_to_video
from diffusers import AutoencoderKLWan, WanPipeline
from diffusers.schedulers.scheduling_unipc_multistep import UniPCMultistepScheduler

model_id = "Wan-AI/Wan2.1-T2V-14B-Diffusers"
vae = AutoencoderKLWan.from_pretrained(model_id, subfolder="vae", torch_dtype=torch.float32)
pipe = WanPipeline.from_pretrained(model_id, vae=vae, torch_dtype=torch.bfloat16)
pipe.scheduler = UniPCMultistepScheduler.from_config(
  pipe.scheduler.config,
  flow_shift=5.0
)
pipe.to("cuda")
pipe.load_lora_weights("AdamLucek/Wan2.1-T2V-14B-OldBookIllustrations")
pipe.enable_model_cpu_offload() # 适用于低显存环境

prompt = "An old book illustration of a dog walking down a path"
negative_prompt = "色调艳丽，过曝，静态，细节模糊不清，字幕，风格，作品，画作，画面，静止，整体发灰，最差质量，低质量，JPEG压缩残留，丑陋的，残缺的，多余的手指，画得不好的手部，画得不好的脸部，畸形的，毁容的，形态畸形的肢体，手指融合，静止不动的画面，杂乱的背景，三条腿，背景人很多，倒着走"
output = pipe(
    prompt=prompt,
    negative_prompt=negative_prompt,
    height=720,
    width=1280,
    num_frames=81,
    guidance_scale=5.0,
    num_inference_steps=32
).frames[0]
export_to_video(output, "output.mp4", fps=16)

使用ComfyUI

你可以使用提供的ComfyUI工作流文件 oldbookillustration_workflow.json。

为了快速下载推荐的文本编码器、VAE和Wan2.1文件，请运行以下命令：

wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/diffusion_models/wan2.1_t2v_14B_bf16.safetensors

✨ 主要特性

特定风格生成：基于Wan-AI/Wan2.1-T2V-14B文本到视频模型，训练出能生成旧书插画风格视频的LoRA适配器。
触发词机制：使用An old book illustration of a作为触发词，方便快捷地生成所需风格的图像。

📦 安装指南

使用Diffusers库时，通过以下命令安装所需库：

pip install git+https://github.com/huggingface/diffusers.git

💻 使用示例

基础用法

在使用Diffusers库时，按照上述“使用Diffusers库”部分的代码示例，即可生成具有旧书插画风格的视频。

高级用法

你可以根据自己的需求调整代码中的参数，如height、width、num_frames、guidance_scale和num_inference_steps等，以获得不同效果的视频。

📚 详细文档

模型描述

本LoRA适配器是为Wan-AI/Wan2.1-T2V-14B文本到视频模型设计的，它在AdamLucek/oldbookillustrations-small数据集的一个子集图像上进行了训练。

触发词

你应该使用An old book illustration of a来触发图像生成。

下载模型

该模型的权重以Safetensors格式提供。你可以在“Files & versions”标签页中下载它们。

📄 许可证

本项目采用MIT许可证。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文