首页

Wanabi 24b Preview Gguf

由 kawaimasa 开发

专为日语小说创作辅助而微调的大规模语言模型预览版本

大型语言模型日语开源协议:Apache-2.0 #日语小说创作 #长文本生成 #异世界题材

下载量 148

发布时间 : 4/23/2025

模型简介

基于Mistral-Small-24B-Base-2501进行微调，擅长小说构思、基于设定的正文生成和上下文连贯的续写任务

模型特点

小说创作专用

针对日语小说创作进行优化，特别擅长构思生成、正文创作和续写

长上下文支持

支持长达32768 tokens的上下文长度，适合长篇小说创作

多任务支持

可处理构思生成、正文创作和续写三种主要小说创作任务

Project Wannabe集成

与专用GUI应用程序Project Wannabe深度集成，提供更好的创作体验

模型能力

小说构思生成

基于设定的正文生成

上下文连贯的续写

自由创作

元数据处理

使用案例

文学创作

小说构思

根据关键词或部分设定生成完整的小说构思

生成包含标题、关键词、类型、梗概、设定和情节的完整构思

正文创作

根据给定的元数据生成小说正文

生成符合设定和风格的连贯小说正文

续写创作

根据已有正文和设定进行续写

生成上下文连贯、风格一致的续写内容

🚀 wanabi-24B (预览版)

wanabi-24B 是一款专门为小说写作辅助进行微调的大规模语言模型的 预览版。该模型基于 mistralai/Mistral-Small-24B-Base-2501，使用日语小说相关文本数据进行训练。尤其擅长小说创意构思、根据设定生成正文以及按照上下文续写等任务。

🚀 快速开始

此模型强烈建议与专用桌面应用程序 Project Wannabe 配合使用。Project Wannabe 提供了一个图形用户界面（GUI），可充分发挥 wanabi-24B 的能力，无缝支持从创意生成到正文写作以及持续生成（无限生成）等功能。使用 Project Wannabe 时，用户无需关注下文所述的提示词格式，即可轻松利用模型的各项功能。

✨ 主要特性

专注小说创作：针对小说写作的特定需求进行微调，在小说创意构思、正文生成和续写等方面表现出色。
基于强大基础模型：以 mistralai/Mistral-Small-24B-Base-2501 为基础，继承了其广泛的知识和强大的语言理解能力。

📦 安装指南

文档未提及安装步骤，故跳过此章节。

💻 使用示例

基础用法

以下是不同任务的提示词格式示例：

本文生成 (GEN)

有元数据的格式示例：

<s>[INST] 请根据以下信息生成小说正文。

# 标题:
异世界转生后成了野狗这件事

# 关键词:
异世界转生
狗 [/INST] {生成的正文} </s>

无元数据的格式示例：

<s>[INST] 请自由生成一篇小说。 [/INST] {生成的正文} </s>

续文生成 (CONT)

有元数据的格式示例：

<s>[INST] 请根据参考信息续写以下文章。

【正文】

原以为被路人刺死了，没想到转生到异世界成了野狗。

【参考信息】

标题:

异世界转生后成了野狗这件事

关键词:

异世界转生狗放逐

无元数据的格式示例：

<s>[INST] 请续写以下文章。

【正文】

原以为被路人刺死了，没想到转生到异世界成了野狗。

创意生成 (IDEA)

部分有元数据的格式示例：

<s>[INST] 请根据以下信息生成一个完整的小说创意（标题、关键词、体裁、梗概、设定、情节）。

# 关键词:
异世界转生
狗 [/INST] # 标题:
异世界转生后成了野狗这件事

# 关键词:
异世界转生
狗
放逐
恋爱
NTR

# 体裁:
异世界幻想
低魔幻想

# 梗概:
原以为被路人刺死了，没想到转生到异世界成了野狗。起初绝望无比，但被善良的少女收留...

# 设定:
故事背景是一个剑与魔法的中世纪风格异世界。主人公拥有现代知识，却被困在狗的身体里。

# 情节:
与少女相遇 -> 城里的骚乱 -> 主人公特殊能力觉醒 -> 面临放逐危机 -> ... </s>

无元数据的格式示例：

<s>[INST] 请自由生成一个小说创意（标题、关键词、体裁、梗概、设定、情节）。 [/INST] {生成的完整创意} </s>

高级用法

在推理时，建议使用与训练时相同的 mistral_small 模板格式 (<s>[INST] {指令} {输入} [/INST] {输出} </s>)，以获得更好的生成效果。

📚 详细文档

训练详情

基础模型

mistralai/Mistral-Small-24B-Base-2501
- （训练时使用 unsloth/Mistral-Small-24B-Base-2501-bnb-4bit）

训练框架

LLaMA-Factory

训练方法

QLoRA (4-bit)
- lora_rank: 128
- lora_alpha: 256
- lora_dropout: 0
- lora_target: all（所有线性层）
精度：bf16
优化：
- PagedAdamW (8-bit)
- Flash Attention 2
- Unsloth Gradient Checkpointing (use_unsloth_gc: true)
- Liger Kernel (enable_liger_kernel: true)
训练参数：
- learning_rate: 3.0e-5
- lr_scheduler_type: cosine_with_restarts (num_cycles: 5)
- warmup_ratio: 0.03
其他：
- cutoff_len: 32768
- per_device_train_batch_size: 1
- gradient_accumulation_steps: 24