Qwen3-4B-rpg-roleplay开源角色扮演对话模型 - 生成贴合角色的连贯对白

首页

Qwen3 4B Rpg Roleplay

由 Chun121 开发

基于千问3-4B模型微调的角色扮演对话模型，擅长生成符合角色特征的连贯对话

大型语言模型英语开源协议:Apache-2.0 #角色对话微调 #LoRA高效适配 #奇幻RPG专用

下载量 1,657

发布时间 : 4/30/2025

模型简介

该模型通过LoRA微调技术优化了角色对话生成能力，特别适合用于游戏、互动叙事等需要角色驱动的场景。

模型特点

角色一致性保持

能够生成符合角色特征的对话，保持人设一致性

情境感知对话

根据场景上下文生成身临其境的叙事回应

高效微调技术

采用LoRA微调和4比特量化技术，实现高效训练

多格式支持

提供4比特(bnb)、GGUF等多种量化格式选择

模型能力

角色对话生成

剧情互动

多轮对话维持

情感语境响应

使用案例

游戏开发

NPC对话系统

为游戏中的非玩家角色生成个性鲜明的对话

提升游戏沉浸感和角色真实感

互动叙事

角色驱动型故事

创建基于角色互动的动态叙事体验

增强用户参与度和故事可变性

🚀 Qwen3-4B角色扮演LoRA

让角色在对话中鲜活起来

用自然、引人入胜的对话赋予你的数字伙伴生命

🚀 快速开始

Hugging Face Transformers

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Load model with 4-bit quantization for efficiency
tokenizer = AutoTokenizer.from_pretrained("chun121/qwen3-4b-roleplay-lora")
model = AutoModelForCausalLM.from_pretrained(
    "chun121/qwen3-4b-roleplay-lora",
    torch_dtype=torch.float16,  # Use float16 for faster inference
    device_map="auto"           # Automatically choose best device
)

# Create a character-focused prompt
character_prompt = """
Character: Elara, an elven mage with centuries of knowledge but little patience for novices
Setting: The Grand Library of Mystral
Context: A young apprentice has asked for help with a difficult spell

User: Excuse me, I'm having trouble with the fire conjuration spell. Could you help me?

Elara:
"""

# Generate response
inputs = tokenizer(character_prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
    inputs["input_ids"],
    max_new_tokens=200,
    temperature=0.7,
    top_p=0.9,
    do_sample=True
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

使用GGUF模型

如果你正在使用带有llama.cpp的GGUF导出文件：

# Example command for Q4_K_M quantization
./llama -m chun121-qwen3-4b-roleplay-lora.Q4_K_M.gguf -p "Character: Elara, an elven mage..." -n 200

✨ 主要特性

欢迎，各位创作者！我是Chun（@chun121），我对令人印象深刻的Qwen3 - 4B模型进行了微调，使其在基于角色的对话和角色扮演场景中表现出色。无论你是在制作沉浸式游戏、构建交互式讲故事平台，还是开发以角色为驱动的人工智能体验，这个模型都将帮助你的角色说话时展现出个性、连贯性和深度。

这个LoRA适配版本在保持基础模型智能的同时，增强了以下能力：

保持一致的角色人设
生成反映角色特征的真实对话
创建沉浸式的叙事回复
在整个对话中记住上下文

📦 安装指南

文档中未提及安装步骤，故跳过此章节。

💻 使用示例

基础用法

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Load model with 4-bit quantization for efficiency
tokenizer = AutoTokenizer.from_pretrained("chun121/qwen3-4b-roleplay-lora")
model = AutoModelForCausalLM.from_pretrained(
    "chun121/qwen3-4b-roleplay-lora",
    torch_dtype=torch.float16,  # Use float16 for faster inference
    device_map="auto"           # Automatically choose best device
)

# Create a character-focused prompt
character_prompt = """
Character: Elara, an elven mage with centuries of knowledge but little patience for novices
Setting: The Grand Library of Mystral
Context: A young apprentice has asked for help with a difficult spell

User: Excuse me, I'm having trouble with the fire conjuration spell. Could you help me?

Elara:
"""

# Generate response
inputs = tokenizer(character_prompt, return_tensors="pt").to(model.device)
outputs = model.generate(
    inputs["input_ids"],
    max_new_tokens=200,
    temperature=0.7,
    top_p=0.9,
    do_sample=True
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

高级用法

# Example command for Q4_K_M quantization
./llama -m chun121-qwen3-4b-roleplay-lora.Q4_K_M.gguf -p "Character: Elara, an elven mage..." -n 200

📚 详细文档

局限性

上下文窗口限制为512个标记。
在非常长的对话中偶尔可能会“忘记”角色特征。
训练数据集主要集中在奇幻/RPG情境。
作为LoRA微调模型，继承了基础Qwen3 - 4B模型的局限性。

致谢

特别感谢：

Qwen团队提供了出色的基础模型。
PJMixers - Dev提供了高质量的数据集。
Unsloth团队让高效微调变得可行。
HuggingFace社区的持续支持。

反馈与联系

我很想了解这个模型在你的项目中的使用情况！欢迎：

在HuggingFace仓库中提出问题。
在HuggingFace上与我联系 @chun121。
分享你使用此模型创建的角色示例。

🔧 技术细节

属性	详情
基础模型	Qwen3-4B
架构	基于Transformer的大语言模型，采用LoRA适配
参数数量	40亿（基础模型）+ LoRA参数
量化选项	4位（bnb），GGUF格式（Q8_0、F16、Q4_K_M）
训练框架	Unsloth & TRL
上下文长度	512个标记
开发者	Chun
许可证	Apache 2.0

这个LoRA模型是在免费的Google Colab T4 GPU上使用高效量化技术进行训练的，以充分利用有限的资源：

数据集：PJMixers-Dev/Gryphe-Aesir-RPG-Charcards-Opus-Mixed-split
LoRA配置：
- 秩：16
- 阿尔法：32
- 目标模块：针对角色对话生成进行了优化
训练超参数：
- 批量大小：8
- 梯度累积步数：4
- 学习率：使用余弦调度器，学习率为1e - 4
- 最大步数：200
- 精度：FP16/BF16（自动检测）
- 打包：启用以实现高效训练
- QLoRA：通过bitsandbytes进行4位量化