Llama-3.3-70B-Vulpecula-r1开源思维型模型 - 免费部署提升创意写作与角色扮演能力

首页

Llama 3.3 70B Vulpecula R1

由 Sao10K 开发

基于Meta的Llama 3.3-70B-Instruct微调的思维型模型，专注于创意写作和角色扮演能力提升

大型语言模型

Transformers

英语#思维链激活 #创意写作增强 #角色扮演优化

下载量 1,279

发布时间 : 3/20/2025

模型简介

这是一个受Deepseek-R1启发的思维型语言模型，通过SFT和少量RL在创意写作数据上训练，显著提升了指令遵循、角色扮演和创意控制能力

模型特点

思维模式激活

通过在助手回复前添加<think>标签可激活思维模式，增强推理能力

创意写作优化

专门针对创意写作和角色扮演场景进行了优化训练

高质量数据筛选

使用经过严格筛选和重构的半合成对话/角色扮演数据集

多源数据融合

整合了人工标注数据、LLM生成数据和Deepseek-R1的推理轨迹数据

模型能力

指令遵循

角色扮演

创意写作

自然对话

推理思考

使用案例

创意写作

小说创作

协助作者生成创意性文本和故事情节

能够生成连贯且富有创意的叙事文本

角色扮演

模拟不同角色的对话和互动

能够保持角色一致性并生成符合角色特征的对话

对话系统

智能助手

作为智能助手提供自然流畅的对话体验

能够理解复杂指令并给出有逻辑的回应

🚀 🦊 L3.3-70B-Vulpecula 🌸

这是一个由 GradientPutri 和 Sao10K 合作的项目。过去几周，我们满怀热情地投入其中，希望大家会喜欢它。尽管可能存在一些小问题，但最终的成果很不错，能输出令人满意的结果，这也是我们的主要目标。模型卡片由 GradientPutri 制作。

🚀 快速开始

本模型基于 Meta 的 Llama 3.3，使用时需遵循 Llama 3.3 社区许可协议和可接受使用政策。

✨ 主要特性

🌟 这是一个受 Deepseek - R1 启发的基于思考的模型，通过 SFT 和少量 RL 在创意写作数据上进行训练。
🧠 可以在助手回复前加上 <think>\n 来激活思考模式，不过即使不使用思考模式，模型也能很好地工作。
🚀 相较于基础模型，提升了可控性、指令角色扮演能力和创意控制能力。

📚 详细文档

📚 数据集组成

👾 重新制作、清理和过滤了半合成的聊天/角色扮演数据集，去除了重复内容，保证了质量和输出效果。
🎭 对基于人类的自然聊天/角色扮演数据集进行了清理、过滤和质量检查。
📝 从几个不同的大语言模型中收集了多样化的指令数据集，并清理和过滤了拒绝回复和低质量内容。
💭 从 Deepseek - R1 中提取了用于指令、聊天和创意任务的推理痕迹，并进行了质量过滤和清理。
█▓▒ 本项目不需要毒性/去审查数据，模型本身已经具有足够的开放性。

总令牌数：约 2.7 亿令牌（2.1 亿可训练），训练超过 2 个周期。

🎨 格式和采样器

指令格式：Llama - 3 - Instruct

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{input}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

{output}<|eot_id|>
---
Note that newlines are represented within example above

✨ 采样器推荐

temperature: 0.75
min_p: 0.1
Repetition Penalty: 1.1
Presence Penalty: 1.1

⚙️ 训练细节

# Iterations
num_epochs: 2

# Batching - Global Batch 4x GPUs × Batch 2 × 4 Grad_accum = 32
gradient_accumulation_steps: 4
micro_batch_size: 2

# Optimizer
optimizer: paged_ademamix_8bit
lr_scheduler: cosine
learning_rate: 0.00002
max_grad_norm: 1
weight_decay: 0.01

📄 许可证

本模型使用 llama3.3 许可证。

属性	详情
模型类型	基于 Meta 的 Llama 3.3 的改进模型
基础模型	meta - llama/Llama - 3.3 - 70B - Instruct
库名称	transformers

⚠️ 重要提示

虽然我们无法禁止商业使用，但请注意，这是一个使用我们自己的资源、时间和精力完成的项目。我们不希望未来在进行项目模型开发时受到打击。我们恳请商业用户在部署前与我们联系，讨论使用方式和适当的归属问题。我们感谢那些通过告知我们工作的使用情况来帮助维护人工智能生态系统透明度的用户。对于任何合并或衍生作品，也希望能如此。

🦊 感谢访问！愿狐狸为你带来好运！ 🌸