许可协议:apache-2.0
标签:
- unsloth
- 无审查
- 文本生成推理
- transformers
- unsloth
- llama
- trl
- 角色扮演
- 对话式
数据集:
- iamketan25/roleplay-instructions-dataset
- N-Bot-Int/Iris-Uncensored-R1
- N-Bot-Int/Moshpit-Combined-R2-Uncensored
- N-Bot-Int/Mushed-Dataset-Uncensored
- N-Bot-Int/Muncher-R1-Uncensored
- N-Bot-Int/Millia-R1_DPO
语言:
- 英语
基础模型:
- N-Bot-Int/MiniMaid-L1
任务标签:文本生成
库名称:peft
评估指标:
- 角色一致性

MiniMaid-L2
-
MiniMaid-L2 是基于 MiniMaid-L1 模型进一步微调的版本,采用了规模更大、质量更高的数据集,专为提升角色扮演能力而优化。该模型还通过知识蒸馏从热门角色扮演模型 NoroMaid-7B-DPO 中提取精华,弥补了原有模型在连贯性和角色扮演表现上的不足。
-
MiniMaid-L2 通过巧妙的蒸馏技术从 NoroMaid 迁移知识,并在 MiniMaid-L1 基础上微调,最终超越了前代模型。虽然牺牲了微乎其微的生成速度,但其表现近乎完美,足以与其他 3B 规模的竞品模型一较高下!
MiniMaid-L1 基础模型开发流程:
-
MiniMaid-L1 通过 DPO(直接偏好优化)和深度微调实现了优异性能。为防止过拟合,我们采用高学习率衰减和随机化技术,避免模型机械记忆。但由于谷歌 Colab 的训练限制,该模型可能在特定任务上表现不稳定或存在欠拟合/过拟合现象。请注意,我们已竭尽所能优化,未来版本将持续改进!
-
MiniMaid-L2 是我们目前最小的模型实例!若您发现任何问题,请随时邮件联系:nexus.networkinteractives@gmail.com
反馈过拟合或改进建议(为未来的 V3 版本)。您可自由调整 LORA 适配器,但请保留本页署名。若扩展其数据集,请遵循伦理准则审慎处理。
-
MiniMaid-L2 的开发者与授权信息:
- 开发者: N-Bot-Int
- 许可协议: apache-2.0
- 父模型来源: unsloth/llama-3.2-3b-instruct-unsloth-bnb-1bit
- 数据集整合工具: Mosher-R1(专有软件)
-
MiniMaid-L1 官方评估得分

- 评估由 ItsMeDevRoland 执行
对比项:
- MiniMaid-L1 GGUFF
- MiniMaid-L2 GGUFF
所有测试采用相同提示词、温度参数和硬件环境(谷歌 Colab),以客观展示模型差异与优势。
- 详情请见下文
🧵 MiniMaid-L2:小身材,大能量——次世代角色扮演助手
她更敏锐、更深刻、更具沉浸感。而这一次?她不仅站稳脚跟——更赢得漂亮。

MiniMaid-L2 在 L1 的坚实基础上更进一步,在一致性、输出长度和沉浸感上全面超越 Hermes、Dolphin 和 DeepSeek 等 3B 量级竞品。
- 💬 角色扮演评估(v1)
- 🧠 角色一致性:0.84
- 🌊 沉浸感:0.47
- 🧮 综合 RP 得分:0.76
- ✏️ 长度得分:1.00
- L2 综合得分比 L1 高 0.25,且在所有核心 RP 指标上碾压顶级 3B 模型。
📊 高效与智能兼备
- 推理耗时:54.2 秒——仍比 Hermes 快 3 倍
- 令牌生成速度:6.88 个/秒——消费级显卡即可实时响应
- BLEU/ROUGE-L:n-gram 匹配度优于所有 3B 对手
MiniMaid-L2 证明:经过恰当训练的蒸馏模型可以超越庞然大物——即便是 1B 规模也能称王。
- 🛠️ MiniMaid 的专长领域
- 高保真 RP 生成
- 低延迟系统
- 定制化角色叙事
🌱 L2 是转折点——升级的条件控制、更牢固的角色锚定和叙事感知输出,让她快速进化。
“MiniMaid-L2 不仅以小博大——更在夺取桂冠。更紧凑的模型、更强的性能,却仍能轻松在低配设备运行。角色扮演从此更聪明。”
-
使用须知
- 推荐参数设置
- 温度 1.5,min_p = 0.1,max_new_tokens = 128
-
详细参数卡
-
参数量
- 10 亿参数
- (运行前请确认您的 GPU 是否支持 1B 模型)
-
微调工具:
-
Unsloth AI
- 该 llama 模型通过 Unsloth 和 Huggingface 的 TRL 库实现了 2 倍训练加速。

-
微调平台:
-
谷歌 Colab