🚀 Violet_Twilight-v0.2
Violet_Twilight-v0.2 是 Azure_Dusk-v0.2 和 Crimson_Dawn-v0.2 的 SLERP 合并模型,可用于文本生成任务。它支持多种量化版本,在多个评估数据集上有相应表现。

✨ 主要特性
- 多语言支持:支持英语、法语、德语、西班牙语、意大利语、葡萄牙语、俄语、中文和日语。
- 多数据集训练:基于多个数据集进行训练,包括
Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned
、anthracite-org/stheno-filtered-v1.1
等。
- 文本生成能力:适用于文本生成任务。
- 多种量化版本:提供完整版本、exl2 和 gguf 量化版本。
📦 安装指南
文档未提供具体安装步骤,暂不展示。
💻 使用示例
基础用法
v0.2 模型基于 ChatML 进行训练,提示结构如下:
<|im_start|>user
Hi there!<|im_end|>
<|im_start|>assistant
Nice to meet you!<|im_end|>
<|im_start|>user
Can I ask a question?<|im_end|>
<|im_start|>assistant
高级用法
文档未提供高级用法示例,暂不展示。
上下文和指令
v0.2 模型基于 ChatML 进行训练,请使用该上下文和指令模板。
当前顶级采样器设置
🔧 技术细节
合并配置
以下配置用于合并 Azure Dusk 和 Crimson Dawn:
slices:
- sources:
- model: Epiculous/Azure_Dusk-v0.2
layer_range: [0, 40]
- model: Epiculous/Crimson_Dawn-V0.2
layer_range: [0, 40]
merge_method: slerp
base_model: Epiculous/Azure_Dusk-v0.2
parameters:
t:
- filter: self_attn
value: [0, 0.5, 0.3, 0.7, 1]
- filter: mlp
value: [1, 0.5, 0.7, 0.3, 0]
- value: 0.5
dtype: bfloat16
📚 详细文档
评估结果
Open LLM Leaderboard 评估结果
详细结果可查看 此处
指标 |
值 |
平均值 |
18.53 |
IFEval (0-Shot) |
45.32 |
BBH (3-Shot) |
23.94 |
MATH Lvl 5 (4-Shot) |
2.72 |
GPQA (0-shot) |
2.13 |
MuSR (0-shot) |
13.61 |
MMLU-PRO (5-shot) |
23.45 |
📄 许可证
本项目采用 Apache-2.0 许可证。
📋 模型信息
属性 |
详情 |
支持语言 |
英语、法语、德语、西班牙语、意大利语、葡萄牙语、俄语、中文、日语 |
模型类型 |
文本生成 |
训练数据集 |
Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned 、anthracite-org/stheno-filtered-v1.1 、PJMixers/hieunguyenminh_roleplay-deduped-ShareGPT 、Gryphe/Sonnet3.5-Charcard-Roleplay 、Epiculous/Synthstruct-Gens-v1.1-Filtered-n-Cleaned 、anthracite-org/kalo-opus-instruct-22k-no-refusal 、anthracite-org/nopm_claude_writing_fixed 、anthracite-org/kalo_opus_misc_240827 |
合并方法 |
SLERP |
基础模型 |
Epiculous/Azure_Dusk-v0.2 |
数据类型 |
bfloat16 |