Violet_Twilight-v0.2开源模型 - 免费助力多语言文本生成任务

首页

Violet Twilight V0.2

由 Epiculous 开发

Violet_Twilight-v0.2 是 Azure_Dusk-v0.2 和 Crimson_Dawn-v0.2 的 SLERP 合并模型，支持多语言文本生成任务。

大型语言模型

Safetensors

支持多种语言开源协议:Apache-2.0 #多语言角色扮演 #SLERP混合架构 #ChatML指令优化

下载量 145

发布时间 : 9/12/2024

模型简介

一个多语言文本生成模型，基于 ChatML 训练，适用于角色扮演、指令跟随等多种文本生成场景。

模型特点

多语言支持

支持9种语言的文本生成，包括中文、英文、日文等主要语言。

合并模型优势

通过SLERP方法合并Azure_Dusk和Crimson_Dawn两个模型的优势。

ChatML兼容

基于ChatML训练，提供标准化的对话格式支持。

量化版本

提供完整版、exl2版和gguf版三种量化版本，适应不同部署需求。

模型能力

多语言文本生成

角色扮演对话

指令跟随

创意写作

使用案例

对话系统

角色扮演对话

使用ChatML格式进行角色扮演对话

内容创作

创意写作

生成各种风格的创意文本

🚀 Violet_Twilight-v0.2

Violet_Twilight-v0.2 是 Azure_Dusk-v0.2 和 Crimson_Dawn-v0.2 的 SLERP 合并模型，可用于文本生成任务。它支持多种量化版本，在多个评估数据集上有相应表现。

image/png

✨ 主要特性

多语言支持：支持英语、法语、德语、西班牙语、意大利语、葡萄牙语、俄语、中文和日语。
多数据集训练：基于多个数据集进行训练，包括 Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned、anthracite-org/stheno-filtered-v1.1 等。
文本生成能力：适用于文本生成任务。
多种量化版本：提供完整版本、exl2 和 gguf 量化版本。

📦 安装指南

文档未提供具体安装步骤，暂不展示。

💻 使用示例

基础用法

v0.2 模型基于 ChatML 进行训练，提示结构如下：

<|im_start|>user
Hi there!<|im_end|>
<|im_start|>assistant
Nice to meet you!<|im_end|>
<|im_start|>user
Can I ask a question?<|im_end|>
<|im_start|>assistant

高级用法

文档未提供高级用法示例，暂不展示。

上下文和指令

v0.2 模型基于 ChatML 进行训练，请使用该上下文和指令模板。

当前顶级采样器设置

Smooth Creativity：感谢 Juelsman 的研究！
Variant Chimera：感谢 Numbra！
Spicy_Temp
Violet_Twilight-Nitral-Special

🔧 技术细节

合并配置

以下配置用于合并 Azure Dusk 和 Crimson Dawn：

slices:
  - sources:
      - model: Epiculous/Azure_Dusk-v0.2
        layer_range: [0, 40]
      - model: Epiculous/Crimson_Dawn-V0.2
        layer_range: [0, 40]
merge_method: slerp
base_model: Epiculous/Azure_Dusk-v0.2
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5 # fallback for rest of tensors
dtype: bfloat16

📚 详细文档

评估结果

Open LLM Leaderboard 评估结果详细结果可查看此处

指标	值
平均值	18.53
IFEval (0-Shot)	45.32
BBH (3-Shot)	23.94
MATH Lvl 5 (4-Shot)	2.72
GPQA (0-shot)	2.13
MuSR (0-shot)	13.61
MMLU-PRO (5-shot)	23.45

📄 许可证

本项目采用 Apache-2.0 许可证。

📋 模型信息

属性	详情
支持语言	英语、法语、德语、西班牙语、意大利语、葡萄牙语、俄语、中文、日语
模型类型	文本生成
训练数据集	`Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned`、`anthracite-org/stheno-filtered-v1.1`、`PJMixers/hieunguyenminh_roleplay-deduped-ShareGPT`、`Gryphe/Sonnet3.5-Charcard-Roleplay`、`Epiculous/Synthstruct-Gens-v1.1-Filtered-n-Cleaned`、`anthracite-org/kalo-opus-instruct-22k-no-refusal`、`anthracite-org/nopm_claude_writing_fixed`、`anthracite-org/kalo_opus_misc_240827`
合并方法	SLERP
基础模型	Epiculous/Azure_Dusk-v0.2
数据类型	bfloat16