首页

L3 SnowStorm V1.15 4x8B B

由 xxx777xxxASD 开发

实验性角色扮演导向的混合专家模型，目标是打造在角色扮演/情感角色扮演任务中表现不逊于或优于Mixtral 8x7B及其微调版本的模型。

大型语言模型

Transformers

英语#混合专家模型 #角色扮演优化 #多专家集成

下载量 26

发布时间 : 5/28/2024

模型简介

Llama 3 SnowStorm v1.15B是一个4x8B架构的混合专家模型，专注于角色扮演和情感角色扮演任务，采用随机选择门控模式，每token使用2个专家。

模型特点

角色扮演优化

专门针对角色扮演和情感角色扮演任务进行优化，性能媲美或超越Mixtral 8x7B

混合专家架构

采用4x8B混合专家架构，每token随机选择2个专家进行推理

多模型融合

融合了4个不同的8B基础模型，包括Poppy_Porpoise、Lumimaid、Soliloquy和Stheno

视觉适配支持

可选配llama3_mmproj视觉适配器，支持多模态输入

模型能力

文本生成

角色扮演对话

情感表达

多轮对话

创意写作

使用案例

娱乐应用

角色扮演游戏

作为游戏NPC的对话引擎，提供丰富的角色互动体验

虚拟伴侣

创建具有情感表达能力的虚拟角色

创意写作

故事生成

辅助作家进行角色设定和对话创作

🚀 Llama 3 SnowStorm v1.15B 4x8B

这是一个面向角色扮演（RP）的实验性混合专家模型（MoE），旨在打造一个在RP/ERP任务中性能等同于或优于Mixtral 8x7B及其微调版本的模型。

⚠️ 重要提示

GGUF

✨ 主要特性

这是一个实验性的面向角色扮演（RP）的混合专家模型（MoE），目标是在RP/ERP任务中达到或超越Mixtral 8x7B及其微调版本的性能。

📚 详细文档

模型版本

v1.15A
v1.15B <- 当前所在版本

模型参数

base_model: Sao10K_L3-8B-Stheno-v3.1
gate_mode: random
dtype: bfloat16
experts_per_token: 2
experts:
  - source_model: Nitral-AI_Poppy_Porpoise-1.0-L3-8B
  - source_model: NeverSleep_Llama-3-Lumimaid-8B-v0.1-OAS
  - source_model: openlynn_Llama-3-Soliloquy-8B-v2
  - source_model: Sao10K_L3-8B-Stheno-v3.1

使用的模型

与SnowStorm v1.0的差异

从 ChaoticNeutrals/Poppy_Porpoise-v0.7-L3-8B 更新到 Nitral-AI/Poppy_Porpoise-1.0-L3-8B
基础模型从 NeverSleep/Llama-3-Lumimaid-8B-v0.1-OAS 更换为 Sao10K/L3-8B-Stheno-v3.1

视觉模型

llama3_mmproj

image/png

提示格式

Llama 3

📄 许可证

该模型使用的许可证为llama3。

🔍 评估结果

Open LLM Leaderboard评估结果

详细结果可查看此处

指标	值
平均值	68.01
AI2推理挑战（25次少样本学习）	60.67
HellaSwag（10次少样本学习）	81.60
MMLU（5次少样本学习）	68.12
TruthfulQA（0次少样本学习）	51.69
Winogrande（5次少样本学习）	76.56
GSM8k（5次少样本学习）	69.45

详细评估信息

任务类型	数据集名称	评估指标	值	来源
文本生成	AI2 Reasoning Challenge (25-Shot)	归一化准确率	60.67	Open LLM Leaderboard
文本生成	HellaSwag (10-Shot)	归一化准确率	81.6	Open LLM Leaderboard
文本生成	MMLU (5-Shot)	准确率	68.12	Open LLM Leaderboard
文本生成	TruthfulQA (0-shot)	mc2	51.69	Open LLM Leaderboard
文本生成	Winogrande (5-shot)	准确率	76.56	Open LLM Leaderboard
文本生成	GSM8k (5-shot)	准确率	69.45	Open LLM Leaderboard