orthogonal-2x7B-v2-base开源文本生成模型 - 免费部署助力多样文本创作

首页

Orthogonal 2x7B V2 Base

由 LoSboccacc 开发

orthogonal-2x7B-v2-base 是一个基于 Mistral-7B-Instruct-v0.2 和 SanjiWatsuki/Kunoichi-DPO-v2-7B 的混合专家模型，专注于文本生成任务。

大型语言模型

Transformers

#多任务推理 #少量样本学习 #角色扮演优化

下载量 80

发布时间 : 1/18/2024

模型简介

该模型结合了两个专家模型的能力，分别擅长角色扮演和聊天任务，通过门控机制动态选择最合适的专家模型进行文本生成。

模型特点

混合专家架构

结合两个7B参数模型的能力，通过门控机制动态选择最适合的专家模型。

多任务优化

针对不同任务（如角色扮演和聊天）使用专门的专家模型，提高生成质量。

高效推理

相比单一大型模型，混合专家架构可以在保持性能的同时提高推理效率。

模型能力

文本生成

对话系统

角色扮演

问答系统

推理任务

使用案例

对话系统

智能聊天助手

用于构建自然流畅的对话系统

在HellaSwag数据集上达到85.69%的准确率

教育

科学问答系统

回答科学相关的问题

在AI2推理挑战赛上达到66.89%的准确率

数学推理

数学问题解答

解决基础数学问题

在GSM8k数据集上达到51.4%的准确率

🚀 orthogonal-2x7B-v2-base

orthogonal-2x7B-v2-base是一个基于特定模型架构的文本生成模型，在多个文本生成任务的数据集上进行了评估，并在Open LLM Leaderboard上展示了其性能。

📚 详细文档

模型信息

属性	详情
基础模型	mistralai/Mistral-7B-Instruct-v0.2
门控模式	hidden（可选值："hidden", "cheap_embed", 或 "random"）
数据类型	bfloat16（输出数据类型，可选值：float32, float16, 或 bfloat16）

专家模型信息

专家模型	正向提示词
SanjiWatsuki/Kunoichi-DPO-v2-7B	"roleplay"
mistralai/Mistral-7B-Instruct-v0.2	"chat"

评估结果

详细任务评估

AI2 Reasoning Challenge (25-Shot)
- 任务类型：文本生成
- 数据集类型：ai2_arc
- 数据集配置：ARC-Challenge
- 数据集分割：测试集
- 少样本数量：25
- 评估指标：归一化准确率（acc_norm），值为 66.89
- 来源：Open LLM Leaderboard
HellaSwag (10-Shot)
- 任务类型：文本生成
- 数据集类型：hellaswag
- 数据集分割：验证集
- 少样本数量：10
- 评估指标：归一化准确率（acc_norm），值为 85.69
- 来源：Open LLM Leaderboard
MMLU (5-Shot)
- 任务类型：文本生成
- 数据集类型：cais/mmlu
- 数据集配置：all
- 数据集分割：测试集
- 少样本数量：5
- 评估指标：准确率（acc），值为 62.65
- 来源：Open LLM Leaderboard
TruthfulQA (0-shot)
- 任务类型：文本生成
- 数据集类型：truthful_qa
- 数据集配置：multiple_choice
- 数据集分割：验证集
- 少样本数量：0
- 评估指标：mc2，值为 66.8
- 来源：Open LLM Leaderboard
Winogrande (5-shot)
- 任务类型：文本生成
- 数据集类型：winogrande
- 数据集配置：winogrande_xl
- 数据集分割：验证集
- 少样本数量：5
- 评估指标：准确率（acc），值为 77.35
- 来源：Open LLM Leaderboard
GSM8k (5-shot)
- 任务类型：文本生成
- 数据集类型：gsm8k
- 数据集配置：main
- 数据集分割：测试集
- 少样本数量：5
- 评估指标：准确率（acc），值为 51.4
- 来源：Open LLM Leaderboard

综合评估指标

指标	值
平均值	68.47
AI2 Reasoning Challenge (25-Shot)	66.89
HellaSwag (10-Shot)	85.69
MMLU (5-Shot)	62.65
TruthfulQA (0-shot)	66.80
Winogrande (5-shot)	77.35
GSM8k (5-shot)	51.40