Supermario-v2开源文本生成模型 - 免费使用，基于多模型合并能力强

首页

Supermario V2

由 jan-hq 开发

supermario-v2是一个基于Mistral-7B-v0.1的合并模型，使用了DARE_TIES方法合并了三个不同的模型，具备较强的文本生成能力。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #多任务文本生成 #高推理准确率 #少量样本适配

下载量 77

发布时间 : 12/11/2023

模型简介

该模型通过合并OpenHermes-2.5-neural-chat-v3-3-Slerp、MetaMath-Cybertron-Starling和Marcoroni-7B-v3三个模型，提升了在多个文本生成任务上的表现。

模型特点

多模型合并

使用DARE_TIES方法合并了三个高性能模型，综合了各自的优势。

高性能文本生成

在多个文本生成任务上表现出色，如ARC挑战赛、HellaSwag等。

开源免费

模型完全开源且免费，支持本地运行，保障数据隐私。

模型能力

文本生成

推理任务

问答系统

数学问题解答

使用案例

教育

数学问题解答

解答GSM8k数据集中的数学问题

准确率达到72.18%

通用问答

常识推理

回答HellaSwag数据集中的常识问题

准确率达到86.51%

🚀 超级马里奥-v2（Supermario-v2）

超级马里奥-v2是一个文本生成模型，它通过特定的合并方法融合了多个优秀模型的特性，在多个文本生成任务的数据集上展现出了良好的性能，为用户提供了强大且可靠的文本生成能力。

🚀 快速开始

你可以使用 Jan Desktop 在 Mac、Windows 或 Linux 系统上运行此模型。

Jan 是一个开源的、可替代 ChatGPT 的工具，具备以下特性：

💻 完全离线运行：你的对话内容保持私密，仅你可见。
🗂️ 开放文件格式：对话和模型设置保存在你的电脑上，可随时导出或删除。
🌐 兼容 OpenAI：在端口 1337 上提供兼容 OpenAI 的本地服务器端点。
🌍 开源且免费：我们公开开发过程，查看我们的 Github。

image/png

✨ 主要特性

多模型融合：该模型使用 DARE_TIES 合并方法，融合了 OpenHermes-2.5-neural-chat-v3-3-Slerp、MetaMath-Cybertron-Starling 和 Marcoroni-7B-v3 三个模型的优势，以 Mistral-7B-v0.1 为基础模型。
多任务表现良好：在多个文本生成任务的数据集上进行了评估，如 AI2 Reasoning Challenge、HellaSwag、MMLU 等，均取得了不错的成绩。

📦 安装指南

暂未提供相关安装步骤。

💻 使用示例

提示模板

ChatML

<|im_start|>system
{system_message}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

System

### System:
{system}
### User:
{user}
### Assistant:

📚 详细文档

模型描述

此模型使用 DARE_TIES 合并方法，从以下 3 个模型合并而来：

基础模型：Mistral-7B-v0.1

该模型的 yaml 配置文件如下：

base_model: mistralai/Mistral-7B-v0.1
dtype: bfloat16
merge_method: dare_ties
models:
- model: mistralai/Mistral-7B-v0.1
- model: Weyaxi/OpenHermes-2.5-neural-chat-v3-3-Slerp
  parameters:
    density: 0.8
    weight: 0.4
- model: Q-bert/MetaMath-Cybertron-Starling
  parameters:
    density: 0.8
    weight: 0.3
- model: AIDC-ai-business/Marcoroni-7B-v3
  parameters:
    density: 0.8
    weight: 0.3
parameters:
  int8_mask: true

关于 Jan

Jan 坚信需要一个开源的 AI 生态系统，并正在构建基础设施和工具，以使开源 AI 能够与专有 AI 在公平的竞争环境中竞争。

Jan 的长期愿景是为未来的机器人构建一个认知框架，这些机器人将成为人类和企业日常生活中实用、有用的助手。

Jan 模型合并器

这是一个用于合并模型的测试项目。

开放大语言模型排行榜评估结果

详细结果可查看此处。

指标	值
平均值	72.34
AI2 推理挑战（25 次少样本）	68.52
HellaSwag（10 次少样本）	86.51
MMLU（5 次少样本）	64.88
TruthfulQA（0 次少样本）	60.58
Winogrande（5 次少样本）	81.37
GSM8k（5 次少样本）	72.18