DareBeagle-7B开源大语言模型 - 免费可用在多基准测试表现优异

首页

Darebeagle 7B

由 shadowml 开发

DareBeagle-7B是通过LazyMergekit合并mlabonne/NeuralBeagle14-7B和mlabonne/NeuralDaredevil-7B得到的7B参数大语言模型，在多个基准测试中表现优异。

大型语言模型

Transformers

开源协议:Apache-2.0 #高效文本生成 #多任务推理 #小样本学习

下载量 77

发布时间 : 1/16/2024

模型简介

DareBeagle-7B是一个合并模型，结合了NeuralBeagle14-7B和NeuralDaredevil-7B的优势，专注于文本生成任务，在开放大语言模型排行榜上表现出色。

模型特点

模型合并技术

使用slerp方法合并两个优秀模型，结合了各自优势

高性能表现

在多个基准测试中取得优异成绩，平均得分74.58

灵活的层配置

针对self_attn和mlp层采用不同的合并参数，优化模型性能

模型能力

文本生成

问答系统

推理任务

知识问答

使用案例

教育

知识问答

回答各类学科知识问题

在MMLU测试中准确率65.03

研究

推理任务

解决复杂推理问题

在AI2推理挑战赛中标准化准确率71.67

商业应用

数学问题解决

解决数学计算和推理问题

在GSM8k测试中准确率71.49

🚀 DareBeagle-7B

DareBeagle-7B 是一个融合模型，它使用 LazyMergekit 融合了以下模型，在文本生成任务中展现出了优秀的性能。

🚀 快速开始

安装依赖

!pip install -qU transformers accelerate

代码示例

from transformers import AutoTokenizer
import transformers
import torch

model = "shadowml/DareBeagle-7B"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

✨ 主要特性

DareBeagle-7B 是通过融合以下两个模型得到的：

📦 安装指南

使用以下命令安装所需的库：

!pip install -qU transformers accelerate

💻 使用示例

基础用法

from transformers import AutoTokenizer
import transformers
import torch

model = "shadowml/DareBeagle-7B"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

📚 详细文档

🧩 配置信息

slices:
  - sources:
      - model: mlabonne/NeuralBeagle14-7B
        layer_range: [0, 32]
      - model: mlabonne/NeuralDaredevil-7B
        layer_range: [0, 32]
merge_method: slerp
base_model: mlabonne/NeuralDaredevil-7B
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.45 # fallback for rest of tensors
dtype: float16

Open LLM Leaderboard 评估结果

详细结果可查看此处

指标	值
平均值	74.58
AI2 推理挑战 (25 次少样本学习)	71.67
HellaSwag (10 次少样本学习)	88.01
MMLU (5 次少样本学习)	65.03
TruthfulQA (0 次少样本学习)	68.98
Winogrande (5 次少样本学习)	82.32
GSM8k (5 次少样本学习)	71.49