Pasta-Lake-7b开源语言模型 - 免费使用强大语言交互功能

首页

Pasta Lake 7b

由 Nitral-Archive 开发

Pasta-Lake-7b 是一个通过合并 Test157t/Pasta-PrimaMaid-7b 和 macadeliccc/WestLake-7B-v2-laser-truthy-dpo 两个模型而创建的7B参数规模的语言模型。

大型语言模型

Transformers

开源协议:其他 #多任务文本生成 #高准确率推理 #少量样本适配

下载量 93

发布时间 : 2/9/2024

模型简介

该模型是一个合并模型，主要用于文本生成任务，在多个基准测试中表现良好。

模型特点

模型合并技术

使用mergekit工具和slerp合并方法，结合了两个不同模型的优势

量化版本支持

提供多种量化版本（exl2和gguf），便于不同硬件环境部署

多任务表现均衡

在文本生成、推理和问答等多个任务上表现均衡

模型能力

文本生成

问答系统

推理任务

知识问答

使用案例

教育

知识问答

可用于教育领域的知识问答系统

在MMLU测试中获得64.41%准确率

研究

基准测试

可用于自然语言处理研究的基准测试

在开放LLM排行榜平均得分73.07

🚀 Pasta-Lake-7b

Pasta-Lake-7b是一个经过模型融合得到的文本生成模型，结合了多个基础模型的优势。该模型在多个文本生成相关的数据集上进行了评估，展现出了较好的性能。

🚀 快速开始

目前文档未提供快速开始的相关内容，若有需要可进一步补充。

✨ 主要特性

基于mergekit进行模型融合，结合了多个基础模型的特点。
提供了多种量化版本，如exl2和GGUF量化，方便不同场景使用。
在多个文本生成数据集上有较好的表现，涵盖推理、常识判断、知识问答等多个领域。

📦 安装指南

目前文档未提供安装步骤相关内容，若有需要可进一步补充。

💻 使用示例

目前文档未提供代码示例，若有需要可进一步补充。

📚 详细文档

合并的模型

以下模型被用于此次融合：

配置信息

以下是用于生成此模型的YAML配置：

slices:
  - sources:
      - model: Test157t/Pasta-PrimaMaid-7b
        layer_range: [0, 32]
      - model: macadeliccc/WestLake-7B-v2-laser-truthy-dpo
        layer_range: [0, 32]
merge_method: slerp
base_model: Test157t/Pasta-PrimaMaid-7b
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: float16

评估结果

image/png Open LLM Leaderboard评估结果详细结果可查看此处

指标	值
平均值	73.07
AI2推理挑战 (25次少样本)	70.82
HellaSwag (10次少样本)	87.91
MMLU (5次少样本)	64.41
TruthfulQA (0次少样本)	68.28
Winogrande (5次少样本)	82.64
GSM8k (5次少样本)	64.37