StrangeMerges_53-7B-model_stock开源文本生成模型 - 免费部署实现强大文案输出

首页

Strangemerges 53 7B Model Stock

由 Gille 开发

StrangeMerges_53-7B-model_stock 是使用 LazyMergekit 合并多个7B参数规模模型的结果，具有强大的文本生成能力。

大型语言模型

Transformers

开源协议:Apache-2.0 #多模型融合 #高推理能力 #知识密集型任务

下载量 18

发布时间 : 4/1/2024

模型简介

该模型是通过合并多个7B参数规模的模型而成，专注于文本生成任务，在多个基准测试中表现优异。

模型特点

多模型合并

通过合并多个优质7B参数模型，综合各模型优势

高性能

在多个基准测试中表现优异，平均得分76.07

开源许可

使用Apache 2.0许可证，允许商业使用

模型能力

文本生成

推理任务

问答系统

数学计算

使用案例

教育

数学问题解答

解决GSM8k数据集中的数学问题

准确率达到72.71%

研究

常识推理

处理AI2推理挑战中的复杂问题

归一化准确率72.78%

商业

内容生成

生成高质量文本内容

🚀 StrangeMerges_53-7B-model_stock

StrangeMerges_53-7B-model_stock是一个通过LazyMergekit合并以下模型得到的模型，它在文本生成任务中表现出色，为相关研究和应用提供了有力支持。

🚀 快速开始

StrangeMerges_53-7B-model_stock是通过特定方法合并多个模型得到的。下面将介绍其配置和使用方法。

✨ 主要特性

该模型通过合并多个不同的模型，综合了各模型的优势，可能在不同的文本生成任务中表现更优。
使用model_stock合并方法，以Gille/StrangeMerges_52-7B-dare_ties为基础模型，数据类型为bfloat16。

📦 安装指南

在使用该模型前，需要安装必要的库：

!pip install -qU transformers accelerate

💻 使用示例

基础用法

以下是使用该模型进行文本生成的示例代码：

from transformers import AutoTokenizer
import transformers
import torch

model = "Gille/StrangeMerges_53-7B-model_stock"
messages = [{"role": "user", "content": "What is a large language model?"}]

tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

📚 详细文档

🧩 配置信息

以下是该模型的合并配置：

models:
  - model: Gille/StrangeMerges_52-7B-dare_ties
  - model: rwitz/experiment26-truthy-iter-0
  - model: Gille/StrangeMerges_32-7B-slerp
  - model: AurelPx/Percival_01-7b-slerp
  - model: Kukedlc/NeuralMaths-Experiment-7b
merge_method: model_stock
base_model: Gille/StrangeMerges_52-7B-dare_ties
dtype: bfloat16

Open LLM Leaderboard评估结果

详细结果可查看此处

指标	值
平均值	76.07
AI2推理挑战 (25次少样本学习)	72.78
HellaSwag (10次少样本学习)	88.46
MMLU (5次少样本学习)	64.97
TruthfulQA (0次少样本学习)	73.86
Winogrande (5次少样本学习)	83.66
GSM8k (5次少样本学习)	72.71