e.star.7.b开源大语言模型 - 基于Mistral架构，多项测试表现优异可高效训练

E.star.7.b

由 liminerity 开发

基于Mistral架构的7B参数大语言模型，使用Unsloth和TRL库高效训练，在多项基准测试中表现优异。

下载量 86

发布时间 : 3/24/2024

模型简介

这是一个文本生成模型，基于yam-peleg/Experiment26-7B微调而来，专注于提供高质量的文本生成能力。

高效训练

使用Unsloth和TRL库训练，速度提升2倍

多任务表现

在AI2推理挑战赛、HellaSwag等多个基准测试中表现优异

开源许可

采用Apache 2.0许可证，允许商业使用

文本生成

问答系统

推理任务

知识问答

教育

知识问答

回答各类学科知识问题

在MMLU测试中准确率达63.44%

研究

推理任务

解决逻辑推理问题

在AI2推理挑战赛中标准化准确率达63.91%

商业

内容生成

生成各类商业文本内容

任务数据集	指标	值	来源
AI2 Reasoning Challenge (25 - Shot)	归一化准确率	63.91	Open LLM Leaderboard
HellaSwag (10 - Shot)	归一化准确率	86.02	Open LLM Leaderboard
MMLU (5 - Shot)	准确率	63.44	Open LLM Leaderboard
TruthfulQA (0 - shot)	mc2	54.91	Open LLM Leaderboard
Winogrande (5 - shot)	准确率	80.19	Open LLM Leaderboard
GSM8k (5 - shot)	准确率	61.18	Open LLM Leaderboard