Llama_3.1_8b_Medusa_v1.01开源语言模型 - 出色完成各类文本生成任务

首页

Llama 3.1 8b Medusa V1.01

由 Nexesenex 开发

基于Llama 3.1架构的8B参数语言模型，通过mergekit合并多个专业模型而成，在文本生成任务中表现优异。

大型语言模型

Transformers

#指令微调 #多任务泛化 #零样本推理

下载量 95

发布时间 : 2/27/2025

模型简介

这是一个通过合并多个专业模型（Mediver、Smarteaz和Dobby-Mini-Unhinged）而创建的8B参数语言模型，专注于文本生成任务，在多个基准测试中展现出色性能。

模型特点

多模型合并

通过mergekit合并多个专业模型（Mediver、Smarteaz和Dobby-Mini-Unhinged），综合各模型优势

高性能文本生成

在IFEval等文本生成基准测试中表现优异，严格准确率达76.85%

广泛基准测试

在BBH、MATH、GPQA、MuSR和MMLU-PRO等多个基准测试中进行评估

模型能力

文本生成

指令跟随

知识问答

数学推理

使用案例

教育

数学问题解答

解答各类数学问题，特别是竞赛级别题目

在MATH Lvl 5测试中获得14.65%的精确匹配率

研究

复杂问题研究

协助研究人员处理GPQA等复杂科学问题

在GPQA测试中获得5.59%的归一化准确率

通用AI助手

指令执行

准确理解和执行复杂指令

在IFEval测试中获得76.85%的严格准确率

指标	值
平均	27.38
IFEval (0 - 样本)	76.85
BBH (3 - 样本)	30.03
MATH Lvl 5 (4 - 样本)	14.65
GPQA (0 - 样本)	5.59
MuSR (0 - 样本)	9.03
MMLU - PRO (5 - 样本)	28.13

属性	详情
模型类型	合并的预训练语言模型
训练数据	未提及

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Llama 3.1 8b Medusa V1.01

模型简介

模型特点

模型能力

使用案例

🚀 Llama_3.1_8b_Medusa_v1.01

📄 许可证

📚 详细文档

合并说明

合并方法

合并的模型

配置

Open LLM Leaderboard 评估结果

模型信息表格