3Blarenegv3-ECE-PRYMMAL-Martial开源文本生成模型 - 免费可用，多任务文本生成好帮手

首页

3blarenegv3 ECE PRYMMAL Martial

由 brgx53 开发

使用mergekit合并预训练语言模型得到的模型，在多个文本生成任务上有评估结果

大型语言模型

Transformers

开源协议:Apache-2.0 #多任务文本生成 #SLERP混合模型 #零样本推理

下载量 1,799

发布时间 : 11/8/2024

模型简介

这是一个通过SLERP方法合并两个预训练语言模型得到的混合模型，适用于多种文本生成任务

模型特点

模型合并技术

采用SLERP方法合并两个预训练模型，结合各自优势

多任务评估

在Open LLM Leaderboard上进行了全面评估

参数高效

通过合并技术实现性能提升而不显著增加参数规模

模型能力

文本生成

指令跟随

问答系统

代码生成

使用案例

自然语言处理

开放域问答

回答各种领域的知识性问题

在BBH评估中获得37.25分

数学问题求解

解决复杂数学问题

在MATH Lvl 5评估中获得30.74分

教育应用

知识评估

用于教育领域的知识测试

在MMLU-PRO评估中获得38.95分

指标	值
平均值	30.78
IFEval (0-Shot)	56.77
BBH (3-Shot)	37.25
MATH Lvl 5 (4-Shot)	30.74
GPQA (0-shot)	8.17
MuSR (0-shot)	12.79
MMLU-PRO (5-shot)	38.95

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

3blarenegv3 ECE PRYMMAL Martial

模型简介

模型特点

模型能力

使用案例

🚀 3Bgeneralv2-ECE-PRYMMAL-Martial

🚀 快速开始

✨ 主要特性

合并详情

合并方法

合并的模型

配置

📚 详细文档

Open LLM Leaderboard 评估结果

📄 许可证