mera-mix-4x7B开源AI模型 - 规模减半性能相当，推理速度更快超实用

Mera Mix 4x7B

由 meraGPT 开发

mera-mix-4x7B是一个专家混合（MoE）模型，规模为Mixtral-8x7B的一半，但性能相当且推理速度更快。

下载量 2,375

发布时间 : 4/13/2024

模型简介

这是一个4专家混合模型，设计用于替代Mixtral-8x7B，提供相似的文本生成能力但更高效的推理性能。

高效推理

相比Mixtral-8x7B，参数规模减半但保持相当性能，推理速度更快

卓越性能

在OpenLLM评测中得分75.91，优于Mixtral-8x7B和Mixtral-8x22B

专家混合架构

采用4专家混合设计，平衡模型容量与计算效率

文本生成

推理任务处理

多项选择题解答

数学问题求解

学术评估

AI2推理挑战赛

处理复杂的推理问题

标准化准确率72.95

MMLU评估

多学科知识理解和应用

准确率64.44

常识推理

HellaSwag评估

日常情境的常识推理

标准化准确率89.17

Winogrande评估

指代消解任务

准确率85.64

真实性评估

TruthfulQA评估

真实性问题回答

mc2得分77.17

数学问题求解

GSM8k评估

小学数学问题解答

准确率66.11