UNA SimpleSmaug 34b V1beta

U

UNA SimpleSmaug 34b V1beta

由 fblgit 开发

基于Smaug-34B的监督微调模型，专注于提升数学和推理能力，在34B规模模型中表现优异。

大型语言模型

开源协议:Apache-2.0 #数学推理优化 #高精度文本生成 #SFT微调增强

下载量 18

发布时间 : 2/5/2024

模型简介

该模型是基于Smaug-34B-v0.1进行监督微调（SFT）的变体，通过简单数学数据集的训练提升了数学和推理能力，同时保留了原始模型的性能。在开放LLM排行榜中表现优异，是34B规模模型的领先者。

模型特点

数学能力提升

通过简单数学数据集的监督微调，显著提升了数学和推理能力。

34B规模领先

在34B参数规模的模型中表现优异，开放LLM排行榜评分77.41。

注意力层优化

仅在注意力层应用UNA技术，未修改MLP层，保留了原始模型的核心能力。

模型能力

文本生成

数学推理

逻辑推理

问答系统

使用案例

教育

数学问题解答

解答各类数学问题，包括算术、代数等。

GSM8k数据集准确率72.48%

评估测试

标准测试评估

用于AI2推理挑战赛、MMLU等标准测试评估。

AI2推理挑战赛74.57分，MMLU 76.68分

🚀 UNA-SimpleSmaug-34b-v1beta

UNA-SimpleSmaug-34b-v1beta是一款强大的模型，在2024年2月4日的评估中，它在34B模型里表现卓越，得分达到77.41，超越了其基础模型Smaug-34B-v0.1。该模型经过SFT训练，让Smaug内部的计算机制恢复正常，还支持进一步训练。

🚀 快速开始

本模型基于Smaug，使用了SimpleMath数据集，并在Axolotl上进行训练。它仅在注意力层应用了UNA，而非MLP层。

✨ 主要特性

基于Smaug：继承了Smaug的优秀特性。
SimpleMath数据集：使用该数据集进行训练，提升了模型的数学和推理能力。
Axolotl训练：在Axolotl上完成训练过程。
UNA应用：仅在注意力层应用UNA，优化模型性能。

📚 详细文档

实验

本次实验旨在探究在SFT阶段将SimpleMath应用于注意力层对神经网络的整体影响。结果表明，该模型在不降低之前训练效果的前提下，提升了数学和推理能力。

评估

评估指标

指标	值
平均	77.41
AI2推理挑战（25次少样本学习）	74.57
HellaSwag（10次少样本学习）	86.74
MMLU（5次少样本学习）	76.68
TruthfulQA（0次少样本学习）	70.17
Winogrande（5次少样本学习）	83.82
GSM8k（5次少样本学习）	72.48

任务评估

任务	版本	指标	值
arc_challenge	HF	acc_norm	0.7457337883959
gsm8k	HF	acc	0.7247915087187
mmlu	HF	acc	0.7649553475572
mmlu	HF	acc_norm	0.7681713551647
hellaswag	HF	acc_norm	0.8673571001792
truthfulqa	HF	mc2	0.7016557407771
winogrande	HF	acc	0.8382004735595

其他评估

指标	值
平均	23.12
IFEval（0次少样本学习）	45.56
BBH（3次少样本学习）	32.78
MATH Lvl 5（4次少样本学习）	0.15
GPQA（0次少样本学习）	8.95
MuSR（0次少样本学习）	11.96
MMLU-PRO（5次少样本学习）	39.33

模型血缘检测

你可以使用我们的ModelSimilarities工具来确认该模型的血缘关系。

📄 许可证

本模型采用Apache-2.0许可证。

UNA

更新说明

3月更新：该模型在34B模型中依旧稳居榜首，Smaug 70B在70B模型中也保持领先。

关于其他模型

有人疑惑为何没有基于Hermes或Smaug 70B的UNA模型。开发者认为，对于一些被广泛认为实用性不高的模型，花费时间进行UNA处理可能不值得。不过，开发者希望利用UNA让优秀模型重焕生机，就像UNA-Dolphin在短时间内展现出的出色性能一样。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24