Llama-3-Instruct-8B-SPPO-Iter3开源大语言模型 - 免费部署助力智能对话交流

首页

Llama 3 Instruct 8B SPPO Iter3

由 UCLA-AGI 开发

基于Meta-Llama-3-8B-Instruct架构，采用Self-Play Preference Optimization方法在第三次迭代中开发的大语言模型。

大型语言模型

Transformers

英语开源协议:Apache-2.0 #自我博弈优化 #合成数据训练 #多任务评估

下载量 8,539

发布时间 : 6/25/2024

模型简介

该模型通过自我博弈和偏好优化提升了对齐能力，在合成数据集上进行训练以提高泛化能力。

模型特点

Self-Play Preference Optimization

采用先进的自我博弈偏好优化方法进行微调，提升模型的对齐能力。

合成数据训练

使用合成数据集进行训练，增强了模型的泛化能力。

迭代优化

经过三次迭代优化，性能逐步提升。

模型能力

文本生成

指令遵循

多轮对话

使用案例

对话系统

智能助手

可用于构建智能对话助手，提供自然流畅的交互体验。

内容生成

文本创作

可用于生成各种类型的文本内容，如文章、故事等。

🚀 Llama-3-Instruct-8B-SPPO-Iter3

本模型基于 meta-llama/Meta-Llama-3-8B-Instruct 架构，采用 Self-Play Preference Optimization 方法在第三次迭代中开发而成。它使用了 openbmb/UltraFeedback 数据集中的提示集，并通过 snorkelai/Snorkel-Mistral-PairRM-DPO-Dataset 分割为 3 部分用于 3 次迭代。所有使用的回复均为合成数据。

🚀 快速开始

本模型可在 Hugging Face 平台上使用，你可以根据自己的需求进行调用和微调。

✨ 主要特性

基于先进的 Self-Play Preference Optimization 方法进行微调。
使用合成数据集进行训练，提升模型的泛化能力。
在多个评估基准上取得了优异的成绩。

📚 详细文档

模型描述

属性	详情
模型类型	一个具有 80 亿参数的类 GPT 模型，在合成数据集上进行了微调。
语言	主要为英语
许可证	Apache-2.0
微调基础模型	meta-llama/Meta-Llama-3-8B-Instruct

其他模型链接

AlpacaEval 排行榜评估结果

模型	LC. 胜率	胜率	平均长度
Llama-3-8B-SPPO Iter1	31.73	31.74	1962
Llama-3-8B-SPPO Iter2	35.15	35.98	2021
Llama-3-8B-SPPO Iter3	38.77	39.85	2066

Open LLM 排行榜评估结果

结果使用 lm-evaluation-harness v0.4.1 报告。

	arc_challenge	truthfulqa_mc2	winogrande	gsm8k	hellaswag	mmlu	平均
Llama-3-8B-SPPO Iter1	63.82	54.96	76.40	75.44	79.80	65.65	69.35
Llama-3-8B-SPPO Iter2	64.93	56.48	76.87	75.13	80.39	65.67	69.91
Llama-3-8B-SPPO Iter3	65.19	58.04	77.11	74.91	80.86	65.60	70.29

Open LLM 排行榜 2 评估结果

详细结果可查看此处。

指标	值
平均	23.68
IFEval (0-Shot)	68.28
BBH (3-Shot)	29.74
MATH Lvl 5 (4-Shot)	7.33
GPQA (0-shot)	2.01
MuSR (0-shot)	3.09
MMLU-PRO (5-shot)	29.38

训练超参数

训练过程中使用了以下超参数：

学习率：5e-07
eta：1000
每个设备的训练批次大小：8
梯度累积步数：1
随机种子：42
分布式类型：deepspeed_zero3
设备数量：8
优化器：RMSProp
学习率调度器类型：线性
学习率调度器热身比例：0.1
训练轮数：6.0（在第 1.0 轮停止）

🔧 技术细节

本模型基于 Self-Play Preference Optimization 方法进行微调，该方法通过自我博弈和偏好优化来提升模型的对齐能力。模型在合成数据集上进行训练，以提高其泛化能力。

📄 许可证

本模型采用 Apache-2.0 许可证。

引用

@misc{wu2024self,
      title={Self-Play Preference Optimization for Language Model Alignment}, 
      author={Wu, Yue and Sun, Zhiqing and Yuan, Huizhuo and Ji, Kaixuan and Yang, Yiming and Gu, Quanquan},
      year={2024},
      eprint={2405.00675},
      archivePrefix={arXiv},
      primaryClass={cs.LG}
}