Z

Zephyr 7b Gemma V0.1

由 HuggingFaceH4 开发
Zephyr 7B Gemma是基于google/gemma-7b微调的语言模型,使用直接偏好优化(DPO)在公开合成数据集上训练,旨在作为有用的助手。
下载量 502
发布时间 : 3/1/2024
模型介绍
内容详情
替代品

模型简介

Zephyr系列语言模型的第三个版本,70亿参数规模,主要用于英语文本生成任务,经过对齐优化以提供更符合人类偏好的响应。

模型特点

直接偏好优化(DPO)
使用DPO方法在合成数据集上进行微调,使模型输出更符合人类偏好
高性能
在多个基准测试中表现优异,如MT-Bench得分7.81
开源训练配方
可通过对齐手册提供的配方重现训练过程

模型能力

文本生成
对话系统
问答系统
推理任务

使用案例

对话系统
智能助手
可作为日常对话助手使用
在MT-Bench对话评估中获得7.81分
知识问答
AI2推理挑战赛
解决复杂的推理问题
25-shot下标准化准确率58.45
数学推理
GSM8k数学题
解决小学数学应用题
5-shot准确率45.56