G

Gemma 7b Zephyr Sft

由 wandb 开发
基于Google Gemma 7B模型,采用Zephyr SFT配方微调的大语言模型,主要用于文本生成任务
下载量 19
发布时间 : 2/28/2024
模型介绍
内容详情
替代品

模型简介

这是一个85亿参数的GPT类模型,在混合公开和合成数据集上进行监督微调(SFT),专注于英语文本生成任务。

模型特点

Zephyr SFT微调
采用Zephyr监督微调配方训练,提升了模型在对话和指令跟随方面的表现
高性能基准测试
在开放LLM排行榜多项基准测试中表现优异,如HellaSwag(80.73)和Winogrande(74.19)
计算效率优化
使用8xA100 80GB节点训练,优化了大规模模型的计算效率

模型能力

文本生成
问答系统
推理任务
对话系统
知识问答

使用案例

教育
AI2推理挑战赛
解决科学推理问题
标准化准确率61.43
常识推理
HellaSwag评估
日常情境下的常识推理
标准化准确率80.73
Winogrande评估
指代消解和常识推理
准确率74.19
数学能力
GSM8k评估
解决小学数学问题
准确率49.81