gemma-7b-zephyr-sft开源大语言模型 - 免费部署助力高效文本生成

Gemma 7b Zephyr Sft

由 wandb 开发

基于Google Gemma 7B模型，采用Zephyr SFT配方微调的大语言模型，主要用于文本生成任务

下载量 19

发布时间 : 2/28/2024

模型简介

这是一个85亿参数的GPT类模型，在混合公开和合成数据集上进行监督微调(SFT)，专注于英语文本生成任务。

Zephyr SFT微调

采用Zephyr监督微调配方训练，提升了模型在对话和指令跟随方面的表现

高性能基准测试

在开放LLM排行榜多项基准测试中表现优异，如HellaSwag(80.73)和Winogrande(74.19)

计算效率优化

使用8xA100 80GB节点训练，优化了大规模模型的计算效率

文本生成

问答系统

推理任务

对话系统

知识问答

教育

AI2推理挑战赛

解决科学推理问题

标准化准确率61.43

常识推理

HellaSwag评估

日常情境下的常识推理

标准化准确率80.73

Winogrande评估

指代消解和常识推理

准确率74.19

数学能力

GSM8k评估

解决小学数学问题

准确率49.81

属性	详情
模型类型	一个具有85亿参数的类GPT模型，在多种公开可用的合成数据集上进行微调。
语言（NLP）	主要为英语
微调基础模型	google/gemma-7b