Gemma-2-9B-It-SPPO-Iter3开源语言模型 - 免费使用高效对话与内容创作帮手

首页

Gemma 2 9B It SPPO Iter3

由 UCLA-AGI 开发

基于自博弈偏好优化方法在第三轮迭代中开发的89亿参数语言模型，以google/gemma-2-9b-it为起点，使用UltraFeedback数据集进行微调

大型语言模型

Transformers

英语#自博弈偏好优化 #多轮迭代微调 #英语文本生成

下载量 6,704

发布时间 : 6/29/2024

模型简介

该模型采用自博弈偏好优化方法进行对齐优化，主要用于英语文本生成任务

模型特点

自博弈偏好优化

采用SPPO方法进行三轮迭代优化，提升模型性能

高质量数据集

使用UltraFeedback数据集和合成数据进行训练

迭代改进

经过三轮迭代，每轮性能均有提升

模型能力

英语文本生成

对话系统

内容创作

使用案例

对话系统

智能客服

用于构建英语智能客服对话系统

内容生成

文章创作

辅助英语文章写作和内容生成

属性	详情
模型类型	一个在合成数据集上微调的 80 亿参数类 GPT 模型。
语言（NLP）	主要为英语
许可证	Apache-2.0
微调基础模型	google/gemma-2-9b-it

模型	LC. 胜率	胜率	平均长度
Gemma-2-9B-SPPO Iter1	48.70	40.76	1669
Gemma-2-9B-SPPO Iter2	50.93	44.64	1759
Gemma-2-9B-SPPO Iter3	53.27	47.74	1803

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Gemma 2 9B It SPPO Iter3

模型简介

模型特点

模型能力

使用案例

🚀 Gemma-2-9B-It-SPPO-Iter3

🚀 快速开始

✨ 主要特性

模型描述

其他模型链接

AlpacaEval 排行榜评估结果

训练超参数

📚 详细文档

引用