FsfairX-Gemma2-RM-v0.1开源奖励模型 - 用于对话与推理任务，免费部署

首页

Fsfairx Gemma2 RM V0.1

由 sfairXC 开发

基于Gemma-2-9B架构的奖励模型，采用RLHF工作流训练，适用于对话和推理任务。

大型语言模型

Transformers

#RLHF优化 #高对话能力 #强推理能力

下载量 51

发布时间 : 7/8/2024

模型简介

该模型是一个基于Gemma-2-9B架构的奖励模型，通过RLHF工作流训练，主要用于评估对话能力、推理能力和安全性。

模型特点

高性能对话能力

在对话能力基准测试中得分高达98.04，表现出色。

强大的推理能力

推理能力得分为92.31，适用于复杂逻辑推理任务。

RLHF训练

采用强化学习人类反馈（RLHF）工作流训练，优化模型表现。

模型能力

对话评估

推理评估

安全性评估

高难度对话处理

使用案例

对话系统

智能客服

用于评估客服对话质量，提升用户体验。

对话能力得分98.04

教育

教学助手

评估教学对话的逻辑性和准确性。

推理能力得分92.31

评估维度	得分
对话能力（Chat）	98.04
复杂对话能力（Chat Hard）	65.35
安全性（Safety）	89.54
推理能力（Reasoning）	92.31

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Fsfairx Gemma2 RM V0.1

模型简介

模型特点

模型能力

使用案例

🚀 基于Gemma-2-9B的Vanilla BT奖励模型

🚀 快速开始