R

Rocket 3B

由 pansophic 开发
Rocket-3B是一个30亿参数的大型语言模型,通过直接偏好优化(DPO)在公开数据集上训练,性能超越许多更大规模的模型。
下载量 26
发布时间 : 11/19/2023

模型简介

一个高效的30亿参数聊天模型,采用ChatML格式,在MT-Bench和AlpacaEval基准测试中表现优异。

模型特点

高效性能
以30亿参数规模超越多个7B-70B规模的模型,在MT-Bench和AlpacaEval基准测试中表现优异
DPO优化
采用直接偏好优化方法训练,提升了模型输出质量
紧凑架构
仅3B参数却能达到接近大模型的性能,资源需求更低

模型能力

文本生成
对话交互
指令跟随

使用案例

对话系统
智能助手
可作为高效能的对话助手使用
在AlpacaEval评估中达到79.75%胜率
文本生成
内容创作
生成各种类型的文本内容
平均响应长度达1242个词元,能生成详细回复
AIbase
智启未来,您的人工智能解决方案智库
简体中文