B

Btlm 3b 8k Chat

由 cerebras 开发
BTLM-3B-8k-chat是基于BTLM-3B-8K-base开发的对话版本,采用DPO方法优化,专为符合人类偏好的对话场景设计。
下载量 138
发布时间 : 12/5/2023
模型介绍
内容详情
替代品

模型简介

该模型是专为对话场景优化的语言模型,通过DPO训练在Anthropic-HH-RLHF数据集上微调,提升了对话能力和实用性。

模型特点

商用许可
采用Apache 2.0协议,允许商业使用
性能提升
在10项下游任务和MMLU基准上较基础模型提升2.26%
增强对话能力
通过DPO训练优化了对话交互质量
降低有害性
减少了有害内容生成,提高实用性

模型能力

文本生成
对话交互
知识问答
内容创作

使用案例

教育
知识问答
回答各类知识性问题
能提供准确的知识性回答
研究
伦理对齐研究
作为研究人类偏好对齐的基础模型