S

Starling LM 11B Alpha

由 CallComply 开发
Starling-7B是一个通过AI反馈强化学习(RLAIF)训练的开源大语言模型,基于Openchat 3.5微调,在MT Bench中表现优异。
下载量 103
发布时间 : 12/3/2023
模型介绍
内容详情
替代品

模型简介

Starling-7B是一个通过RLHF/RLAIF微调的语言模型,主要用于文本生成任务,具有较高的对话和推理能力。

模型特点

RLAIF训练
使用AI反馈强化学习(RLAIF)进行微调,提升了模型的对话和推理能力。
高性能
在MT Bench中以GPT-4作为评委获得了8.09分,超越了除OpenAI的GPT-4和GPT-4 Turbo之外的所有现有模型。
开源
模型、排名数据集和奖励模型均已开源,便于研究和应用。

模型能力

文本生成
对话系统
推理任务

使用案例

对话系统
智能客服
用于构建高性能的智能客服系统,提供自然流畅的对话体验。
教育
学习助手
帮助学生解答问题,提供学习建议和资源推荐。