S

SOLAR 10.7B Instruct V1.0

由 upstage 开发
SOLAR-10.7B是一个拥有107亿参数的高级大语言模型,在自然语言处理任务中表现出色,参数规模低于300亿的模型中性能领先。
下载量 58.99k
发布时间 : 12/12/2023
模型介绍
内容详情
替代品

模型简介

SOLAR-10.7B是一个基于深度向上扩展(DUS)方法构建的大语言模型,通过指令微调优化了单轮对话能力。

模型特点

深度向上扩展技术
采用创新的深度向上扩展方法,整合Mistral 7B权重并进行持续预训练,显著提升模型性能。
高效参数利用
仅107亿参数却超越许多更大规模模型,在300亿参数以下模型中表现卓越。
先进指令微调
结合SFT和DPO方法进行指令微调,使用高质量数据集优化模型响应能力。
数据污染控制
严格筛选训练数据,确保模型未受基准测试数据污染,保持评估结果的可靠性。

模型能力

文本生成
单轮对话
自然语言理解
指令跟随

使用案例

对话系统
单轮问答
回答用户提出的单轮问题
提供准确、有帮助的回答
内容生成
文本创作
根据提示生成连贯的文本内容
生成符合语境的自然语言文本