ConfigurableSOLAR-10.7B开源大语言模型 - 可配置行为模式满足多样应用需求

首页

Configurablesolar 10.7B

由 vicgalle 开发

一个可配置的大型语言模型，采用可配置安全调优(CST)方法微调，支持通过系统提示配置不同行为模式。

大型语言模型

Transformers

开源协议:Apache-2.0 #可配置系统提示 #多任务微调 #零样本学习

下载量 1,772

发布时间 : 3/10/2024

模型简介

基于SOLAR架构的10.7B参数语言模型，通过可配置安全调优技术实现灵活的行为控制，适用于多种文本生成场景。

模型特点

可配置安全调优

通过系统提示灵活配置模型行为，支持从严格安全模式到无审查模式等多种设定

多任务适应

在vicgalle/configurable-system-prompt-multitask数据集上微调，具备多任务处理能力

行为定制

支持通过系统提示定制AI角色，如无害助手、无偏见助手或角色扮演人物

模型能力

文本生成

指令跟随

多轮对话

安全可控输出

使用案例

对话系统

安全助手

配置为无害助手模式，适用于普通用户交互

生成符合安全规范的回复

研究辅助

配置为无审查模式，用于学术研究场景

提供无过滤的信息输出

内容创作

角色扮演

通过系统提示设定特定角色特征

生成符合角色设定的创意文本

指标	值
平均值	19.05
IFEval (0-Shot)	51.00
BBH (3-Shot)	27.45
MATH Lvl 5 (4-Shot)	0.00
GPQA (0-shot)	6.49
MuSR (0-shot)	5.19
MMLU-PRO (5-shot)	24.15

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Configurablesolar 10.7B

模型简介

模型特点

模型能力

使用案例

🚀 ConfigurableSOLAR-10.7B

✨ 主要特性

📚 详细文档

📄 许可证

📖 引用

📊 Open LLM Leaderboard 评估结果