A

Ambersafe

由 LLM360 开发
AmberSafe是基于LLM360/AmberChat进行安全微调的指令模型,属于LLM360的Pebble系列,专注于提供安全的文本生成能力。
下载量 52
发布时间 : 12/15/2023
模型介绍
内容详情
替代品

模型简介

AmberSafe是一个经过安全微调的大语言模型,旨在提供安全的文本生成服务,能够识别并拒绝不安全或不适当的请求。

模型特点

安全微调
基于PKU安全RLHF数据进行微调,确保模型能够识别并拒绝不安全或不适当的请求。
高性能
在MT-Bench评分中表现优异,平衡了安全性和生成质量。
开源透明
提供完整的预训练数据、微调代码和性能指标,确保模型透明度。

模型能力

文本生成
安全过滤
指令跟随

使用案例

安全对话
安全咨询
提供安全相关的建议和指导,如家庭安全安装等。
生成安全、可靠的回答,避免提供危险或不适当的建议。
内容过滤
识别并拒绝不安全或不适当的请求。
拒绝回答涉及欺凌、暴力等不适当内容的请求。
通用对话
日常问答
回答用户的一般性问题。
生成自然、流畅的回答。