B

Beaver 7b V1.0

由 PKU-Alignment 开发
Beaver是基于Alpaca模型,使用Safe-RLHF技术训练的聊天助手,专注于大语言模型的安全性研究。
下载量 35
发布时间 : 6/24/2023
模型介绍
内容详情
替代品

模型简介

Beaver是一个基于LLaMA和Alpaca模型的安全对齐语言模型,通过Safe-RLHF技术训练,旨在提供有用信息的同时避免输出有害内容。

模型特点

安全对齐
使用Safe-RLHF技术训练,有效避免输出有害内容
多版本对比
提供v1.0至v3.0多个版本,展示安全性能的逐步提升
完整训练体系
包含配套的奖励模型和成本模型,形成完整的安全训练框架

模型能力

安全对话生成
有害内容过滤
多轮对话处理

使用案例

AI安全研究
安全对话系统
用于研究如何构建安全的对话AI系统
相比基础Alpaca模型能显著减少有害内容输出
教育应用
安全教育演示
展示安全AI与普通AI在敏感问题上的回答差异
清晰展示安全对齐技术的效果