U

UNA TheBeagle 7b V1

由 fblgit 开发
TheBeagle是基于The Bagel数据集训练的70亿参数模型,采用DPO(直接偏好优化)和UNA(统一神经架构)技术优化,在多任务中表现优异。
下载量 88
发布时间 : 1/9/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于精选DPO配对集优化的70亿参数大语言模型,采用英特尔neural-chat模型作为基础,在多项基准测试中表现突出。

模型特点

DPO优化
采用直接偏好优化技术对精选DPO配对集进行训练
UNA架构
应用统一神经架构优化感知机层,学习速率设为3.5e-7
高性能表现
在ARC、GSM8K、HellaSwag等多个基准测试中取得优异成绩
数据去污染
数据集经过严格去污染处理,确保训练质量

模型能力

文本生成
问答系统
数学推理
常识推理
逻辑推理

使用案例

学术研究
自然语言处理研究
可用于语言模型性能比较和新技术验证
在多个基准测试中表现优异
教育应用
数学问题解答
解决GSM8K等数学问题
精确匹配率达72.1%