N

Neuralhermes 2.5 Mistral 7B

由 mlabonne 开发
NeuralHermes是基于OpenHermes-2.5-Mistral-7B模型,通过直接偏好优化(DPO)进一步微调而成的大语言模型,在多项基准测试中表现优异。
下载量 215
发布时间 : 11/29/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个7B参数的大语言模型,采用ChatML模板格式,专注于文本生成任务。通过DPO微调提升了原始模型的性能,在开放大语言模型排行榜上表现突出。

模型特点

DPO微调优化
使用直接偏好优化(DPO)方法对基础模型进行微调,显著提升了模型性能
ChatML格式支持
采用ChatML模板格式,便于聊天应用场景的使用
多基准测试领先
在开放大语言模型排行榜上表现优异,是7B参数模型中的佼佼者
高效训练
仅需约1小时A100 GPU即可完成训练,训练效率高

模型能力

文本生成
聊天对话
问答系统
指令跟随

使用案例

智能助手
聊天机器人
可作为智能聊天助手,提供自然流畅的对话体验
在TruthfulQA基准测试中达到54.93%的准确率
知识问答
开放领域问答
回答各种领域的知识性问题
在MMLU基准测试中达到63.32%的准确率
推理任务
逻辑推理
处理需要逻辑推理的问题
在AI2推理挑战赛中达到66.55%的准确率