N

Nous Hermes 2 Mistral 7B DPO AWQ

由 solidrust 开发
Nous Hermes 2是基于Mistral 7B DPO的新一代旗舰级7B Hermes模型,经过DPO优化,在多个测试基准上表现优异。
下载量 84
发布时间 : 2/22/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于Mistral 7B架构的大语言模型,经过DPO(直接偏好优化)训练,专注于指令遵循和对话生成任务。

模型特点

DPO优化
经过直接偏好优化训练,在AGIEval、BigBench Reasoning等基准测试中表现更优
高质量训练数据
使用100万条GPT-4质量或更优的指令/对话数据进行训练
AWQ量化支持
支持4位AWQ量化,在保持质量的同时提高推理效率
ChatML格式支持
使用标准化的ChatML提示模板,便于对话系统集成

模型能力

文本生成
对话系统
指令遵循
推理能力

使用案例

对话系统
智能助手
构建能够理解复杂指令并生成自然回应的AI助手
在多个基准测试中表现优于基础模型
教育应用
教学辅助
用于生成教学内容和解答学生问题