M

Mathhermes 2.5 Mistral 7B

由 simonveitner 开发
OpenHermes 2.5是基于Mistral-7B架构的大语言模型,采用DPO技术进行数学能力优化,支持ChatML格式的多轮对话交互。
下载量 24
发布时间 : 12/2/2023
模型介绍
内容详情
替代品

模型简介

该模型通过直接偏好优化(DPO)技术微调,专注于提升数学领域表现,采用ChatML提示格式实现结构化对话交互。

模型特点

数学能力优化
通过DPO技术对数学偏好数据集进行微调,增强数学推理和问题解决能力
ChatML格式支持
采用结构化对话标记系统,兼容OpenAI接口规范,支持复杂多轮对话场景
系统提示响应
可识别并有效利用系统级指令,实现更精准的任务执行和角色扮演

模型能力

文本生成
数学推理
指令理解
多轮对话
角色扮演

使用案例

教育辅助
数学解题辅导
帮助学生理解数学概念并提供分步解题指导
智能对话
个性化AI助手
通过系统提示定制AI角色性格和行为模式