N

Neural Chat 7b V3 3

由 Intel 开发
Neural-Chat-v3-3是英特尔基于Mistral-7B架构开发的70亿参数大语言模型,专注于数学推理和文本生成任务。该模型在MetaMathQA数据集上微调,并采用直接性能优化(DPO)方法对齐。
下载量 29.82k
发布时间 : 12/9/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于Intel/neural-chat-7b-v3-1在meta-math/MetaMathQA数据集上微调的70亿参数大语言模型,使用英特尔Gaudi 2处理器进行训练,适用于语言相关任务推理。

模型特点

数学推理能力
在MetaMathQA数据集上微调,具备优秀的数学问题解决能力
直接性能优化
采用DPO(直接性能优化)方法进行对齐训练
Gaudi 2处理器优化
专门在英特尔Gaudi 2处理器上训练和优化
长上下文支持
支持8192个标记的上下文长度

模型能力

数学问题解答
文本生成
逻辑推理
问答系统

使用案例

教育
数学辅导
帮助学生理解和解决各种数学问题
在GSM8K数学数据集上达到61.11%准确率
内容创作
文本生成
生成连贯、有逻辑的文本内容
在HellaSwag数据集上达到85.26%准确率