M

Mistral Orpo Beta

由 kaist-ai 开发
Mistral-ORPO-β是基于Mistral-7B使用ORPO方法微调的7B参数语言模型,无需监督微调预热阶段即可直接学习偏好。
下载量 18
发布时间 : 3/12/2024

模型简介

这是一个通过ORPO方法优化的7B参数语言模型,专注于文本生成任务,在多个基准测试中表现优异。

模型特点

ORPO优化
使用Odds Ratio Preference Optimization方法,无需监督微调预热阶段即可直接学习偏好
高效微调
仅在61k条UltraFeedback数据集实例上进行微调即获得优异性能
多任务表现
在AlpacaEval、MT-Bench等多个基准测试中超越同类模型

模型能力

文本生成
对话系统
问答系统
指令跟随

使用案例

对话系统
智能助手
可用于构建智能对话助手
在AlpacaEval 1.0上达到91.16%胜率
教育应用
教育问答
可用于教育领域的问答系统
在MMLU测试中达到63.26%准确率
AIbase
智启未来,您的人工智能解决方案智库
简体中文