S

Suzume Llama 3 8B Multilingual Orpo Borda Half

由 lightblue 开发
基于Llama-3-8B通过ORPO方法微调的多语言大模型,使用50%最一致排名数据训练,在多项语言任务中表现优异。
下载量 4,625
发布时间 : 4/25/2024

模型简介

这是一个通过ORPO(Odds Ratio Preference Optimization)方法微调的多语言大语言模型,基于Llama-3-8B架构,专门优化了多语言理解和生成能力。

模型特点

ORPO优化训练
使用Odds Ratio Preference Optimization方法微调,显著提升模型在多语言任务中的表现
多语言能力
在6种主要语言(中英法德日俄)上均有优异表现,部分语言超越GPT-3.5
数据精选
使用50%最一致排名数据训练,确保训练质量
长上下文支持
支持8192 tokens的长上下文处理

模型能力

多语言文本生成
多语言问答
多语言对话系统
多语言文本理解

使用案例

多语言应用
多语言客服机器人
构建支持多种语言的智能客服系统
在MT-Bench测试中,俄语表现最佳(8.94分),中文7.74分
多语言内容创作
辅助生成多种语言的营销文案、文章等内容
在法语和德语测试中表现优于基础模型
研究应用
ORPO方法研究
研究不同比例训练数据对模型性能的影响
50%数据版本在多项测试中表现优异
AIbase
智启未来,您的人工智能解决方案智库
简体中文