L

Llama 3.1 8B

由 meta-llama 开发
Meta Llama 3.1 是一个多语言大语言模型系列,包含8B、70B和405B三种规模的预训练及指令调优生成模型,针对多语言对话场景优化。
下载量 1.0M
发布时间 : 7/14/2024
模型介绍
内容详情
替代品

模型简介

Llama 3.1纯文本指令调优模型针对多语言对话场景优化,在主流行业基准测试中超越多数开源和闭源聊天模型。

模型特点

多语言支持
支持8种主要语言,训练数据涵盖更多语言,开发者可针对其他语言微调。
高效推理
采用分组查询注意力(GQA)提升推理效率,支持128k上下文长度。
高性能
在主流行业基准测试中超越多数开源和闭源聊天模型。
责任与安全
三重保障策略,包括开发者定制、对抗防护和社区防护,确保模型安全使用。

模型能力

多语言文本生成
指令调优对话
知识推理
数学推理

使用案例

商业与研究
多语言客服助手
用于多语言客户支持场景,提供高质量的对话体验。
在MMLU测试中,405B模型在葡萄牙语和印地语的准确率分别达到84.95%和80.31%。
合成数据生成
用于生成高质量的合成数据,支持模型训练和蒸馏。
教育
多语言教育助手
支持多语言的教育问答和知识讲解。