L

Llama 3.1 405B

由 meta-llama 开发
LLaMA 3.1是Meta推出的多语言大语言模型系列,包含8B、70B和405B三种规模,支持8种语言,在行业基准测试中表现优异。
下载量 19.20k
发布时间 : 7/16/2024
模型介绍
内容详情
替代品

模型简介

基于优化Transformer架构的自回归语言模型,通过监督微调和人类反馈强化学习对齐人类偏好,适用于多语言对话和文本生成任务。

模型特点

多语言支持
原生支持8种语言处理,在多语言基准测试中表现优异
超长上下文
支持128k tokens的上下文长度,适合处理长文档
安全防护
集成LLaMA Guard 3等安全工具,提供多层次风险管控
高效推理
采用GQA(Grouped Query Attention)技术提升推理效率

模型能力

多语言文本生成
指令跟随对话
代码生成
跨语言知识问答
长文档理解

使用案例

商业应用
多语言客服助手
部署支持8种语言的智能客服系统
在MMLU测试中葡萄牙语准确率达84.95%
研究开发
模型微调基础
作为领域专用模型的预训练基础
支持通过输出改进其他模型