L

Llama 3.1 405B FP8

由 meta-llama 开发
Meta羊驼3.1是多语言大语言模型集合,包含80亿、700亿和4050亿参数的预训练及指令调优生成模型,支持8种语言,在行业基准测试中表现优异。
下载量 540
发布时间 : 7/20/2024
模型介绍
内容详情
替代品

模型简介

基于优化Transformer架构的自回归语言模型,采用监督微调和人类反馈强化学习对齐人类偏好,适用于多语言对话场景和文本生成任务。

模型特点

多语言支持
支持8种语言的文本生成与对话,包括印地语和泰语等非拉丁语系语言
长上下文处理
128k tokens的超长上下文窗口,适合处理复杂文档和长对话
高效推理
采用GQA(分组查询注意力)机制提升推理效率
安全对齐
通过RLHF强化学习对齐人类价值观,内置三重安全防护体系

模型能力

多语言文本生成
指令跟随
代码生成
数学推理
工具使用API调用
知识问答
长文档摘要

使用案例

商业应用
多语言客服助手
部署支持8种语言的智能客服系统
在MMLU多语言测试中405B模型达84-85%准确率
文档处理
长文档分析与摘要生成
支持128k tokens上下文处理
研究开发
模型蒸馏
利用合成数据改进其他模型
提供2500万条微调数据示例
安全研究
评估大模型潜在风险
包含生化武器风险专项评估框架