language:
- 英语
- 德语
- 法语
- 意大利语
- 葡萄牙语
- 印地语
- 西班牙语
- 泰语
library_name: transformers
base_model: meta-llama/Meta-Llama-3.1-405B-Instruct
license: llama3.1
pipeline_tag: 文本生成
tags:
- facebook
- meta
- pytorch
- llama
- llama-3
extra_gated_prompt: "### LLAMA 3.1 社区许可协议\nLlama 3.1版本发布日期:2024年7月23日\n"协议"指本文规定的关于Llama材料使用、复制、分发和修改的条款与条件。\n"文档"指Meta在https://llama.meta.com/doc/overview分发的Llama 3.1相关规范、手册和文档。\n"被许可方"或"您"指您本人、您的雇主或任何其他个人或实体(若您代表该个人或实体签署本协议),且需符合适用法律规定的法定年龄要求,并具有法律授权能力。\n"Llama 3.1"指Meta在https://llama.meta.com/llama-downloads分发的基础大语言模型和软件算法,包括机器学习模型代码、训练模型权重、推理代码、训练代码、微调代码等。\n"Llama材料"统指根据本协议提供的Meta专有Llama 3.1和文档(及其任何部分)。\n"Meta"或"我们"指Meta Platforms爱尔兰有限公司(若您位于欧洲经济区或瑞士)或Meta Platforms公司(若您位于欧洲经济区或瑞士之外)。\n\n1. 许可权利与再分发\n2. 附加商业条款\n3. 免责声明\n4. 责任限制\n5. 知识产权\n6. 期限与终止\n7. 适用法律与管辖\n完整协议内容请参见原始文档"
extra_gated_fields:
名: 文本
姓: 文本
出生日期: 日期选择
国家: 国家选择
所属机构: 文本
职位:
type: 选择
options:
- 学生
- 研究生
- AI研究员
- AI开发/工程师
- 记者
- 其他
geo: IP定位
? 点击提交即表示我接受许可条款,并确认所提供信息将根据Meta隐私政策进行收集、存储、处理和共享
: 复选框
extra_gated_description: 您提供的信息将根据Meta隐私政策进行收集、存储、处理和共享。
extra_gated_button_content: 提交
模型信息
Meta Llama 3.1是多语言大语言模型(LLM)系列,包含8B、70B和405B规模的预训练及指令调优生成模型。Llama 3.1纯文本指令调优模型(8B、70B、405B)针对多语言对话场景优化,在常见行业基准测试中超越多数开源和闭源聊天模型。
开发者: Meta
架构: Llama 3.1采用优化的自回归transformer架构。调优版本使用监督微调(SFT)和人类反馈强化学习(RLHF)来对齐人类偏好。
训练数据 |
参数量 |
输入模态 |
输出模态 |
上下文长度 |
GQA |
token数 |
知识截止 |
公开网络数据新组合 |
8B |
多语言文本 |
多语言文本与代码 |
128k |
是 |
15T+ |
2023年12月 |
70B |
多语言文本 |
多语言文本与代码 |
128k |
是 |
405B |
多语言文本 |
多语言文本与代码 |
128k |
是 |
支持语言: 英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。
模型发布日期: 2024年7月23日。
许可协议: 自定义商业许可Llama 3.1社区许可证,详见链接
预期用途
适用场景 Llama 3.1适用于多语言商业和研究用途。指令调优文本模型适用于类助手聊天,预训练模型可适配多种自然语言生成任务。Llama 3.1还支持利用其输出改进其他模型(如合成数据生成与蒸馏)。
非适用场景 任何违反适用法律或可接受使用政策的行为,以及超出本模型卡明确支持的8种语言范围的使用。
训练数据
概述: Llama 3.1预训练使用约15万亿token的公开数据。微调数据包含公开指令数据集及超过2500万合成生成示例。
基准表现
基础预训练模型
类别 |
基准测试 |
Llama 3.1 8B |
Llama 3.1 70B |
Llama 3.1 405B |
通用能力 |
MMLU(5-shot) |
66.7 |
79.3 |
85.2 |
常识QA |
75.0 |
84.1 |
85.8 |
ARC挑战赛 |
79.7 |
92.9 |
96.1 |
指令调优模型
类别 |
基准测试 |
Llama 3.1 8B Instruct |
Llama 3.1 70B Instruct |
Llama 3.1 405B Instruct |
通用能力 |
MMLU(5-shot) |
69.4 |
83.6 |
87.3 |
数学 |
GSM-8K |
84.5 |
95.1 |
96.8 |
代码 |
HumanEval |
72.6 |
80.5 |
89.0 |
责任与安全
我们采用三重策略管理信任与安全风险:
- 支持开发者为目标受众构建有帮助、安全且灵活的应用
- 防范恶意用户利用Llama能力造成潜在危害
- 提供社区保护措施防止模型滥用
安全部署 Llama是基础技术,开发者需根据具体用例定义安全策略。我们建议开发者参考负责任使用指南进行安全部署。
安全评估 我们通过对抗性测试评估模型风险,重点关注以下关键领域:
- CBRNE(化学、生物、放射、核与爆炸物)风险
- 儿童安全
- 网络攻击赋能
社区资源 我们开源了Purple Llama工具集,并设立Llama影响资助计划支持有益社会的应用。
伦理考量与限制
Llama 3.1核心价值是开放、包容与助益性。作为新技术,其输出存在不可预测性,可能产生不准确、有偏见或其他不当回应。开发者应在部署前进行针对特定应用场景的安全测试与调优。