Llama 3.2-3B-Instruct开源大语言模型 - 免费部署多语言对话场景适用

首页

Llama 3.2 3B Instruct

由 meta-llama 开发

Llama 3.2是由Meta开发的多语言大语言模型系列，包含1B和3B规模的预训练及指令调优生成模型，针对多语言对话场景优化。

大型语言模型

Transformers

支持多种语言#128k长上下文 #多语言对话优化 #低资源量化部署

下载量 1.6M

发布时间 : 9/18/2024

模型简介

Llama 3.2是一个经过指令调优的纯文本生成模型，适用于多语言对话、代理检索和摘要任务，在多项基准测试中表现优异。

模型特点

多语言支持

官方支持8种语言，训练语言范围更广，开发者可针对其他语言进行微调。

长上下文处理

支持128k的上下文长度，适合处理长文档和复杂对话场景。

高效量化

提供4位分组量化和SpinQuant技术，优化移动端部署和推理速度。

人类偏好对齐

通过监督微调（SFT）和人类反馈强化学习（RLHF）实现与人类偏好的一致性。

模型能力

多语言文本生成

代码生成

长文档处理

对话系统

摘要生成

信息检索

使用案例

对话系统

多语言客服机器人

构建支持多种语言的智能客服系统，提供自然流畅的对话体验。

在西班牙语和印地语等语言的MMLU测试中表现优异。

内容生成

多语言内容创作

自动生成多种语言的营销文案、新闻摘要等内容。

在GSM8K数学问题和ARC-C推理测试中表现良好。

🚀 Llama 3.2多语言大语言模型

Llama 3.2是一系列多语言大语言模型，提供1B和3B大小的预训练和指令微调生成模型。它针对多语言对话场景进行了优化，在常见行业基准测试中表现出色，能为商业和研究领域提供强大的语言处理能力。

🚀 快速开始

使用`transformers`库

从transformers >= 4.43.0版本开始，你可以使用Transformers的pipeline抽象或借助Auto类的generate()函数进行对话推理。

确保通过以下命令更新transformers库：

pip install --upgrade transformers

示例代码如下：

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-3B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

你还可以在huggingface-llama-recipes找到关于如何在本地使用模型、使用torch.compile()、辅助生成、量化等详细方法。

使用原始`llama`代码库

请遵循仓库中的说明。

要下载原始检查点，可使用以下huggingface-cli命令示例：

huggingface-cli download meta-llama/Llama-3.2-3B-Instruct --include "original/*" --local-dir Llama-3.2-3B-Instruct

✨ 主要特性

多语言支持：官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语，且在更广泛的语言数据集上进行了训练。
优化架构：采用优化的Transformer架构，微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF），以符合人类对有用性和安全性的偏好。
多种模型规格：提供1B和3B大小的模型，以及量化版本，适用于不同计算资源和应用场景。
出色性能：在标准自动基准测试中，Llama 3.2模型在多个任务上表现出色，优于许多开源和闭源聊天模型。

📦 安装指南

更新`transformers`库

pip install --upgrade transformers

下载模型检查点

使用huggingface-cli下载原始检查点：

huggingface-cli download meta-llama/Llama-3.2-3B-Instruct --include "original/*" --local-dir Llama-3.2-3B-Instruct

💻 使用示例

基础用法

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-3B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

高级用法

在实际应用中，你可以根据具体需求调整模型的生成参数，例如max_new_tokens、temperature等，以获得不同风格和长度的生成结果。

📚 详细文档

模型信息

属性	详情
模型开发者	Meta
模型架构	自回归语言模型，使用优化的Transformer架构，微调版本使用SFT和RLHF
训练数据	公开可用在线数据的新组合，1B和3B模型在预训练阶段融入了Llama 3.1 8B和70B模型的logits
支持语言	英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语
模型发布日期	2024年9月25日
状态	基于离线数据集训练的静态模型，未来可能发布改进版本
许可证	Llama 3.2社区许可证

预期用途

预期用例

多语言商业和研究应用。
指令微调文本模型适用于类似助手的聊天和代理应用，如知识检索和总结、移动AI写作助手、查询和提示重写。
预训练模型可用于各种自然语言生成任务。
量化模型适用于计算资源有限的设备端应用。

不适用场景

违反适用法律法规（包括贸易合规法律）的使用。
违反可接受使用政策和Llama 3.2社区许可证的使用。
使用模型未明确支持的语言。

训练数据

Llama 3.2在多达9万亿个公开可用数据源的令牌上进行了预训练。对于1B和3B的Llama 3.2模型，在模型开发的预训练阶段融入了Llama 3.1 8B和70B模型的logits，修剪后使用知识蒸馏恢复性能。后训练阶段采用与Llama 3.1类似的方法，通过多轮对齐生成最终聊天模型，每轮包括监督微调（SFT）、拒绝采样（RS）和直接偏好优化（DPO）。

量化

量化方案

设计的量化方案考虑了模型质量、预填充/解码速度和内存占用等指标，结合了PyTorch的ExecuTorch推理框架和Arm CPU后端。具体包括：

所有Transformer块中的线性层权重量化为4位分组方案（组大小为32），激活量化为8位每个令牌的动态量化。
分类层权重量化为8位每通道，激活量化为8位每个令牌的动态量化。
嵌入层采用8位每通道量化。

量化感知训练和LoRA

量化感知训练（QAT）与低秩适应（LoRA）模型仅经过后训练阶段，使用与全精度模型相同的数据。初始化QAT时，利用监督微调（SFT）后获得的BF16 Llama 3.2模型检查点，并进行额外一轮的SFT训练。然后冻结QAT模型的主干，对Transformer块内的所有层应用LoRA适配器进行另一轮SFT训练，同时将LoRA适配器的权重和激活保持在BF16。最后，使用直接偏好优化（DPO）对生成的模型（包括主干和LoRA适配器）进行微调。

SpinQuant

应用了SpinQuant和生成后训练量化（GPTQ）。对于SpinQuant旋转矩阵微调，使用WikiText 2数据集中序列长度为2048的800个样本进行100次迭代优化。对于GPTQ，使用相同数据集和序列长度的128个样本。

基准测试 - 英文文本

基础预训练模型

类别	基准测试	样本数	指标	Llama 3.2 1B	Llama 3.2 3B	Llama 3.1 8B
通用	MMLU	5	macro_avg/acc_char	32.2	58	66.7
	AGIEval English	3 - 5	average/acc_char	23.3	39.2	47.8
	ARC-Challenge	25	acc_char	32.8	69.1	79.7
阅读理解	SQuAD	1	em	49.2	67.7	77
	QuAC (F1)	1	f1	37.9	42.9	44.9
	DROP (F1)	3	f1	28.0	45.2	59.5
长上下文	Needle in Haystack	0	em	96.8	1	1

指令微调模型

| 能力 | 基准测试 | 样本数 | 指标 | Llama 3.2 1B bf16 | Llama 3.2 1B Vanilla PTQ** | Llama 3.2 1B Spin Quant | Llama 3.2 1B QLoRA | Llama 3.2 3B bf16 | Llama 3.2 3B Vanilla PTQ** | Llama 3.2 3B Spin Quant | Llama 3.2 3B QLoRA | Llama 3.1 8B | | :---: | ----- | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | | 通用 | MMLU | 5 | macro_avg/acc | 49.3 | 43.3 | 47.3 | 49.0 | 63.4 | 60.5 | 62 | 62.4 | 69.4 | | 重写 | Open-rewrite eval | 0 | micro_avg/rougeL | 41.6 | 39.2 | 40.9 | 41.2 | 40.1 | 40.3 | 40.8 | 40.7 | 40.9 | | 总结 | TLDR9+ (test) | 1 | rougeL | 16.8 | 14.9 | 16.7 | 16.8 | 19.0 | 19.1 | 19.2 | 19.1 | 17.2 | | 指令遵循 | IFEval | 0 | Avg(Prompt/Instruction acc Loose/Strict) | 59.5 | 51.5 | 58.4 | 55.6 | 77.4 | 73.9 | 73.5 | 75.9 | 80.4 | | 数学 | GSM8K (CoT) | 8 | em_maj1@1 | 44.4 | 33.1 | 40.6 | 46.5 | 77.7 | 72.9 | 75.7 | 77.9 | 84.5 | | | MATH (CoT) | 0 | final_em | 30.6 | 20.5 | 25.3 | 31.0 | 48.0 | 44.2 | 45.3 | 49.2 | 51.9 | | 推理 | ARC-C | 0 | acc | 59.4 | 54.3 | 57 | 60.7 | 78.6 | 75.6 | 77.6 | 77.6 | 83.4 | | | GPQA | 0 | acc | 27.2 | 25.9 | 26.3 | 25.9 | 32.8 | 32.8 | 31.7 | 33.9 | 32.8 | | | Hellaswag | 0 | acc | 41.2 | 38.1 | 41.3 | 41.5 | 69.8 | 66.3 | 68 | 66.3 | 78.7 | | 工具使用 | BFCL V2 | 0 | acc | 25.7 | 14.3 | 15.9 | 23.7 | 67.0 | 53.4 | 60.1 | 63.5 | 67.1 | | | Nexus | 0 | macro_avg/acc | 13.5 | 5.2 | 9.6 | 12.5 | 34.3 | 32.4 | 31.5 | 30.1 | 38.5 | | 长上下文 | InfiniteBench/En.QA | 0 | longbook_qa/f1 | 20.3 | N/A | N/A | N/A | 19.8 | N/A | N/A | N/A | 27.3 | | | InfiniteBench/En.MC | 0 | longbook_choice/acc | 38.0 | N/A | N/A | N/A | 63.3 | N/A | N/A | N/A | 72.2 | | | NIH/Multi-needle | 0 | recall | 75.0 | N/A | N/A | N/A | 84.7 | N/A | N/A | N/A | 98.8 | | 多语言 | MGSM (CoT) | 0 | em | 24.5 | 13.7 | 18.2 | 24.4 | 58.2 | 48.9 | 54.3 | 56.8 | 68.9 |

**注：仅用于比较，模型未发布。

多语言基准测试

类别	基准测试	语言	Llama 3.2 1B	Llama 3.2 1B Vanilla PTQ**	Llama 3.2 1B Spin Quant	Llama 3.2 1B QLoRA	Llama 3.2 3B	Llama 3.2 3B Vanilla PTQ**	Llama 3.2 3B Spin Quant	Llama 3.2 3B QLoRA	Llama 3.1 8B
通用	MMLU (5-shot, macro_avg/acc)	葡萄牙语	39.8	34.9	38.9	40.2	54.5	50.9	53.3	53.4	62.1
		西班牙语	41.5	36.0	39.8	41.8	55.1	51.9	53.6	53.6	62.5
		意大利语	39.8	34.9	38.1	40.6	53.8	49.9	52.1	51.7	61.6
		德语	39.2	34.9	37.5	39.6	53.3	50.0	52.2	51.3	60.6
		法语	40.5	34.8	39.2	40.8	54.6	51.2	53.3	53.3	62.3
		印地语	33.5	30.0	32.1	34.0	43.3	40.4	42.0	42.1	50.9
		泰语	34.7	31.2	32.4	34.9	44.5	41.3	44.0	42.2	50.3

**注：仅用于比较，模型未发布。

推理时间

下表比较了不同量化方法（SpinQuant和QAT + LoRA）与BF16基线的性能指标。评估使用ExecuTorch框架作为推理引擎，以ARM CPU为后端，在Android OnePlus 12设备上进行。

类别	解码速度 (令牌/秒)	首令牌生成时间 (秒)	预填充速度 (令牌/秒)	模型大小 (PTE文件大小，MB)	内存大小 (RSS，MB)
1B BF16 (基线)	19.2	1.0	60.3	2358	3,185
1B SpinQuant	50.2 (2.6x)	0.3 (-76.9%)	260.5 (4.3x)	1083 (-54.1%)	1,921 (-39.7%)
1B QLoRA	45.8 (2.4x)	0.3 (-76.0%)	252.0 (4.2x)	1127 (-52.2%)	2,255 (-29.2%)
3B BF16 (基线)	7.6	3.0	21.2	6129	7,419
3B SpinQuant	19.7 (2.6x)	0.7 (-76.4%)	89.7 (4.2x)	2435 (-60.3%)	3,726 (-49.8%)
3B QLoRA	18.5 (2.4x)	0.7 (-76.1%)	88.8 (4.2x)	2529 (-58.7%)	4,060 (-45.3%)

() 性能测量采用基于adb二进制的方法。 () 在Android OnePlus 12设备上进行测量。 () 首令牌生成时间（TTFT）在提示长度为64时测量。

责任与安全

负责任的部署

Llama是一种基础技术，旨在用于各种用例。Meta的Llama模型负责任部署的示例可在社区故事网页找到。我们的方法是构建最有用的模型，通过调整模型安全性以适应通用用例并解决一系列标准危害，使世界受益于该技术。开发者负责根据其用例定制安全性，定义自己的政策并在其Llama系统中部署必要的保障措施。Llama 3.2的开发遵循了负责任使用指南中概述的最佳实践。

Llama 3.2 Instruct

我们进行安全微调的主要目标是为研究社区提供一个研究安全微调鲁棒性的有价值资源，并为开发者提供一个随时可用、安全且强大的模型，以减少部署安全AI系统的工作量。我们实施了与Llama 3相同的安全缓解措施，你可以在Llama 3 论文中了解更多信息。

我们采用多方面的数据收集方法，将供应商提供的人类生成数据与合成数据相结合，以减轻潜在的安全风险。我们开发了许多基于大语言模型（LLM）的分类器，使我们能够精心选择高质量的提示和响应，加强数据质量控制。

在Llama 3的基础上，我们非常重视模型对良性提示的拒绝以及拒绝语气。我们在安全数据策略中纳入了边界和对抗性提示，并修改了安全数据响应以遵循语气指南。

Llama 3.2系统

大型语言模型（包括Llama 3.2）并非设计用于单独部署，而是应作为整体AI系统的一部分，根据需要配备额外的安全护栏。开发者在构建代理系统时应部署系统保障措施。保障措施对于实现正确的有用性 - 安全性对齐以及减轻系统固有的安全和风险以及模型或系统与外部工具集成时的风险至关重要。作为我们负责任发布方法的一部分，我们为社区提供了保障措施，开发者应将其与Llama模型或其他LLM一起部署，包括Llama Guard、Prompt Guard和Code Shield。我们所有的参考实现演示默认包含这些保障措施，以便开发者能够立即从系统级安全中受益。

新功能和用例

Llama的发布通常会引入新功能，除了适用于所有生成式AI用例的最佳实践外，还需要进行特定考虑。对于Llama 3.2也支持的先前版本功能，请参阅Llama 3.1模型卡，因为这里适用相同的考虑因素。

Llama 3.2 1B和3B模型预计将部署在高度受限的环境中，如移动设备。使用较小模型的LLM系统将具有与更复杂、更大系统不同的对齐配置文件和安全/有用性权衡。开发者应确保其系统的安全性满足其用例的要求。我们建议在此类用例中使用更轻量级的系统保障措施，如Llama Guard 3 - 1B或其移动优化版本。

评估

我们构建了专门的对抗性评估数据集，并评估了由Llama模型和Purple Llama保障措施组成的系统，以过滤输入提示和输出响应。在上下文中评估应用程序非常重要，我们建议为你的用例构建专门的评估数据集。

我们进行了定期的红队演练，目标是通过对抗性提示发现风险，并利用这些经验改进我们的基准测试和安全调优数据集。我们早期与关键风险领域的专家合作，了解这些现实世界危害的性质以及此类模型如何可能对社会造成意外危害。基于这些对话，我们为红队制定了一组对抗性目标，例如提取有害信息或重新编程模型以发挥潜在有害作用。红队由网络安全、对抗性机器学习、负责任AI和完整性方面的专家以及具有特定地理市场完整性问题背景的多语言内容专家组成。

关键风险

除了上述安全工作外，我们还特别关注测量和/或减轻以下关键风险领域：

CBRNE（化学、生物、放射、核和爆炸武器）：Llama 3.2 1B和3B模型是Llama 3.1的较小且能力较弱的衍生模型。对于Llama 3.1 70B和405B，为评估与化学和生物武器扩散相关的风险，我们进行了提升测试，旨在评估使用Llama 3.1模型是否会显著增强恶意行为者计划或实施使用此类武器的攻击的能力，并确定此类测试也适用于较小的1B和3B模型。
儿童安全：我们使用专家团队进行了儿童安全风险评估，以评估模型产生可能导致儿童安全风险的输出的能力，并通过微调提供必要和适当的风险缓解建议。我们利用这些专家红队演练，通过Llama 3模型开发扩展了评估基准的覆盖范围。对于Llama 3，我们使用基于目标的方法进行了新的深入评估，以评估模型在多个攻击向量上的风险，包括Llama 3训练的额外语言。我们还与内容专家合作进行红队演练，评估潜在违规内容，同时考虑特定市场的细微差别或经验。
网络攻击：对于Llama 3.1 405B，我们的网络攻击提升研究调查了LLM是否能在技能水平和速度方面增强人类在黑客任务中的能力。我们的攻击自动化研究专注于评估LLM作为自主代理在网络攻击行动中的能力，特别是在勒索软件攻击的背景下。此评估与之前将LLM视为交互式助手的研究不同。主要目标是评估这些模型是否能在没有人类干预的情况下有效地作为独立代理执行复杂的网络攻击。由于Llama 3.2的1B和3B模型比Llama 3.1 405B更小且能力更弱，我们普遍认为对405B模型进行的测试也适用于Llama 3.2模型。

社区

生成式AI安全需要专业知识和工具，我们相信开放社区的力量可以加速其发展。我们是开放联盟的积极成员，包括AI联盟、AI合作组织和MLCommons，积极为安全标准化和透明度做出贡献。我们鼓励社区采用MLCommons概念验证评估等分类法，以促进安全和内容评估的协作和透明度。我们的Purple Llama工具已开源供社区使用，并广泛分布在包括云服务提供商在内的生态系统合作伙伴中。我们鼓励社区为我们的GitHub仓库做出贡献。

我们还设立了Llama影响赠款计划，以识别和支持Meta的Llama模型在教育、气候和开放创新三个类别中对社会有益的最引人注目的应用。数百份申请中的20名决赛选手可在此处找到。

最后，我们建立了一套资源，包括输出报告机制和漏洞赏金计划，以持续改进LLM的安全性和性能。

🔧 技术细节

训练硬件和软件

训练因素：使用自定义训练库、Meta定制的GPU集群和生产基础设施进行预训练。微调、量化、注释和评估也在生产基础设施上进行。
训练能源使用：在H100 - 80GB（TDP为700W）类型的硬件上累计使用了916k GPU小时进行训练。训练时间是训练每个模型所需的总GPU时间，功耗是每个GPU设备的峰值功率容量，已根据功率使用效率进行调整。
训练温室气体排放：估计基于位置的总温室气体排放量为240吨CO2eq。自2020年以来，Meta在其全球运营中保持净零温室气体排放，并以100%的可再生能源匹配其电力使用，因此基于市场的总温室气体排放量为0吨CO2eq。

训练数据处理

在预训练阶段，将Llama 3.1 8B和70B模型的输出（logits）作为令牌级目标融入到Llama 3.2的1B和3B模型中，修剪后使用知识蒸馏恢复性能。后训练阶段采用多轮对齐，包括监督微调（SFT）、拒绝采样（RS）和直接偏好优化（DPO）。

量化技术

量化方案设计：结合PyTorch的ExecuTorch推理框架和Arm CPU后端，考虑模型质量、预填充/解码速度和内存占用等指标，对线性层、分类层和嵌入层进行不同方式的量化。
量化感知训练和LoRA：利用监督微调（SFT）后获得的BF16 Llama 3.2模型检查点进行量化感知训练（QAT），冻结主干后应用LoRA适配器进行进一步微调，最后使用直接偏好优化（DPO）对模型进行微调。
SpinQuant应用：结合SpinQuant和生成后训练量化（GPTQ），对SpinQuant旋转矩阵进行100次迭代优化，使用WikiText 2数据集的特定样本进行训练。

📄 许可证

使用Llama 3.2受Llama 3.2社区许可证（自定义商业许可协议）的约束。

Llama 3.2社区许可协议

协议概述

“协议”指本协议中规定的使用、复制、分发和修改Llama材料的条款和条件。“文档”指Meta在https://llama.meta.com/doc/overview 上分发的随Llama 3.2提供的规范、手册和文档。“被许可方”或“你”指你、你的雇主或任何其他人或实体（如果你代表此类人或实体签订本协议），且你已达到适用法律、规则或法规要求的提供法律同意的年龄，并具有约束你的雇主或此类其他人或实体的法律权力（如果你代表他们签订本协议）。“Llama 3.2”指Meta在https://www.llama.com/llama-downloads 上分发的基础大语言模型、软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码和其他相关元素。“Llama材料”指Meta根据本协议提供的专有Llama 3.2和文档（及其任何部分）。“Meta”或“我们”指Meta Platforms Ireland Limited（如果你位于欧洲经济区或瑞士，或者你是一个实体，其主要营业地点在欧洲经济区或瑞士）和Meta Platforms, Inc.（如果你位于欧洲经济区或瑞士以外）。

通过点击下面的“我接受”或使用或分发Llama材料的任何部分或元素，你同意受本协议约束。

许可权利和再分发

权利授予：你被授予在Meta体现在Llama材料中的知识产权或其他权利下的非排他性、全球性、不可转让和免版税的有限许可，以使用、复制、分发、复制、创建衍生作品、修改Llama材料。
再分发和使用：
- 如果你分发或提供Llama材料（或其任何衍生作品），或包含其中任何内容的产品或服务（包括另一个AI模型），你应（A）随任何此类Llama材料提供本协议的副本；（B）在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。如果你使用Llama材料或Llama材料的任何输出或结果来创建、训练、微调或以其他方式改进一个AI模型，并进行分发或提供，则你还应在任何此类AI模型名称的开头包含“Llama”。
- 如果你作为集成最终用户产品的一部分从被许可方接收Llama材料或其任何衍生作品，则本协议第2条不适用于你。
- 你必须在分发的所有Llama材料副本中，在作为此类副本一部分分发的“通知”文本文件中保留以下归属声明：“Llama 3.2 is licensed under the Llama 3.2 Community License, Copyright © Meta Platforms, Inc. All Rights Reserved.”
- 你使用Llama材料必须遵守适用的法律法规（包括贸易合规法律法规），并遵守Llama材料的可接受使用政策（可在https://www.llama.com/llama3_2/use-policy 上获取），该政策特此通过引用并入本协议。

额外商业条款

如果在Llama 3.2版本发布日期，被许可方或被许可方的关联方提供的产品或服务在前一个日历月的月活跃用户数超过7亿，则你必须向Meta请求许可，Meta可自行决定是否授予你许可，并且在Meta明确授予你此类权利之前，你无权行使本协议下的任何权利。

保修免责声明

除非适用法律要求，Llama材料及其任何输出和结果按“原样”提供，不提供任何形式的保证，Meta放弃所有明示和暗示的保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。你独自负责确定使用或再分发Llama材料的适当性，并承担与使用Llama材料及其任何输出和结果相关的任何风险。

责任限制

在任何情况下，Meta或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、示范性或惩罚性损害承担责任，无论责任理论如何（无论是合同、侵权、疏忽、产品责任还是其他），即使Meta或其关联方已被告知此类损害的可能性。

知识产权

商标许可：本协议未授予任何商标许可，与Llama材料相关，除非在描述和再分发Llama材料的合理和惯常使用中或本第5(a)条规定的情况下，Meta和被许可方均不得使用对方或其任何关联方拥有或关联的任何名称或标记。Meta特此授予你仅为遵守第1.b.i条最后一句的要求使用“Llama”（“标记”）的许可。你将遵守Meta的品牌指南（目前可在https://about.meta.com/brand/resources/meta/company-brand/ 上获取）。因你使用标记而产生的所有商誉将归属于Meta。
衍生作品所有权：在Meta拥有Llama材料及其衍生作品的前提下，对于你对Llama材料进行的任何衍生作品和修改，在你和Meta之间，你是并将继续是此类衍生作品和修改的所有者。
侵权诉讼后果：如果你对Meta或任何实体提起诉讼或其他程序（包括诉讼中的反诉或反请求），声称Llama材料或Llama 3.2的输出或结果，或上述任何部分构成侵犯你拥有或可许可的知识产权或其他权利，则本协议授予你的任何许可将自此类诉讼或索赔提起之日起终止。你将赔偿并使Meta免受任何第三方因你使用或分发Llama材料而产生或与之相关的任何索赔。

期限和终止

本协议的期限将自你接受本协议或访问Llama材料之日起开始，并将持续有效，直至根据本协议的条款和条件终止。如果你违反本协议的任何条款或条件，Meta可终止本协议。本协议终止后，你应删除并停止使用Llama材料。第3、4和7条在本协议终止后仍然有效。

适用法律和管辖权

本协议将受加利福尼亚州法律管辖和解释，不考虑法律选择原则，《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 3.2可接受使用政策

Meta致力于促进其工具和功能（包括Llama 3.2）的安全和公平使用。如果你访问或使用Llama 3.2，你同意本可接受使用政策（“政策”）。本政策的最新副本可在https://www.llama.com/llama3_2/use-policy找到。

禁止使用

我们希望每个人都能安全、负责任地使用Llama 3.2。你同意你不会使用或允许他人使用Llama 3.2进行以下行为：

违反法律或他人权利：
- 从事、促进、生成、促成、鼓励、计划、煽动或进一步推动非法或违法活动或内容，例如：
  - 暴力或恐怖主义
  - 对儿童的剥削或伤害，包括招揽、创建、获取或传播儿童剥削内容或未能报告儿童性虐待材料
  - 人口贩运、剥削和性暴力
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未能对此类信息或材料采用法律要求的年龄限制
  - 性招揽
  - 任何其他犯罪活动
- 从事、促进、煽动或促成对个人或个人群体的骚扰、虐待、威胁或欺凌
- 从事、促进、煽动或促成在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何职业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
- 收集、处理、披露、生成或推断个人的私人或敏感信息，包括个人身份、健康或人口统计信息，除非你已根据适用法律获得这样做的权利
- 从事或促成任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用Llama材料的任何产品或服务的输出或结果
- 创建、生成或促成创建恶意代码、恶意软件、计算机病毒或做任何可能禁用、负担过重、干扰或损害网站或计算机系统的正常工作、完整性、操作或外观的事情
- 从事任何故意规避或移除使用限制或其他安全措施的行为，或促成任何此类行为，或启用Meta禁用的功能
从事可能导致死亡或身体伤害的活动：
- 从事、促进、煽动、促成或协助计划或开展对个人造成死亡或身体伤害风险的活动，包括与以下相关的Llama 3.2使用：
  - 军事、战争、核工业或应用、间谍活动、用于受美国国务院维护的《国际武器贸易条例》（ITAR）或1989年《美国生物武器反恐法》或1997年《化学武器公约实施法》约束的材料或活动
  - 枪支和非法武器（包括武器开发）
  - 非法药物和受管制/受控物质
  - 关键基础设施、运输技术或重型机械的操作
  - 自我伤害或伤害他人，包括自杀、切割和饮食失调
  - 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
故意欺骗或误导他人：
- 生成、促进或进一步推动欺诈或创建或促进虚假信息
- 生成、促进或进一步推动诽谤性内容，包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 表示Llama 3.2的使用或输出是人类生成的
- 生成或促成虚假的在线参与，包括虚假评论和其他虚假在线参与方式
未能适当披露已知危险：未能向最终用户适当披露你的AI系统的任何已知危险。
与非法工具或模型交互：与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互，并/或表示此类工具、模型或软件的输出与Meta或Llama 3.2相关联。