库名称: transformers
语言:
-
阿拉伯语
-
德语
-
英语
-
西班牙语
-
法语
-
印地语
-
印尼语
-
意大利语
-
葡萄牙语
-
泰语
-
他加禄语
-
越南语
标签:
-
facebook
-
meta
-
pytorch
-
llama
-
llama4
额外授权提示: >-
LLAMA 4社区许可协议
Llama 4版本生效日期:2025年4月5日
"协议"指本文规定的Llama材料使用、复制、分发和修改的条款和条件。
"文档"指Meta在https://www.llama.com/docs/overview分发的Llama 4随附的规格说明书、手册和文档。
"被许可方"或"您"指您、您的雇主或任何其他个人或实体(如果您代表该个人或实体签订本协议),且根据适用法律、规则或法规已达到提供法律同意的年龄,并具有法律授权在代表您的雇主或其他个人或实体签订本协议时约束他们。
"Llama 4"指基础大型语言模型和软件及算法,包括机器学习模型代码、训练模型权重、推理启用代码、训练启用代码、微调启用代码以及Meta在https://www.llama.com/llama-downloads分发的上述其他元素。
"Llama材料"统指Meta根据本协议提供的专有Llama 4和文档(及其任何部分)。
"Meta"或"我们"指Meta Platforms爱尔兰有限公司(如果您位于欧洲经济区或瑞士,或作为实体,您的主要营业地点位于欧洲经济区或瑞士)和Meta Platforms公司(如果您位于欧洲经济区或瑞士以外)。
点击下方的"我接受"或使用或分发Llama材料的任何部分或元素,即表示您同意受本协议约束。
- 许可权利和再分发。
a. 权利授予。根据Meta在Llama材料中体现的知识产权或其他权利,授予您非排他性、全球性、不可转让且免版税的有限许可,以使用、复制、分发、复制、创建衍生作品和修改Llama材料。
b. 再分发和使用。
i. 如果您分发或提供Llama材料(或其任何衍生作品),或包含其中任何部分的产品或服务(包括其他AI模型),您应(A)随任何此类Llama材料提供本协议的副本;(B)在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示"Built with Llama"。如果您使用Llama材料或其任何输出来创建、训练、微调或以其他方式改进AI模型,并在分发或提供该AI模型时,您还应在任何此类AI模型名称的开头包含"Llama"。
ii. 如果您作为集成终端用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品,则本协议第2条不适用于您。
iii. 您必须在分发的所有Llama材料副本中保留以下归属声明,作为此类副本的一部分在"Notice"文本文件中分发:"Llama 4根据Llama 4社区许可协议获得许可,版权所有© Meta Platforms, Inc.保留所有权利。"
iv. 您对Llama材料的使用必须遵守适用的法律法规(包括贸易合规法律法规)并遵守Llama材料的可接受使用政策(可在https://www.llama.com/llama4/use-policy获取),该政策通过引用并入本协议。
-
附加商业条款。如果在Llama 4版本发布之日,由被许可方或其关联公司提供的产品或服务的月活跃用户在前一个日历月超过7亿月活跃用户,您必须向Meta申请许可,Meta可自行决定是否授予您许可,除非或直到Meta明确授予您此类权利,否则您无权行使本协议下的任何权利。
-
免责声明。除非适用法律要求,Llama材料及其任何输出和结果均按"原样"提供,不提供任何形式的保证,Meta否认所有明示或默示的保证,包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您全权负责确定使用或再分发Llama材料的适当性,并承担与使用Llama材料及其任何输出和结果相关的所有风险。
-
责任限制。在任何情况下,Meta或其关联公司均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、附带性、示范性或惩罚性损害承担责任,无论基于何种责任理论(合同、侵权、疏忽、产品责任或其他),即使Meta或其关联公司已被告知此类损害的可能性。
-
知识产权。
a. 本协议未授予任何商标许可,在与Llama材料相关的使用中,Meta和被许可方均不得使用对方或其关联公司拥有或关联的任何名称或标志,除非为合理和惯常使用以描述和再分发Llama材料或如第5(a)条所述。Meta特此授予您使用"Llama"("标志")的许可,仅用于遵守第1.b.i条最后一句话的要求。您将遵守Meta的品牌指南(当前可在https://about.meta.com/brand/resources/meta/company-brand/获取)。您使用标志所产生的所有商誉将归属于Meta。
b. 在Meta对Llama材料及Meta制作或为其制作的衍生作品的所有权的前提下,对于您制作的Llama材料的任何衍生作品和修改,在您和Meta之间,您现在是并将继续是此类衍生作品和修改的所有者。
c. 如果您对Meta或任何实体提起诉讼或其他程序(包括诉讼中的交叉索赔或反诉),指控Llama材料或Llama 4输出或结果或其任何部分构成对您拥有或可许可的知识产权或其他权利的侵权,则本协议授予您的所有许可应自该诉讼或索赔提交或提起之日起终止。您将赔偿并使Meta免受因您使用或分发Llama材料而引起的任何第三方索赔的损害。
-
期限和终止。本协议自您接受本协议或访问Llama材料之日起生效,并将持续有效直至根据本文条款和条件终止。如果您违反本协议的任何条款或条件,Meta可终止本协议。本协议终止后,您应删除并停止使用Llama材料。第3、4和7条在本协议终止后仍然有效。
-
适用法律和管辖权。本协议将根据加利福尼亚州法律解释和执行,不考虑法律冲突原则,且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州法院对本协议引起的任何争议具有专属管辖权。
额外授权字段:
名字: 文本
姓氏: 文本
出生日期: 日期选择器
国家: 国家
所属机构: 文本
职位:
类型: 选择
选项:
- 学生
- 研究生
- AI研究员
- AI开发人员/工程师
- 记者
- 其他
地理位置: IP定位
点击下方的提交按钮即表示我接受许可条款,并确认我提供的信息将根据Meta隐私政策进行收集、存储、处理和共享: 复选框
额外授权描述: >-
您提供的信息将根据Meta隐私政策进行收集、存储、处理和共享。
额外授权按钮内容: 提交
额外授权标题: "请务必提供您的全名、出生日期和完整的组织名称(包含所有公司标识符)。避免使用缩写和特殊字符。未遵循这些说明可能会阻止您访问此模型及Hugging Face上的其他模型。提交后您将无法编辑此表单,因此请确保所有信息准确无误。"
许可证: 其他
许可证名称: llama4
模型信息
Llama 4系列模型是原生多模态AI模型,支持文本和多模态体验。这些模型采用混合专家架构,在文本和图像理解方面提供行业领先的性能。
Llama 4模型标志着Llama生态系统新时代的开始。我们在Llama 4系列中推出了两款高效模型:Llama 4 Scout(170亿参数,16位专家)和Llama 4 Maverick(170亿参数,128位专家)。
模型开发者: Meta
模型架构: Llama 4模型是自回归语言模型,采用混合专家(MoE)架构,并通过早期融合实现原生多模态。
模型名称 |
训练数据 |
参数 |
输入模态 |
输出模态 |
上下文长度 |
标记数量 |
知识截止日期 |
Llama 4 Scout (17Bx16E) |
混合公开可用数据、许可数据以及来自Meta产品和服务的信息。这包括Instagram和Facebook上公开分享的帖子以及人们与Meta AI的互动。更多信息请参阅我们的隐私中心。 |
170亿(激活) 1090亿(总计) |
多语言文本和图像 |
多语言文本和代码 |
1000万 |
约40万亿 |
2024年8月 |
Llama 4 Maverick (17Bx128E) |
170亿(激活) 4000亿(总计) |
多语言文本和图像 |
多语言文本和代码 |
100万 |
约22万亿 |
2024年8月 |
支持语言: 阿拉伯语、英语、法语、德语、印地语、印尼语、意大利语、葡萄牙语、西班牙语、他加禄语、泰语和越南语。
模型发布日期: 2025年4月5日
状态: 这是一个基于离线数据集训练的静态模型。未来可能会根据社区反馈发布改进后的调优模型版本。
许可证: 自定义商业许可证Llama 4社区许可协议可在https://github.com/meta-llama/llama-models/blob/main/models/llama4/LICENSE获取。
关于模型的疑问或意见反馈: 有关如何提供模型反馈或意见的说明可在Llama README中找到。有关生成参数的技术信息及如何在应用中使用Llama 4的配方,请访问此处。
预期用途
预期用例: Llama 4适用于多种语言的商业和研究用途。指令调优模型适用于类似助手的聊天和视觉推理任务,而预训练模型可适用于自然语言生成。对于视觉,Llama 4模型还优化了视觉识别、图像推理、字幕生成和回答关于图像的一般问题。Llama 4模型集合还支持利用其模型输出来改进其他模型,包括合成数据生成和蒸馏。Llama 4社区许可允许这些用例。
超出范围: 以任何违反适用法律法规(包括贸易合规法律)的方式使用。以任何被可接受使用政策和Llama 4社区许可禁止的其他方式使用。使用超出本模型卡明确引用支持的语言或能力。**
注意:
-
Llama 4的训练语言比12种支持语言更广泛(预训练包括200种语言)。开发者可以对Llama 4模型进行超出12种支持语言的微调,前提是遵守Llama 4社区许可和可接受使用政策。开发者有责任确保在额外语言中使用Llama 4是安全且负责任的。
-
Llama 4已针对最多5张输入图像的图像理解能力进行测试。如果利用超出此范围的额外图像理解能力,开发者有责任确保其部署已针对风险进行缓解,并应进行额外的测试和调优以适应其特定应用。
如何使用transformers
请确保已安装transformers v4.51.0
或通过pip install -U transformers
升级。
from transformers import pipeline
import torch
model_id = "meta-llama/Llama-4-Maverick-17B-128E"
pipe = pipeline(
"text-generation",
model=model_id,
device_map="auto",
torch_dtype=torch.bfloat16
)
output = pipe("Roses are red,", max_new_tokens=200)
硬件和软件
训练因素: 我们使用自定义训练库、Meta自建的GPU集群和生产基础设施进行预训练。微调、量化、标注和评估也在生产基础设施上进行。
训练能源使用: 模型预训练累计使用了738万GPU小时的H100-80GB(TDP为700W)硬件计算,如下表所示。训练时间是训练每个模型所需的总GPU时间,功耗是每GPU设备的峰值功率容量,根据电源使用效率调整。
训练温室气体排放: 基于位置的温室气体排放总量估计为1999吨CO2当量。