库名称: transformers
语言:
-
阿拉伯语
-
德语
-
英语
-
西班牙语
-
法语
-
印地语
-
印尼语
-
意大利语
-
葡萄牙语
-
泰语
-
菲律宾语
-
越南语
标签:
-
facebook
-
meta
-
pytorch
-
llama
-
llama4
额外授权提示: >-
LLAMA 4社区许可协议
Llama 4版本生效日期:2025年4月5日
"协议"指本文规定的关于Llama材料使用、复制、分发和修改的条款和条件。
"文档"指Meta在https://www.llama.com/docs/overview发布的Llama 4配套规范、手册和文档。
"被许可方"或"您"指您、您的雇主或其他个人或实体(若您代表该个人或实体签署本协议),且需符合适用法律规定的法定同意年龄,并有法律授权代表雇主或其他实体签署本协议。
"Llama 4"指Meta在https://www.llama.com/llama-downloads发布的基础大语言模型及软件算法,包括机器学习模型代码、训练权重、推理代码、训练代码、微调代码等。
"Llama材料"指本协议下Meta提供的Llama 4和文档(或其部分内容)。
"Meta"或"我们"指Meta Platforms爱尔兰有限公司(若您位于欧洲经济区或瑞士)或Meta Platforms公司(若您位于其他地区)。
点击下方"我接受"或使用、分发Llama材料即表示您同意受本协议约束。
-
许可权利与再分发
a. 权利授予。您获得非独占、全球性、不可转让、免版税的有限许可,可使用、复制、分发、修改Llama材料。
b. 再分发要求:
i. 若分发Llama材料或其衍生作品,需附带本协议并在显著位置标注"基于Llama构建";若用于创建AI模型,需在模型名称前添加"Llama"。
ii. 若通过集成产品获得Llama材料,第2条不适用。
iii. 必须在分发副本中保留版权声明:"Llama 4采用Llama 4社区许可,版权所有© Meta Platforms公司"。
iv. 使用需遵守法律及可接受使用政策(https://www.llama.com/llama4/use-policy)。
-
商业条款。若月活跃用户超7亿,需向Meta申请额外许可。
-
免责声明。除非法律要求,Llama材料按"原样"提供,不附带任何明示或暗示保证。
-
责任限制。Meta不对任何间接、特殊、后果性损害承担责任。
-
知识产权
a. 仅允许为合规使用"Llama"商标,需遵循品牌指南。
b. 您拥有衍生作品的版权。
c. 若对Meta提起知识产权诉讼,许可自动终止。
-
期限与终止。违约时Meta可终止协议,终止后需删除材料。第3、4、7条持续有效。
-
适用法律。本协议受加州法律管辖,排除联合国国际货物销售合同公约。
额外授权字段:
名: 文本
姓: 文本
出生日期: 日期选择
国家: 国家选择
所属机构: 文本
职位:
类型: 下拉
选项:
- 学生
- 研究生
- AI研究员
- AI开发/工程师
- 记者
- 其他
地理位置: IP定位
勾选提交即接受许可条款并同意按Meta隐私政策处理信息: 复选框
额外授权说明: >-
所提供信息将按Meta隐私政策处理。
提交按钮内容: 提交
授权标题: "请提供完整法定姓名、出生日期及含公司标识的全称。避免使用缩写和特殊字符。未按要求填写可能无法访问此模型及Hugging Face其他资源。提交后不可编辑,请确保信息准确。"
许可证类型: 其他
许可证名称: llama4
模型信息
Llama 4系列是多模态AI模型,支持文本和图像理解。采用混合专家架构,提供行业领先性能。
本次发布两款高效模型:
- Llama 4 Scout:170亿参数,16专家
- Llama 4 Maverick:170亿参数,128专家
开发者: Meta
架构: 自回归语言模型,混合专家(MoE)架构,支持早期多模态融合。
模型名称 |
训练数据(含Meta产品公开数据) |
参数量 |
输入模态 |
输出模态 |
上下文长度 |
标记数 |
知识截止 |
Llama 4 Scout |
~40万亿标记 |
170亿(激活) |
多语言文本+图像 |
多语言文本+代码 |
10M |
~40T |
2024年8月 |
Llama 4 Maverick |
~22万亿标记 |
170亿(激活) |
多语言文本+图像 |
多语言文本+代码 |
1M |
~22T |
2024年8月 |
支持语言: 阿拉伯语、英语、法语等12种语言。
发布日期: 2025年4月5日
状态: 静态离线训练模型,未来可能发布优化版本。
许可证: Llama 4社区许可协议(链接)
使用场景
适用: 商业/研究用途,包括聊天助手、视觉推理、代码生成等。
不适用: 违反法律或可接受使用政策的行为,及超出12种支持语言的范围(注:开发者可自行微调其他200种语言,但需确保安全)。
使用示例
from transformers import pipeline
pipe = pipeline("text-generation", model="meta-llama/Llama-4-Scout-17B-16E", torch_dtype=torch.bfloat16)
output = pipe("玫瑰是红色的,", max_new_tokens=200)
硬件与能耗
训练能耗: 累计738万GPU小时(H100-80GB),碳排放1999吨(基于地理位置),因Meta使用可再生能源,市场碳排放为0。
基准测试
(表格显示Llama 4在MMLU、MATH等基准上优于Llama 3.1,具体数值略)
安全措施
- 微调数据: 结合人工标注与合成数据,降低安全风险
- 拒绝策略: 减少对良性提示的拒绝,优化语气
- 系统提示模板: 提供可定制的对话引导模板
- 防护工具: 集成Llama Guard、Prompt Guard等
关键风险管控
重点关注:
- CBRNE(化生放核爆)材料相关风险
- 儿童安全内容过滤
- 网络攻击能力评估
社区参与
通过开源工具、漏洞赏金计划等鼓励社区共建安全生态。
注意事项
Llama 4作为新技术存在不可预测的输出风险,开发者需针对具体应用进行安全测试。建议参考Meta提供的开发者指南和资源库。
(注:表格和部分技术细节因篇幅简化,完整内容请参考原文链接)