extra_gated_heading: 访问此模型需向Meta提交联系信息
extra_gated_prompt: >-
LLAMA 2社区许可协议
"协议"指本文规定的Llama材料使用、复制、分发和修改条款。
"文档"指Meta在https://ai.meta.com/resources/models-and-libraries/llama-downloads/发布的Llama 2配套规范、手册和文档。
"被许可方"或"您"指达到适用法律规定的法定年龄,具有法律约束力的个人或实体(若代表他人签订本协议)。
"Llama 2"指Meta在ai.meta.com/resources/models-and-libraries/llama-downloads/发布的基础大语言模型及相关算法,包括机器学习模型代码、训练权重、推理代码等。
"Llama材料"统指Meta根据本协议提供的Llama 2及其文档。
"Meta"或"我们"指Meta Platforms爱尔兰有限公司(欧盟/瑞士用户)或Meta Platforms公司(其他地区用户)。
点击"接受"或使用/分发Llama材料即表示同意受本协议约束。
-
许可权利与再分发
a. 权利授予:授予非独占、全球性、不可转让、免版税的有限许可,允许使用、复制、分发Llama材料并创建衍生作品。
b. 再分发要求:
i. 向第三方分发时须附带本协议;
ii. 通过集成产品获取Llama材料时不适用第2条;
iii. 须保留版权声明:"Llama 2采用LLAMA 2社区许可,版权所有(c) Meta Platforms, Inc.";
iv. 使用须符合法律法规及《可接受使用政策》;
v. 不得用于改进其他大语言模型(Llama 2衍生作品除外)。
-
商业条款:若月活用户超7亿,须额外申请商业许可。
-
免责声明:除非法律要求,Llama材料按"原样"提供,不承担任何明示或默示担保。
-
责任限制:Meta不对任何间接、特殊、后果性损害承担责任。
-
知识产权:
a. 不授予商标使用权;
b. 衍生作品所有权归修改者;
c. 提起侵权诉讼将自动终止许可。
-
协议期限:自接受协议起生效,违约时Meta可终止。终止后须停止使用并删除材料。
-
适用法律:受加利福尼亚州法律管辖,排除《联合国国际货物销售合同公约》。
Llama 2可接受使用政策
禁止用途包括:
- 违法活动:暴力、儿童剥削、人口贩卖、非法职业行为等;
- 高危活动:军事、武器开发、关键基础设施操作等;
- 欺骗行为:生成虚假信息、垃圾邮件、冒充他人等;
- 未披露AI系统风险。
违规举报渠道:
- 模型问题:github.com/facebookresearch/llama
- 风险输出:developers.facebook.com/llama_output_feedback
- 安全漏洞:facebook.com/whitehat/info
- 政策违规:LlamaUseReport@meta.com
extra_gated_fields:
名: text
姓: text
出生日期: date_picker
国家: country
所属机构: text
地理位置: ip_location
点击提交即表示接受许可条款,并同意根据Meta隐私政策处理提交的信息: checkbox
extra_gated_description: 所提交信息将按照Meta隐私政策进行收集、存储和处理。
extra_gated_button_content: 提交
language:
- 代码
pipeline_tag: 文本生成
tags:
- facebook
- meta
- pytorch
- llama
- llama-2
license: llama2
Code Llama
Code Llama是由70亿到340亿参数规模的预训练及微调生成文本模型系列。本仓库为Hugging Face Transformers格式的70亿参数Python专用版本,适用于通用代码生成与理解任务。其他模型索引见底部表格。
使用方式
安装依赖:
pip install transformers accelerate
功能支持:
- [x] 代码补全
- [ ] 代码填充
- [ ] 指令交互
- [x] Python专项
模型详情
注:使用需遵守Meta许可协议
开发者 Meta
变体 提供三种规模(7B/13B/34B)和三种类型:
- 基础版:通用代码生成与理解
- Python专用版
- 指令微调版
本仓库包含7B参数的Python专用版本
输入 仅接受文本
输出 仅生成文本
架构 基于优化Transformer的自回归语言模型
训练时间 2023年1月至7月
状态 静态离线训练模型
许可 商业许可见:官网链接
论文 《Code Llama: 代码开源基础模型》
预期用途
适用场景
- 商业与研究用途(英语及相关编程语言)
- 基础版:通用代码任务
- Python版:Python专项处理
- 指令版:更安全的代码助手
非适用场景
- 违反法律法规的使用
- 非英语场景
- 违反《可接受使用政策》的行为
硬件与训练
训练设施 使用Meta研究超级集群
碳足迹 总训练耗用40万A100-80GB GPU小时,排放65.3吨CO2当量(已通过碳中和计划抵消)
训练数据
训练数据与Llama 2相同(详见论文第2章)
评估结果
参见论文第3章主模型评估与第4章安全评估
伦理与限制
作为新兴技术,Code Llama存在使用风险:
- 当前仅测试英语场景
- 可能产生不准确/不当输出
- 部署前需进行应用场景专项安全测试
请参阅《负责任使用指南》:官网链接