Llama-2-13b-hf开源文本生成模型 - 免费使用产出高质量文本内容

首页

Llama 2 13b Hf

由 meta-llama 开发

Llama 2是由Meta开发的一系列预训练和微调的生成文本模型，规模从70亿到700亿参数不等。这是13B预训练模型，已转换为Hugging Face Transformers格式。

大型语言模型

Transformers

英语#多轮对话优化 #强化学习对齐 #4000标记上下文

下载量 62.51k

发布时间 : 7/13/2023

模型简介

Llama 2是一系列预训练和微调的生成文本模型，针对各种自然语言生成任务进行了优化。13B版本是中等规模的变体，平衡了性能和计算需求。

模型特点

优化的Transformer架构

采用优化的自回归Transformer架构，提供高效的文本生成能力

大规模预训练

在2万亿标记的新公开在线数据混合上进行训练，具有强大的语言理解能力

商业友好许可

提供自定义商业许可，适合商业和研究用途

安全对齐

微调版本通过监督微调和人类反馈强化学习对齐人类偏好

模型能力

文本生成

语言理解

对话生成

内容创作

使用案例

对话系统

智能助手

构建类似助手的聊天应用

在人类评估中与ChatGPT和PaLM等闭源模型相当

内容生成

创意写作

生成故事、诗歌等创意内容

技术写作

生成技术文档、报告等

🚀 Llama 2

Llama 2是一系列预训练和微调的生成式文本模型，参数规模从70亿到700亿不等。本仓库提供的是转换为Hugging Face Transformers格式的130亿参数预训练模型。其他模型的链接可在页面底部的索引中找到。

🚀 快速开始

使用本模型需遵守Meta的许可协议。若要下载模型权重和分词器，请访问网站，接受许可协议后再申请访问。

✨ 主要特性

模型规模多样：Llama 2有70亿、130亿和700亿等不同参数规模的版本，还有预训练和微调的不同变体。
性能出色：微调后的Llama-2-Chat模型在大多数测试基准上优于开源聊天模型，在有用性和安全性的人工评估中，与ChatGPT和PaLM等流行的闭源模型相当。
架构优化：采用优化的Transformer架构，微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）来符合人类对有用性和安全性的偏好。

📚 详细文档

模型详情

模型开发者：Meta
变体：Llama 2有不同的参数规模（7B、13B和70B），以及预训练和微调的变体。
输入：仅接受文本输入。
输出：仅生成文本。
模型架构：Llama 2是自回归语言模型，采用优化的Transformer架构。微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）来符合人类对有用性和安全性的偏好。

属性	详情
模型类型	自回归语言模型，采用优化的Transformer架构
训练数据	预训练数据来自公开可用的2万亿个标记，微调数据包括公开的指令数据集和超过100万个新的人工标注示例
训练时间	2023年1月至2023年7月
状态	基于离线数据集训练的静态模型，未来会根据社区反馈改进模型安全性并发布微调模型的新版本
许可证	可在此处获取自定义商业许可证
研究论文	"Llama-2: Open Foundation and Fine-tuned Chat Models"

预期用途

预期用例：Llama 2旨在用于英语的商业和研究用途。微调模型适用于类似助手的聊天场景，预训练模型可用于各种自然语言生成任务。要获得聊天版本的预期特性和性能，需要遵循特定的格式，包括INST和<<SYS>>标签、BOS和EOS标记，以及它们之间的空格和换行符（建议对输入调用strip()以避免双空格）。详细信息请参阅github上的参考代码：chat_completion。
超出范围的用途：禁止以任何违反适用法律法规（包括贸易合规法律）的方式使用；禁止在英语以外的语言中使用；禁止以违反Llama 2可接受使用政策和许可协议的任何其他方式使用。

硬件和软件

训练因素：预训练使用了自定义训练库、Meta的研究超级集群和生产集群。微调、标注和评估也在第三方云计算平台上进行。
碳足迹：预训练在A100 - 80GB（TDP为350 - 400W）类型的硬件上累计使用了330万个GPU小时的计算资源。估计总排放量为539 tCO2eq，其中100%由Meta的可持续发展计划抵消。

模型	时间（GPU小时）	功耗（W）	碳排放（tCO₂eq）
Llama 2 7B	184320	400	31.22
Llama 2 13B	368640	400	62.44
Llama 2 70B	1720320	400	291.42
总计	3311616	-	539.00

训练数据

概述：Llama 2在来自公开可用来源的2万亿个标记数据上进行预训练。微调数据包括公开可用的指令数据集，以及超过100万个新的人工标注示例。预训练和微调数据集均不包含Meta用户数据。
数据新鲜度：预训练数据截止到2022年9月，但部分微调数据更新至2023年7月。

评估结果

综合学术基准测试的整体性能

模型	规模	代码	常识推理	世界知识	阅读理解	数学	MMLU	BBH	AGI评估
Llama 1	7B	14.1	60.8	46.2	58.5	6.95	35.1	30.3	23.9
Llama 1	13B	18.9	66.1	52.6	62.3	10.9	46.9	37.0	33.9
Llama 1	33B	26.0	70.0	58.4	67.6	21.4	57.8	39.8	41.7
Llama 1	65B	30.7	70.7	60.5	68.6	30.8	63.4	43.5	47.6
Llama 2	7B	16.8	63.9	48.9	61.3	14.6	45.3	32.6	29.3
Llama 2	13B	24.5	66.9	55.4	65.8	28.7	54.8	39.4	39.1
Llama 2	70B	37.5	71.9	63.6	69.4	35.2	68.9	51.2	54.2

代码：报告模型在HumanEval和MBPP上的平均pass@1分数。
常识推理：报告PIQA、SIQA、HellaSwag、WinoGrande、ARC easy和challenge、OpenBookQA和CommonsenseQA的平均值。对于CommonsenseQA报告7-shot结果，其他基准报告0-shot结果。
世界知识：评估模型在NaturalQuestions和TriviaQA上的5-shot性能并报告平均值。
阅读理解：报告模型在SQuAD、QuAC和BoolQ上的0-shot平均值。
数学：报告GSM8K（8 shot）和MATH（4 shot）基准的top 1平均值。

预训练大语言模型在自动安全基准测试中的评估

模型	规模	TruthfulQA	Toxigen
Llama 1	7B	27.42	23.00
Llama 1	13B	41.74	23.08
Llama 1	33B	44.19	22.57
Llama 1	65B	48.71	21.77
Llama 2	7B	33.29	21.25
Llama 2	13B	41.86	26.10
Llama 2	70B	50.18	24.60

TruthfulQA：报告生成结果既真实又有信息价值的百分比（越高越好）。
Toxigen：报告生成有毒内容的百分比（越低越好）。

微调大语言模型在不同安全数据集上的评估

模型	规模	TruthfulQA	Toxigen
Llama-2-Chat	7B	57.04	0.00
Llama-2-Chat	13B	62.18	0.00
Llama-2-Chat	70B	64.14	0.01

伦理考量和局限性

Llama 2是一项新技术，使用时存在风险。目前的测试仅在英语环境中进行，无法涵盖所有场景。因此，与所有大语言模型一样，Llama 2的潜在输出无法提前预测，在某些情况下，模型可能会对用户提示产生不准确、有偏见或其他令人反感的回复。因此，在部署Llama 2的任何应用程序之前，开发人员应针对模型的特定应用进行安全测试和调整。

请参阅负责任使用指南。

问题报告

请通过以下方式报告模型的任何软件“漏洞”或其他问题：

报告模型问题：github.com/facebookresearch/llama
报告模型生成的有问题内容：developers.facebook.com/llama_output_feedback
报告漏洞和安全问题：facebook.com/whitehat/info

Llama模型索引

模型	Llama2	Llama2-hf	Llama2-chat	Llama2-chat-hf
7B	链接	链接	链接	链接
13B	链接	链接	链接	链接
70B	链接	链接	链接	链接

Llama 2社区许可协议

“协议”指本协议中规定的使用、复制、分发和修改Llama材料的条款和条件。

“文档”指Meta在https://ai.meta.com/resources/models-and-libraries/llama-downloads/上分发的Llama 2附带的规格、手册和文档。

“被许可方”或“您”指您，或您的雇主，或任何其他个人或实体（如果您代表该个人或实体签订本协议），且该个人或实体已达到适用法律、规则或法规要求的提供法律同意的年龄，并具有法律授权在您代表其签订本协议时约束您的雇主或该其他个人或实体。

“Llama 2”指基础大语言模型以及软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及Meta在ai.meta.com/resources/models-and-libraries/llama-downloads/上分发的上述内容的其他元素。

“Llama材料”指根据本协议提供的Meta专有的Llama 2和文档（及其任何部分）。

“Meta”或“我们”指Meta Platforms Ireland Limited（如果您位于欧洲经济区或瑞士，或者如果您是一个实体，您的主要营业地位于欧洲经济区或瑞士）和Meta Platforms, Inc.（如果您位于欧洲经济区或瑞士以外）。

通过点击下方的“我接受”，或使用或分发Llama材料的任何部分或元素，您同意受本协议约束。

1. 许可权利和再分发

权利授予：您被授予在Meta知识产权或Meta拥有的其他权利下，对Llama材料进行非排他性、全球性、不可转让且免版税的有限许可，以使用、复制、分发、拷贝、创建衍生作品并对Llama材料进行修改。
再分发和使用
- 如果您将Llama材料或其任何衍生作品分发给第三方，您应向该第三方提供本协议的副本。
- 如果您作为集成最终用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品，则本协议第2条不适用于您。
- 您必须在分发的所有Llama材料副本中，在作为此类副本一部分分发的“通知”文本文件中保留以下归属声明：“Llama 2根据Llama 2社区许可协议获得许可，版权所有 (c) Meta Platforms, Inc. 保留所有权利。”
- 您对Llama材料的使用必须遵守适用的法律法规（包括贸易合规法律和法规），并遵守Llama材料的可接受使用政策（可在https://ai.meta.com/llama/use-policy获取），该政策特此通过引用并入本协议。
- 您不得使用Llama材料或Llama材料的任何输出或结果来改进任何其他大语言模型（不包括Llama 2或其衍生作品）。

2. 额外商业条款

如果在Llama 2版本发布日期，被许可方或被许可方关联方提供的产品或服务的月活跃用户在前一个日历月超过7亿，则您必须向Meta请求许可，Meta可自行决定是否授予您许可，并且在Meta明确授予您此类权利之前，您无权行使本协议下的任何权利。

3. 保修免责声明

除非适用法律要求，否则Llama材料及其任何输出和结果均按“原样”提供，不附带任何形式的保证，无论是明示的还是暗示的，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发Llama材料的适当性，并承担与您使用Llama材料及其任何输出和结果相关的任何风险。

4. 责任限制

在任何情况下，Meta或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任，无论责任理论如何，包括合同、侵权、疏忽、产品责任或其他方面，即使Meta或其关联方已被告知此类损害的可能性。

5. 知识产权

本协议未授予任何商标许可，并且在涉及Llama材料时，除非在描述和再分发Llama材料时进行合理和惯常使用所需，否则Meta和被许可方均不得使用对方或其关联方拥有或关联的任何名称或标记。
鉴于Meta对Llama材料及其衍生作品的所有权，对于您对Llama材料进行的任何衍生作品和修改，在您和Meta之间，您是且将是此类衍生作品和修改的所有者。
如果您对Meta或任何实体提起诉讼或其他法律程序（包括在诉讼中的交叉索赔或反诉），声称Llama材料或Llama 2的输出或结果，或上述任何部分构成侵犯您拥有或可许可的知识产权或其他权利，则本协议授予您的任何许可应自此类诉讼或索赔提起之日起终止。您将赔偿并使Meta免受任何第三方因您使用或分发Llama材料而产生或与之相关的任何索赔。

6. 期限和终止

本协议的期限自您接受本协议或访问Llama材料时开始，并将持续有效，直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件，Meta可终止本协议。本协议终止后，您应删除并停止使用Llama材料。第3、4和7条在本协议终止后仍然有效。

7. 适用法律和管辖权

本协议应受加利福尼亚州法律管辖并依其解释，不考虑法律选择原则，并且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 2可接受使用政策

Meta致力于促进其工具和功能（包括Llama 2）的安全和公平使用。如果您访问或使用Llama 2，您同意遵守本可接受使用政策（“政策”）。本政策的最新版本可在ai.meta.com/llama/use-policy找到。

禁止使用

我们希望每个人都能安全、负责任地使用Llama 2。您同意您不会使用或允许他人使用Llama 2进行以下行为：

违反法律或他人权利
- 参与、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容，例如：
  - 暴力或恐怖主义
  - 对儿童的剥削或伤害，包括征集、创建、获取或传播儿童剥削内容，或未能报告儿童性虐待材料
  - 人口贩运、剥削和性暴力
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未能对此类信息或材料采用法律要求的年龄限制
  - 性招揽
  - 任何其他犯罪活动
- 参与、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 参与、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
- 在未获得适用法律要求的权利和同意的情况下，收集、处理、披露、生成或推断个人的健康、人口统计或其他敏感个人或私人信息
- 参与或便利任何侵犯、盗用或以其他方式侵犯任何第三方权利的行动或生成任何内容，包括使用Llama 2材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒或进行任何可能禁用、负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的其他操作
参与、促进、煽动、便利或协助策划或开展对个人造成死亡或身体伤害风险的活动
- 与军事、战争、核工业或应用、间谍活动、受美国国务院维护的《国际武器贸易条例》（ITAR）管制的材料或活动相关的Llama 2使用
- 枪支和非法武器（包括武器开发）
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或伤害他人，包括自杀、自残和饮食失调
- 任何旨在煽动或促进对个人的暴力、虐待或任何身体伤害的内容
故意欺骗或误导他人
- 生成、促进或进一步推动欺诈或创建或促进虚假信息
- 生成、促进或进一步推动诽谤性内容，包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 声称Llama 2的使用或输出是人类生成的
- 生成或便利虚假的在线互动，包括虚假评论和其他虚假在线互动手段
未能向最终用户适当披露您的人工智能系统的任何已知危险