Llama-3.2-3B-Instruct-GGUF开源多语言大模型 - 免费部署助力高效对话交流

首页

Llama 3.2 3B Instruct GGUF

由 unsloth 开发

Llama-3.2-3B是Meta推出的多语言大语言模型，包含3B参数的预训练和指令调优生成模型，针对多语言对话用例进行了优化。

大型语言模型英语#多语言对话优化 #代理检索增强 #低内存微调

下载量 40.11k

发布时间 : 9/25/2024

模型简介

Llama-3.2-3B是一个多语言大语言模型，针对多语言对话用例进行了优化，包括代理检索和摘要任务。它在常见的行业基准测试中优于许多开源和闭源聊天模型。

模型特点

多语言支持

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等多种语言。

优化的transformer架构

采用优化的transformer架构，使用分组查询注意力(GQA)以提高推理可扩展性。

指令调优

使用监督微调(SFT)和基于人类反馈的强化学习(RLHF)来与人类偏好对齐，确保帮助性和安全性。

高性能

在常见的行业基准测试中优于许多开源和闭源聊天模型。

模型能力

文本生成

多语言对话

代理检索

摘要任务

使用案例

对话系统

多语言聊天机器人

用于构建支持多种语言的聊天机器人。

在常见的行业基准测试中优于许多开源和闭源聊天模型。

信息检索

代理检索

用于信息检索和代理任务。

文本处理

文本摘要

用于生成文本摘要。

🚀 Llama-3.2-3B

本项目提供了对Llama-3.2-3B模型的相关支持，包括不同比特位的GGUF上传、免费的微调笔记本等，能让你更高效地使用和微调该模型。

🚀 快速开始

查看全量版本

查看我们的模型集合，获取包括GGUF、4比特和原始16比特格式在内的所有Llama 3.2版本。

GGUF上传

提供16比特、8比特、6比特、5比特、4比特、3比特和2比特的上传版本。

免费微调

我们有一个免费的Google Colab Tesla T4笔记本用于Llama 3.2 (3B)，点击链接即可使用：免费笔记本

加入我们的社区：

模型详情

如需了解该模型的更多详细信息，请访问Meta的原始模型卡片

✨ 主要特性

免费微调

所有笔记本都 对初学者友好！添加你的数据集，点击“全部运行”，你将获得一个速度快2倍的微调模型，该模型可以导出为GGUF、vLLM格式或上传到Hugging Face。

Unsloth支持的模型	免费笔记本链接	性能提升	内存使用减少
Llama-3.2 (3B)	▶️ 在Colab上开始	2.4倍更快	58%更少
Llama-3.1 (11B vision)	▶️ 在Colab上开始	2.4倍更快	58%更少
Llama-3.1 (8B)	▶️ 在Colab上开始	2.4倍更快	58%更少
Phi-3.5 (mini)	▶️ 在Colab上开始	2倍更快	50%更少
Gemma 2 (9B)	▶️ 在Colab上开始	2.4倍更快	58%更少
Mistral (7B)	▶️ 在Colab上开始	2.2倍更快	62%更少
DPO - Zephyr	▶️ 在Colab上开始	1.9倍更快	19%更少

对话笔记本适用于ShareGPT ChatML / Vicuna模板。
文本完成笔记本适用于原始文本。DPO笔记本可复制Zephyr。
* Kaggle有2个T4，但我们使用1个。由于开销问题，1个T4快5倍。

特别感谢

非常感谢Meta和Llama团队创建并发布这些模型。

📚 详细文档

模型信息

Meta Llama 3.2多语言大语言模型（LLM）集合是一组预训练和指令微调的生成模型，大小为1B和3B（文本输入/文本输出）。Llama 3.2指令微调的纯文本模型针对多语言对话用例进行了优化，包括智能检索和摘要任务。在常见的行业基准测试中，它们的表现优于许多现有的开源和闭源聊天模型。

属性	详情
模型开发者	Meta
模型架构	Llama 3.2是一个自回归语言模型，使用了优化的Transformer架构。微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）来符合人类对有用性和安全性的偏好。
支持的语言	官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。Llama 3.2的训练语言比这8种支持的语言更广泛。开发者可以根据Llama 3.2社区许可证和可接受使用政策，对Llama 3.2模型进行微调以支持这些支持语言之外的语言。开发者应始终确保他们的部署（包括涉及其他语言的部署）是安全和负责任的。
Llama 3.2模型家族	标记计数仅指预训练数据。所有模型版本都使用分组查询注意力（GQA）来提高推理可扩展性。
模型发布日期	2024年9月25日
状态	这是一个在离线数据集上训练的静态模型。未来可能会发布改进模型能力和安全性的版本。
许可证	Llama 3.2的使用受 Llama 3.2社区许可证（自定义商业许可协议）的约束。