Llama 3.2-1B-Instruct-GGUF开源大模型 - 免费部署助力多语言对话交流

首页

Llama 3.2 1B Instruct GGUF

由 unsloth 开发

Llama 3.2是由Meta开发的多语言大语言模型系列之一，包含1B参数的指令调优版本，针对多语言对话用例进行了优化。

大型语言模型

Transformers

英语#多语言对话优化 #指令微调加速 #低资源高效推理

下载量 282.08k

发布时间 : 9/25/2024

模型简介

Llama 3.2是一个1B参数的指令调优大语言模型，针对多语言对话、代理检索和摘要任务进行了优化，在多个基准测试中表现优异。

模型特点

多语言支持

官方支持8种语言，但训练语言范围更广，可针对其他语言进行微调

指令调优优化

使用监督微调(SFT)和人类反馈强化学习(RLHF)与人类偏好对齐

高效推理

采用分组查询注意力(GQA)提高推理可扩展性

Unsloth优化

通过Unsloth技术实现5倍速度提升和70%内存降低

模型能力

多语言文本生成

对话系统

文本摘要

代理检索

指令跟随

使用案例

对话系统

多语言聊天助手

构建支持多种语言的智能对话助手

在常见基准测试中优于许多开源和闭源聊天模型

信息处理

文档摘要

自动生成长文档的简洁摘要

信息检索

作为代理系统的一部分进行信息检索

🚀 unsloth/Llama-3.2-1B-Instruct

本项目提供了对Llama 3.2模型的微调支持，能让模型在训练时速度提升、内存使用降低。同时提供了多种格式的模型上传，以及免费的Google Colab笔记本供用户使用。

🚀 快速开始

模型版本查看

查看我们的模型集合，获取包括GGUF、4位和原始16位格式在内的所有Llama 3.2版本。

GGUF上传

提供16位、8位、6位、5位、4位、3位和2位的模型上传。

免费微调

我们有一个免费的Google Colab Tesla T4笔记本用于Llama 3.2 (3B)，点击链接即可使用：免费笔记本

模型详情

如需了解模型的更多详细信息，请访问Meta的原始模型卡片

✨ 主要特性

免费微调

所有笔记本都 对初学者友好！添加你的数据集，点击“全部运行”，你将获得一个速度快2倍的微调模型，该模型可以导出为GGUF、vLLM格式或上传到Hugging Face。

Unsloth支持的模型	免费笔记本链接	性能提升	内存使用降低
Llama-3.2 (3B)	▶️ 在Colab上开始	2.4倍更快	58% 更少
Llama-3.1 (11B 视觉模型)	▶️ 在Colab上开始	2.4倍更快	58% 更少
Llama-3.1 (8B)	▶️ 在Colab上开始	2.4倍更快	58% 更少
Phi-3.5 (mini)	▶️ 在Colab上开始	2倍更快	50% 更少
Gemma 2 (9B)	▶️ 在Colab上开始	2.4倍更快	58% 更少
Mistral (7B)	▶️ 在Colab上开始	2.2倍更快	62% 更少
DPO - Zephyr	▶️ 在Colab上开始	1.9倍更快	19% 更少

其他实用笔记本

这个对话笔记本对ShareGPT ChatML / Vicuna模板很有用。
这个文本补全笔记本用于原始文本。这个 DPO笔记本可复制Zephyr模型。
* Kaggle有2个T4 GPU，但我们只用1个。由于开销问题，1个T4 GPU的速度快5倍。

📚 详细文档

特别感谢

非常感谢Meta和Llama团队创建并发布这些模型。

模型信息

Meta Llama 3.2多语言大语言模型（LLM）集合是一组预训练和指令微调的生成模型，有10亿和30亿参数规模（文本输入/文本输出）。Llama 3.2指令微调的纯文本模型针对多语言对话用例进行了优化，包括智能检索和摘要任务。在常见的行业基准测试中，它们的表现优于许多现有的开源和闭源聊天模型。

属性	详情
模型开发者	Meta
模型架构	Llama 3.2是一个自回归语言模型，使用了优化的Transformer架构。微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）来符合人类对有用性和安全性的偏好。
支持语言	官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。Llama 3.2在比这8种支持语言更广泛的语言集合上进行了训练。开发者可以对Llama 3.2模型进行微调以支持这些支持语言之外的语言，前提是他们遵守Llama 3.2社区许可证和可接受使用政策。开发者始终应确保他们的部署（包括涉及其他语言的部署）是安全和负责任的。
模型发布日期	2024年9月25日
状态	这是一个在离线数据集上训练的静态模型。未来可能会发布改进模型能力和安全性的版本。
许可证	Llama 3.2的使用受 Llama 3.2社区许可证（自定义商业许可协议）的约束。