L

Llama 3.2 3B Instruct

由 meta-llama 开发
Llama 3.2是由Meta开发的多语言大语言模型系列,包含1B和3B规模的预训练及指令调优生成模型,针对多语言对话场景优化。
下载量 1.6M
发布时间 : 9/18/2024
模型介绍
内容详情
替代品

模型简介

Llama 3.2是一个经过指令调优的纯文本生成模型,适用于多语言对话、代理检索和摘要任务,在多项基准测试中表现优异。

模型特点

多语言支持
官方支持8种语言,训练语言范围更广,开发者可针对其他语言进行微调。
长上下文处理
支持128k的上下文长度,适合处理长文档和复杂对话场景。
高效量化
提供4位分组量化和SpinQuant技术,优化移动端部署和推理速度。
人类偏好对齐
通过监督微调(SFT)和人类反馈强化学习(RLHF)实现与人类偏好的一致性。

模型能力

多语言文本生成
代码生成
长文档处理
对话系统
摘要生成
信息检索

使用案例

对话系统
多语言客服机器人
构建支持多种语言的智能客服系统,提供自然流畅的对话体验。
在西班牙语和印地语等语言的MMLU测试中表现优异。
内容生成
多语言内容创作
自动生成多种语言的营销文案、新闻摘要等内容。
在GSM8K数学问题和ARC-C推理测试中表现良好。