L

Llama 3.2 1B

由 meta-llama 开发
Llama 3.2是Meta推出的多语言大语言模型系列,包含1B和3B参数的预训练及指令调优生成模型,针对多语言对话场景优化,支持代理检索和摘要任务。
下载量 2.1M
发布时间 : 9/18/2024
模型介绍
内容详情
替代品

模型简介

Llama 3.2系列是基于优化Transformer架构的自回归语言模型,通过监督微调和人类反馈强化学习实现与人类偏好对齐,支持多语言文本生成与代码生成。

模型特点

多语言支持
官方支持8种语言,实际训练涵盖更广语言范围,开发者可微调其他语言模型。
长上下文处理
支持128k的上下文长度,适合处理长文档和复杂对话场景。
高效量化
采用三阶段量化方案,包括4位和8位量化,降低部署资源需求。
安全部署
提供三重安全策略,包括防范对抗性滥用和社区防护机制。

模型能力

多语言文本生成
代码生成
对话系统
代理检索
文本摘要

使用案例

多语言对话
多语言客服系统
构建支持多种语言的智能客服系统
在官方支持语言中表现优于多数开源和闭源聊天模型
内容生成
多语言内容创作
自动生成多语言营销文案或新闻摘要
在MMLU基准测试中3B模型英语得分63.4,中文55.1