L

Llama 3.2 3B Instruct SpinQuant INT4 EO8

由 meta-llama 开发
Llama 3.2是Meta推出的1B和3B参数规模的多语言预训练和指令调优生成模型,针对多语言对话用例优化,支持8种官方语言。
下载量 30.02k
发布时间 : 10/23/2024
模型介绍
内容详情
替代品

模型简介

Llama 3.2包含1B和3B大小的预训练和指令调优生成模型,针对多语言对话用例进行了优化,包括代理检索和摘要任务。

模型特点

多语言支持
官方支持8种语言,训练语言范围更广,开发者可针对其他语言进行微调
高效推理
采用分组查询注意力(GQA)提高推理可扩展性,优化移动设备部署
长上下文处理
支持128k上下文长度,适合处理长文档和复杂对话
量化优化
提供SpinQuant和QLoRA量化方案,显著减少模型大小和提高推理速度

模型能力

多语言文本生成
对话系统
知识检索
文本摘要
提示重写
多轮对话
长文本处理

使用案例

对话助手
多语言聊天机器人
构建支持多种语言的智能对话助手
在8种官方语言上表现优异
内容生成
多语言内容创作
生成多语言的营销文案、社交媒体内容等
支持流畅的文本生成
知识检索
企业知识库问答
基于企业文档构建问答系统
能够准确检索和总结信息