L

Llama 3.2 1B Instruct FP8

由 RedHatAI 开发
Llama-3.2-1B-Instruct的FP8量化版本,适用于多语言场景的商业和研究用途,性能接近原始模型。
下载量 1,718
发布时间 : 9/26/2024
模型介绍
内容详情
替代品

模型简介

这是一个基于Llama-3架构的1B参数指令微调模型,经过FP8量化优化,适用于类助手式对话场景。

模型特点

FP8量化
权重和激活均采用FP8量化,减少50%内存需求,提升2倍计算吞吐量
多语言支持
支持8种语言的文本生成任务
高性能保持
在多个基准测试中性能损失小于1%,接近原始模型
高效部署
支持vLLM后端部署,提供OpenAI兼容服务

模型能力

多语言文本生成
助手式对话
知识问答
任务完成

使用案例

智能助手
多语言客服机器人
部署为支持多种语言的在线客服助手
可处理常见客户咨询,支持8种语言
教育
语言学习助手
作为语言学习者的对话练习伙伴
提供多语言互动体验