L

Llama 3.2 3B Instruct FP8 Dynamic

由 RedHatAI 开发
Llama-3.2-3B-Instruct的FP8量化版本,适用于多语言的商业和研究用途,特别适合类似助手的聊天场景。
下载量 986
发布时间 : 9/25/2024

模型简介

该模型是Meta-Llama-3.2-3B-Instruct的量化版本,通过将权重和激活量化为FP8数据类型,减少了磁盘大小和GPU内存需求约50%。

模型特点

FP8量化
权重和激活量化为FP8数据类型,减少磁盘大小和GPU内存需求约50%。
多语言支持
支持多种语言,包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。
高效推理
优化后的模型适用于vLLM后端进行高效推理。

模型能力

文本生成
多语言聊天
商业和研究用途

使用案例

聊天机器人
多语言聊天助手
适用于类似助手的聊天场景,支持多种语言。
在OpenLLM基准测试中平均得分为50.88。
商业应用
商业咨询
提供商业咨询和问答服务。
AIbase
智启未来,您的人工智能解决方案智库
简体中文