L

Llama 3.3 70B Instruct FP8 Dynamic

由 RedHatAI 开发
Llama-3.3-70B-Instruct-FP8-dynamic 是经过优化的大语言模型,通过将激活和权重量化为 FP8 数据类型,减少了 GPU 内存需求并提高了计算吞吐量,支持多语言的商业和研究用途。
下载量 6,060
发布时间 : 12/11/2024

模型简介

指令微调的文本模型适用于类似助手的聊天场景,预训练模型可适应各种自然语言生成任务,并且 Llama 3.3 模型还支持利用其模型的输出来改进其他模型,包括合成数据生成和蒸馏。

模型特点

FP8 量化优化
通过将激活和权重量化为 FP8 数据类型,减少了 GPU 内存需求(约 50%),并提高了矩阵乘法的计算吞吐量(约 2 倍),同时也将磁盘大小需求减少了约 50%。
多语言支持
支持英语、法语、意大利语、葡萄牙语、印地语、西班牙语、泰语和德语等多种语言,适用于不同语言环境的商业和研究用途。
高效部署
支持使用 vLLM 后端进行高效部署,并兼容 OpenAI 兼容的服务。

模型能力

文本生成
多语言支持
聊天助手
自然语言处理
指令微调

使用案例

商业和研究
多语言聊天助手
适用于不同语言环境的商业和研究用途,提供类似助手的聊天场景支持。
自然语言生成
预训练模型可适应各种自然语言生成任务。
模型改进
合成数据生成
利用模型的输出来改进其他模型,包括合成数据生成和蒸馏。
AIbase
智启未来,您的人工智能解决方案智库
简体中文