M

Meta Llama 3.1 405B Instruct FP8 Dynamic

由 RedHatAI 开发
Meta-Llama-3.1-405B-Instruct的FP8量化版本,适用于多语言的商业和研究用途,特别优化用于助手机器人场景。
下载量 97
发布时间 : 7/23/2024
模型介绍
内容详情
替代品

模型简介

该模型是Meta-Llama-3.1-405B-Instruct的量化版本,通过将权重和激活量化为FP8数据类型,减少了约50%的磁盘大小和GPU内存需求。适用于类似助手的聊天场景。

模型特点

FP8量化
权重和激活量化为FP8数据类型,减少了约50%的磁盘大小和GPU内存需求。
多语言支持
支持多种语言,包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。
高恢复率
在多个基准测试中实现了接近原始模型的性能,如Arena-Hard评估中实现了99.0%的恢复率。

模型能力

文本生成
多语言对话
数学推理
多项选择任务

使用案例

聊天机器人
多语言助手
作为多语言助手机器人,支持多种语言的对话和任务完成。
在Arena-Hard评估中实现了66.7的得分。
研究工具
语言模型研究
用于研究量化对大型语言模型性能的影响。
在OpenLLM v1和v2评估中实现了接近原始模型的性能。