M

Meta Llama 3.1 70B Instruct Quantized.w8a8

由 RedHatAI 开发
这是Meta-Llama-3.1-70B-Instruct的量化版本,通过INT8权重量化降低GPU内存需求和磁盘空间,同时提高计算吞吐量,适用于多语言商业和研究场景。
下载量 7,002
发布时间 : 7/29/2024

模型简介

该模型是Meta-Llama-3.1-70B-Instruct的量化版本,通过INT8权重量化优化了性能,适用于类似助手的聊天场景,支持多种语言。

模型特点

多语言支持
支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等多种语言。
INT8量化优化
采用INT8激活量化和权重量化,减少GPU内存需求约50%,提高矩阵乘法计算吞吐量约2倍,同时减少磁盘空间需求约50%。
高性能表现
在多个基准测试中,该量化模型与未量化的Meta-Llama-3.1-70B-Instruct模型表现相近,恢复率较高。

模型能力

文本生成
多语言支持
聊天助手

使用案例

商业和研究
多语言聊天助手
适用于多种语言的商业和研究用途,提供类似助手的聊天功能。
在Arena-Hard、OpenLLM v1/v2、HumanEval等基准测试中表现优异。
AIbase
智启未来,您的人工智能解决方案智库
简体中文