M

Meta Llama 3 70B Instruct FP8

由 RedHatAI 开发
Meta-Llama-3-70B-Instruct-FP8 是 Meta-Llama-3-70B-Instruct 的量化版本,通过 FP8 量化减少磁盘大小和 GPU 内存需求,同时保持高性能,适用于英文的商业和研究用途。
下载量 22.10k
发布时间 : 5/24/2024

模型简介

该模型是 Meta-Llama-3-70B-Instruct 的 FP8 量化版本,适用于类似助手的聊天场景,主要用于英文的商业和研究用途。

模型特点

FP8 量化
通过将权重和激活量化为 FP8 数据类型,显著减少磁盘大小和 GPU 内存需求,同时保持高性能。
高性能
在 OpenLLM 基准测试中平均得分为 79.16,接近未量化模型的 79.51,恢复率高达 99.55%。
高效部署
支持使用 vLLM 后端进行高效部署,提供与 OpenAI 兼容的服务。

模型能力

英文文本生成
聊天助手
商业和研究用途

使用案例

商业和研究
聊天助手
用于构建类似助手的聊天机器人,支持英文对话。
在 OpenLLM 基准测试中表现优异,接近未量化模型。
AIbase
智启未来,您的人工智能解决方案智库
简体中文