L

Llama 4 Scout 17B 16E Instruct FP8 Dynamic

由 RedHatAI 开发
基于Llama-4构建的17B参数多语言指令模型,采用FP8量化优化,显著降低资源需求
下载量 5,812
发布时间 : 4/10/2025
模型介绍
内容详情
替代品

模型简介

这是一个经过FP8量化的多语言大语言模型,支持文本和图像输入,输出文本响应。通过量化技术减少50%内存需求和磁盘空间,同时提升计算效率。

模型特点

FP8量化优化
权重和激活值均采用FP8量化,减少50%内存需求和磁盘空间,提升2倍计算吞吐量
多模态支持
支持图像和文本输入,可处理多模态任务
多语言能力
支持12种语言的文本处理和生成

模型能力

文本生成
图像理解
多语言处理
指令跟随

使用案例

智能助手
多语言客服机器人
构建支持多种语言的智能客服系统
可流畅处理12种语言的客户咨询
内容生成
多语言内容创作
自动生成多语言营销文案或社交媒体内容