L

Llama 4 Maverick 17B 128E Instruct FP8

由 meta-llama 开发
Llama 4系列是Meta开发的多模态AI模型,支持文本与图像交互,采用混合专家架构(MoE),在文本和图像理解方面具有行业领先性能。
下载量 64.29k
发布时间 : 4/1/2025
模型介绍
内容详情
替代品

模型简介

原生多模态AI模型,支持12种语言的文本与图像交互,适用于商业与研究用途的多语言应用、对话助手、视觉推理等场景。

模型特点

混合专家架构(MoE)
采用128位专家配置,实现高效参数利用,平衡计算成本与模型性能
多模态支持
原生支持文本与图像输入输出,具备跨模态理解与生成能力
长上下文处理
支持1M token的上下文窗口,适合处理长文档和复杂推理任务
多语言优化
针对12种语言进行专项优化,覆盖全球主要语种

模型能力

多语言文本生成
图像识别与描述
跨模态推理
代码生成与补全
长文档处理
指令跟随

使用案例

商业应用
多语言客服助手
支持12种语言的实时对话与图像辅助说明
在MMMU基准测试中达到73.4%准确率
文档智能处理
解析含图文混排的长文档(如合同、报告)
支持10M token上下文窗口
研究开发
合成数据生成
通过模型输出改进其他AI模型的训练数据
需遵守协议标注要求
视觉问答系统
构建基于图像理解的智能问答应用
DocVQA基准ANLS分数89.4