D

Debiased Llama 4 Scout 17B 16E Instruct

由 hirundo-io 开发
Llama 4 Scout是Meta推出的原生多模态AI模型,支持多语言文本和图像理解,采用混合专家架构,在文本和图像理解方面具有行业领先性能。
下载量 1,716
发布时间 : 4/14/2025

模型简介

Llama 4 Scout是一个多模态模型,支持多语言文本和图像理解,可用于视觉识别、图像推理、图像字幕生成等任务。

模型特点

多模态支持
支持多语言文本和图像理解,可用于视觉识别、图像推理、图像字幕生成等任务。
高性能
采用混合专家架构,在文本和图像理解方面具有行业领先性能。
多语言支持
支持阿拉伯语、英语、法语、德语、印地语、印尼语、意大利语、葡萄牙语、西班牙语、塔加洛语、泰语和越南语等多种语言。
可定制性
支持模型微调,可根据具体应用场景进行定制。

模型能力

文本生成
图像分析
多语言理解
视觉推理
图像字幕生成

使用案例

视觉识别
图像描述
生成对输入图像的详细描述。
在ChartQA基准测试中达到83.4的relaxed_accuracy。
图像推理
图像相似性分析
分析两张图像的相似性和差异性。
在MMMU基准测试中达到69.4的准确率。
多语言应用
多语言文本生成
支持多种语言的文本生成任务。
在MGSM基准测试中达到90.6的average/em。
AIbase
智启未来,您的人工智能解决方案智库
简体中文