E

Eagle2 1B

由 nvidia 开发
鹰隼2号是一个高性能视觉语言模型家族,专注于数据策略和训练方案的透明性,旨在推动开源社区开发具有竞争力的视觉语言模型。
下载量 1,791
发布时间 : 1/10/2025

模型简介

鹰隼2号-1B是一个紧凑高效的视觉语言模型,专为需要快速推理和最小计算资源的场景设计,同时保持核心性能。

模型特点

高效性能
在紧凑的1B参数规模下,仍能保持与更大模型竞争的性能。
多语言支持
支持多种语言的视觉语言理解任务。
长上下文处理
支持长达16K的上下文长度,适合处理复杂任务。
透明数据策略
强调数据策略的透明性,便于复现和创新。

模型能力

视觉语言理解
图像文本生成
多模态推理
文档理解
图表分析

使用案例

文档处理
DocVQA
文档视觉问答
测试集准确率81.8
图表分析
ChartQA
图表问答
测试集准确率77.0
视觉问答
TextVQA
文本视觉问答
验证集准确率76.6
AIbase
智启未来,您的人工智能解决方案智库
简体中文