E

Eagle2 2B

由 nvidia 开发
Eagle2是NVIDIA推出的高性能视觉语言模型家族,专注于通过数据策略和训练方案提升开源视觉语言模型的性能。Eagle2-2B是该系列中的轻量级模型,在保持强劲性能的同时实现卓越效率和速度。
下载量 667
发布时间 : 1/10/2025
模型介绍
内容详情
替代品

模型简介

Eagle2-2B是一个融合视觉和语言能力的多模态模型,能够处理图像、文本和视频输入,执行多种视觉语言任务。

模型特点

高效轻量
在2B参数规模下实现卓越的性能和速度平衡
多模态处理
支持图像、文本和视频输入的综合处理能力
长上下文支持
支持长达16K tokens的上下文长度
高性能基准
在多个视觉语言基准测试中表现优异

模型能力

图像理解与描述
视觉问答
文档理解
图表分析
视频内容理解
多模态推理

使用案例

文档处理
文档问答
从扫描文档或PDF中提取信息并回答问题
在DocVQA测试集上达到88.0分
视觉问答
图像内容问答
回答关于图像内容的复杂问题
在TextVQA验证集上达到79.1分
教育辅助
图表理解
解释和分析各种图表数据
在ChartQA测试集上达到82.0分