E

Eagle2 9B

由 KnutJaegersberg 开发
Eagle2是一个高性能的视觉语言模型系列,专注于通过数据策略和训练方法的优化来提升模型性能。Eagle2-9B是该系列中的大型模型,在性能和推理速度之间取得了良好平衡。
下载量 15
发布时间 : 1/23/2025
模型介绍
内容详情
替代品

模型简介

Eagle2-9B是一个视觉语言模型(VLM),能够处理图像和文本输入,生成文本输出。它基于Qwen2.5-7B-Instruct语言模型和Siglip+ConvNext视觉模型构建,支持多语言和多模态任务。

模型特点

多模态能力
能够同时处理图像和文本输入,理解视觉内容并生成相关文本
多语言支持
支持13种语言,包括中文、英语和多种其他主要语言
高性能
在多个基准测试中表现优异,特别是在文档理解、图表问答和信息提取任务上
长上下文支持
支持长达16K的上下文长度,适合处理复杂任务

模型能力

图像理解
文本生成
多模态推理
文档分析
图表理解
视频理解
多语言处理

使用案例

文档处理
文档问答
从文档图像中提取信息并回答问题
在DocVQA测试集上达到92.6分
视觉问答
图表理解
理解和解释图表内容
在ChartQA测试集上达到86.4分
图像问答
回答关于图像内容的问题
在TextVQA验证集上达到83.0分
多模态推理
数学视觉推理
解决需要视觉和数学推理的问题
在MathVista测试集上达到63.8分