E

Eurovlm 9B Preview

由 utter-project 开发
EuroVLM-9B-Preview是基于EuroLLM-9B长上下文版本的多模态视觉语言模型,支持多种语言和视觉任务,目前为预览版本。
下载量 156
发布时间 : 6/9/2025

模型简介

EuroVLM-9B-Preview是一个结合文本和视觉处理能力的多模态模型,专注于欧洲语言支持,适用于图像描述生成、视觉问答等任务。

模型特点

多语言支持
支持超过30种欧洲及其他语言,涵盖主要欧洲语言及部分亚洲语言。
多模态处理
能够同时处理文本和图像输入,执行跨模态任务。
长上下文支持
扩展上下文大小,支持多达32K个标记的长文本处理。
高效推理
采用分组查询注意力(GQA)和SwiGLU激活函数,优化推理效率。

模型能力

多语言图像描述生成
视觉问答
视觉指令执行
多模态翻译
文档理解

使用案例

教育
多语言学习辅助
帮助学生通过图像理解不同语言的描述,辅助语言学习。
提供多语言图像描述,增强语言学习体验。
内容创作
多语言内容生成
根据图像生成多语言的描述或故事,用于内容创作。
快速生成多语言内容,提高创作效率。
客户服务
多语言视觉支持
回答客户关于产品图像的跨语言问题。
提供多语言视觉问答,改善客户体验。
AIbase
智启未来,您的人工智能解决方案智库
简体中文