A

Aya Vision 32b

由 CohereLabs 开发
Aya Vision 32B是Cohere实验室开发的开放权重32B参数多模态模型,支持23种语言的视觉语言任务。
下载量 387
发布时间 : 3/2/2025
模型介绍
内容详情
替代品

模型简介

针对多种视觉语言任务优化的多语言模型,包括OCR、图像描述、视觉推理、摘要、问答、代码生成等。

模型特点

多语言支持
支持23种语言的视觉语言任务处理
高分辨率图像处理
支持364x364像素分辨率,最多2197个图像标记
长上下文支持
16K上下文长度,适合处理复杂任务
多模态适配器
结合先进文本模型与视觉编码器的创新架构

模型能力

图像描述生成
视觉问答
多语言OCR
视觉推理
文本摘要
代码生成
跨模态理解

使用案例

内容理解
多语言图像描述
为图像生成不同语言的描述文本
支持23种语言的准确描述
文档OCR
从图像中提取多语言文本内容
高精度文字识别
智能交互
视觉问答
回答关于图像内容的复杂问题
支持多语言问答
教育辅助
解释图像中的教育内容
多语言教学支持