Y

Yi VL 34B

由 01-ai 开发
Yi-VL-34B 是 Yi 系列的开源多模态模型,能够理解图像内容并进行多轮对话,在 MMMU 和 CMMMU 基准测试中表现优异。
下载量 150
发布时间 : 12/25/2023
模型介绍
内容详情
替代品

模型简介

Yi-VL 是 Yi 大语言模型系列的多模态版本,支持中英文双语,能够理解和分析图像内容,进行视觉问答和多轮对话。

模型特点

双语多模态支持
支持中英文双语对话,包括图像中的文字识别。
高分辨率图像理解
支持 448×448 分辨率的图像理解,能够处理更精细的视觉细节。
多轮图文对话
可以同时接受文本和图像作为输入,进行多轮视觉问答。
强大的图像分析能力
擅长从图像中提取、组织和总结信息。

模型能力

图像内容理解
视觉问答
多轮对话
中英文双语处理
图像文字识别

使用案例

教育
多学科视觉问答
帮助学生理解复杂图表和图像内容
在 MMMU 和 CMMMU 多学科基准测试中表现优异
内容分析
图像内容总结
从图像中提取关键信息并生成描述
能够准确识别和描述图像中的对象和场景