3

360VL 70B

由 qihoo360 开发
360VL是基于LLama3语言模型开发的开源大型多模态模型,具备强大的图像理解和双语文本支持能力。
下载量 103
发布时间 : 5/16/2024
模型介绍
内容详情
替代品

模型简介

360VL是业界首个基于LLama3-70B的开源大型多模态模型,设计了全局感知的多分支投影器架构,支持多轮图文对话和细粒度图像解析。

模型特点

多轮图文对话
支持以文本和图像作为输入并生成文本输出,可实现单图多轮视觉问答。
双语文本支持
支持中英文对话,包括图像中的文字识别。
强大的图像理解
擅长分析视觉内容,能高效完成图像信息提取、整理和总结等任务。
细粒度图像解析
支持672×672更高分辨率的图像理解。

模型能力

视觉问答
图像内容分析
中英文文本生成
图像信息提取
多轮对话

使用案例

视觉问答
图像内容问答
用户上传图像并提问,模型回答关于图像内容的问题。
能够准确识别图像中的对象、场景和文字信息。
图像分析
图像信息提取
从图像中提取关键信息并进行总结。
能够高效完成图像信息的提取和整理。