3

360VL 8B

由 qihoo360 开发
360VL是基于LLama3语言模型开发的多模态模型,具备强大的图像理解和双语对话能力。
下载量 22
发布时间 : 5/16/2024
模型介绍
内容详情
替代品

模型简介

360VL是一个开源的大型多模态模型,基于LLama3语言模型开发,设计了全局感知的多分支投影器架构,支持中英文双语对话和图像理解。

模型特点

多轮图文对话
可以同时接收文本和图像输入,并输出文本内容,支持单张图像的多轮视觉问答。
双语文本支持
支持中英文双语对话,包括图像中的文字识别。
强大的图像理解
擅长分析视觉内容,能高效完成图像信息提取、整理和总结等任务。
精细图像分辨率
支持672×672更高分辨率的图像理解。

模型能力

多模态对话
图像理解
视觉问答
双语文本处理

使用案例

智能客服
产品咨询
用户上传产品图片,询问产品信息
模型能准确识别产品并提供相关信息
教育
图像学习辅助
学生上传学习资料图片,询问相关问题
模型能理解图像内容并解答问题