C

Chinese LLaVA Baichuan

由 LinkSoul 开发
开源且可商用的中英文双语视觉-语言助手,支持中英文视觉-文本多模态对话
下载量 48
发布时间 : 7/26/2023
模型介绍
内容详情
替代品

模型简介

Chinese-LLaVA是一个开源可商用的中英文双语视觉-语言助手,支持中英文视觉-文本多模态对话。它基于Chinese-Llama-2-7B和Baichuan-7B语言模型开发,能够理解和生成与图像相关的中英文文本。

模型特点

双语支持
同时支持中文和英文的视觉-文本多模态对话
开源商用
采用Apache-2.0许可证,允许商业用途
多模型支持
提供基于Chinese-Llama-2-7B和Baichuan-7B的两个版本
视觉理解
能够理解和描述图像内容,进行基于图像的对话

模型能力

图像内容理解
中英文视觉对话
图像描述生成
多模态推理

使用案例

智能助手
图像问答
用户可以上传图片并询问相关问题,模型会基于图像内容回答
准确理解图像内容并提供相关回答
内容生成
图像描述生成
自动为上传的图片生成文字描述
生成准确、流畅的图像描述文本