B

Bakllava 1

由 SkunkworksAI 开发
BakLLaVA-1是基于Mistral 7B模型,并采用LLaVA 1.5架构增强的多模态模型,在多个基准测试上超越了Llama 2 13B的表现。
下载量 152
发布时间 : 10/12/2023
模型介绍
内容详情
替代品

模型简介

BakLLaVA-1是一个开源的多模态模型,结合了Mistral 7B的语言能力和LLaVA 1.5的视觉理解能力,适用于图文理解和生成任务。

模型特点

强大的多模态能力
结合了Mistral 7B的语言模型和LLaVA 1.5的视觉理解架构,实现了优秀的图文理解和生成能力。
超越Llama 2 13B的性能
在多个基准测试上表现优于Llama 2 13B模型。
开源可用
模型完全开源,采用Apache 2.0许可证,便于研究和开发使用。

模型能力

图文理解
视觉问答
多模态指令跟随
图像描述生成

使用案例

学术研究
视觉问答系统
用于构建能够回答关于图像内容的问答系统
在学术VQA任务上表现良好
内容生成
自动图像描述
为图像生成详细的文字描述
能够生成准确且丰富的图像描述