L

Llava Lightning 7B Delta V1 1

由 liuhaotian 开发
LLaVA是基于LLaMA/Vicuna通过GPT生成的多模态指令跟随数据微调的开源聊天机器人
下载量 699
发布时间 : 5/3/2023
模型介绍
内容详情
替代品

模型简介

一个结合视觉与语言理解的多模态大模型,主要用于学术研究领域的多模态交互和指令跟随任务

模型特点

多模态融合
结合视觉与语言理解能力,可处理图像和文本的联合输入
指令跟随
通过GPT生成的指令数据进行微调,能够遵循复杂的多模态指令
轻量级训练
Lightning版本经过优化训练,相比原始版本更高效

模型能力

图像理解
视觉问答
多模态对话
图像描述生成
复杂视觉推理

使用案例

学术研究
多模态交互研究
用于探索视觉与语言模型结合的交互方式
视觉推理基准测试
在ScienceQA等数据集上评估多模态理解能力
与GPT-4协同达到当前最优性能