L

Llava Llama 2 13b Chat Lightning Preview

由 liuhaotian 开发
LLaVA是一个开源多模态聊天机器人模型,基于Transformer架构,通过在GPT生成的多模态指令跟随数据上微调LLaMA/Vicuna而得。
下载量 2,122
发布时间 : 7/19/2023

模型简介

LLaVA主要用于多模态大模型和聊天机器人的研究,支持图像和文本的多模态处理能力,为计算机视觉、自然语言处理等领域的研究提供支持。

模型特点

多模态能力
基于GPT生成的多模态指令跟随数据进行微调,具备处理图像和文本的多模态能力。
Transformer架构
采用自回归语言模型,基于Transformer架构构建。
开源研究支持
为计算机视觉、自然语言处理等领域的研究人员和爱好者提供开源支持。

模型能力

图像理解
文本生成
视觉推理
多模态对话

使用案例

学术研究
多模态模型研究
用于研究图像和文本的多模态交互能力。
视觉推理任务
在ScienceQA数据集上评估,与GPT-4协同达到新的最优水平。
在ScienceQA数据集上达到最优性能
应用开发
智能聊天机器人
开发具备图像理解和对话能力的聊天机器人。
AIbase
智启未来,您的人工智能解决方案智库
简体中文