L

Llava V1.5 13B GPTQ

由 TheBloke 开发
Llava v1.5 13B是由Haotian Liu开发的多模态模型,结合了视觉和语言能力,能够理解和生成基于图像和文本的内容。
下载量 131
发布时间 : 10/15/2023

模型简介

Llava v1.5 13B是一个基于Llama架构的多模态模型,支持图像和文本的联合处理,适用于视觉问答、图像描述生成等任务。

模型特点

多模态能力
结合视觉和语言处理能力,能够理解和生成基于图像和文本的内容。
高效量化
提供多种GPTQ量化版本,适应不同硬件需求,降低推理成本。
高性能
基于Llama架构,具有强大的推理和生成能力。

模型能力

图像理解
文本生成
视觉问答
图像描述生成

使用案例

教育
视觉问答
根据图像内容回答用户提出的问题。
提供准确且详细的答案。
内容生成
图像描述生成
为图像生成详细的文字描述。
生成自然且准确的描述文本。
AIbase
智启未来,您的人工智能解决方案智库
简体中文