L

Liuhaotian Llava V1.5 13b GGUF

由 PsiPi 开发
LLaVA 是一个开源多模态聊天机器人,基于LLaMA/Vicuna架构,通过多模态指令跟随数据微调训练而成。
下载量 1,225
发布时间 : 12/1/2023
模型介绍
内容详情
替代品

模型简介

LLaVA是一个研究性质的大型多模态模型,主要用于计算机视觉、自然语言处理和人工智能领域的研究。

模型特点

多模态能力
能够同时处理图像和文本输入,实现跨模态理解
指令跟随
经过专门训练以遵循多模态指令
开源模型
采用开源许可证,可供研究和开发使用
端到端推理
支持通过llama.cpp进行无需额外依赖的推理

模型能力

图像-文本对话
视觉问答
图像描述生成
多模态指令跟随
跨模态理解

使用案例

学术研究
多模态模型研究
用于研究大型多模态模型的性能和能力边界
人机交互研究
探索基于视觉和语言的多模态人机交互方式
教育应用
视觉辅助学习
帮助学生理解复杂视觉内容