T

Tiny Llava V1 Hf

由 bczhou 开发
TinyLLaVA是一个小型大规模多模态模型框架,专注于视觉语言任务,参数规模小但性能优异。
下载量 2,372
发布时间 : 1/11/2024
模型介绍
内容详情
替代品

模型简介

TinyLLaVA是一个高效的多模态模型,能够处理图像到文本的生成任务,支持中英文,在多个基准测试上表现优异。

模型特点

高性能小规模模型
3.1B参数的TinyLLaVA在性能上超越7B参数的LLaVA-1.5和Qwen-VL等模型
多模态能力
支持图像理解和文本生成,能够处理复杂的视觉语言任务
高效推理
小参数规模使得模型推理速度更快,资源消耗更低

模型能力

图像理解
视觉问答
图像描述生成
多模态推理

使用案例

视觉问答
图像内容问答
回答关于图像内容的各类问题
在VQA-v2数据集上达到79.9%准确率
图像描述
自动图像标注
为图像生成详细描述文本
在LLaVA-Bench-Wild上达到75.8分