T

Tinyllava 2.0B

由 bczhou 开发
TinyLLaVA是一个小型大规模多模态模型框架,在保持高性能的同时显著减少参数数量。
下载量 562
发布时间 : 2/24/2024
模型介绍
内容详情
替代品

模型简介

TinyLLaVA是一个高效的视觉语言模型,专注于图文生成任务,能够在减少参数量的同时保持出色的多模态理解能力。

模型特点

高效性能
在参数更少的情况下,性能优于更大的7B模型如LLaVA-1.5和Qwen-VL
多模态能力
同时处理视觉和语言信息,实现高质量的图文生成和理解
轻量化设计
通过精心设计的架构,在保持性能的同时显著减少模型参数

模型能力

视觉问答
图像描述生成
多模态对话
图文理解
跨模态推理

使用案例

智能助手
图像内容问答
用户上传图片后,模型可以回答关于图片内容的各类问题
在LLaVA-Bench-Wild上达到75.8分
教育
视觉学习辅助
帮助学生理解复杂图表和视觉内容
在ScienceQA-image上达到69.1分